Utilizando métodos estatísticos para modelar o ajuste fino de máquinas e sistemas moleculares.

https://www.sciencedirect.com/science/article/pii/S0022519320302071

https://doi.org/10.1016/j.jtbi.2020.110352 Obtenha direitos e conteúdo.

Sob licença Creative Commons

Acesso aberto

Referido por

Grandes espaços amostrais não implicam que os sistemas biológicos sejam 'ajustados com precisão'.

Revista de Biologia Teórica, Volume 507, 21 de dezembro de 2020, Páginas 110457

Joseph Lachance, Corinne N. Simonti, Joshua S. Weitz

Ver PDF

Isenção de responsabilidade

Revista de Biologia Teórica, Volume 506, 7 de dezembro de 2020, Páginas 110456

Denise Kirschner, Mark Chaplain, Akira Sasaki

Ver PDF

Destaques

•
Os métodos estatísticos são apropriados para modelar o ajuste fino.
•
O ajuste fino é detectado em proteínas funcionais, redes celulares, etc.
•
As constantes e as condições iniciais da natureza são ajustadas deliberadamente.
•
Análise estatística do modelo de ajuste fino em algumas categorias de projeto.
•
O ajuste fino e o projeto merecem atenção na comunidade científica.

Resumo

O conceito de ajuste fino tem recebido muita atenção na física, e afirma que as constantes fundamentais da física são ajustadas com precisão para uma química rica e para a permissividade da vida. Ainda não foi aplicado de forma abrangente à biologia molecular. No entanto, neste artigo, argumentamos que os sistemas biológicos apresentam ajuste fino em diferentes níveis, como proteínas funcionais, máquinas bioquímicas complexas em células vivas e redes celulares. Este artigo descreve o ajuste fino molecular, como ele pode ser usado em biologia e como desafia o pensamento darwiniano convencional. Também discutimos os métodos estatísticos que fundamentam o ajuste fino e apresentamos uma estrutura para tal análise.

Resumo gráfico

Palavras-chave

Bayesiano

Afinação

Complexidade

Projeto

Seleção de modelo

Especificidade

1. Introdução

O ajuste fino tem recebido muita atenção na física , e muitos estudos foram realizados desde que Brandon Carter apresentou seus primeiros resultados na conferência em homenagem ao 500º aniversário de Copérnico ( Carter, 1974 ). Luke Barnes publicou um bom artigo de revisão sobre o ajuste fino do universo ( Barnes, 2012 ), e Lewis e Barnes escreveram um livro atualizado (2016). Isso naturalmente levanta a questão de se é apropriado introduzir e abordar o ajuste fino também na biologia.

O termo ajuste fino é usado para caracterizar a sensibilidade de funções ou propriedades aos valores de certos parâmetros (cf. Friederich, 2018 ). Embora os dispositivos tecnológicos sejam produtos finamente ajustados pelos engenheiros e fabricantes que os projetaram e construíram, neste artigo consideramos suficiente apenas a sensibilidade em relação aos valores de certos parâmetros ou condições iniciais. Definimos ajuste fino como um objeto com duas propriedades: deve a) ser improvável que tenha ocorrido por acaso, sob a distribuição de probabilidade relevante (ou seja, complexo), e b) estar em conformidade com uma especificação independente ou separada (ou seja, específico).

A noção de design também é amplamente utilizada tanto na ciência histórica quanto na contemporânea ( Thorvaldsen e Øhrstrøm, 2013 ). O conceito precisará de uma descrição para seu uso em nosso contexto. Um design é uma especificação ou plano para a construção de um objeto ou sistema, ou o resultado dessa especificação ou plano na forma de um produto. O próprio termo design vem da palavra latina medieval “designare” (que significa “marcar, apontar, escolher”); de “de” (para fora) e “signum” (marca identificadora, sinal). Portanto, um aviso público que anuncia algo ou fornece informações. O design geralmente precisa satisfazer certos objetivos e restrições. Espera-se também que ele interaja com um determinado ambiente e, assim, seja realizado no mundo físico. Os seres humanos têm uma poderosa compreensão intuitiva do design que precede a ciência moderna. Nossas intuições comuns invariavelmente começam com o reconhecimento de um padrão como uma marca de design. O problema é que nossas intuições sobre design têm sido pouco refinadas e pré-teóricas. Por essa razão, é pertinente questionarmos se é possível inverter essa disparidade e fundamentar essas intuições vagas e pré-teóricas em uma base científica sólida.

O ajuste fino e o projeto são entidades relacionadas. O ajuste fino é um método ascendente (bottom-up), enquanto o projeto se assemelha mais a uma abordagem descendente (top-down). Portanto, neste artigo, focamos no tema do ajuste fino e abordamos as seguintes questões: É possível reconhecer o ajuste fino em sistemas biológicos nos níveis de proteínas funcionais, grupos de proteínas e redes celulares? O ajuste fino em biologia molecular pode ser formulado utilizando métodos estatísticos de última geração , ou os argumentos são apenas subjetivos?

2. Métodos estatísticos

O mundo real é complexo, e os modelos científicos precisam lidar com ele simplificando as coisas, aproximando-as e focando em alguns aspectos de uma investigação estrutural ou numérica, ou seja, nos aspectos que nos interessam. Os modelos matemáticos têm se mostrado inestimáveis em diversas áreas da ciência e da engenharia ( Quarteroni, 2009 ). Em biologia, eles fornecem abstrações estruturadas que permitem o estudo do projeto, da organização e da evolução de sistemas biológicos. Sempre que usamos a matemática para estudar algum fenômeno observacional, devemos essencialmente começar construindo um modelo determinístico ou estocástico para representar o fenômeno, que são os dois principais tipos de estrutura matemática usados na ciência.

Para um grande número de situações, o modelo matemático determinístico será suficiente. No entanto, existem também muitos fenômenos que requerem um modelo matemático diferente para sua investigação, os modelos estocásticos (frequentemente chamados de probabilísticos). Um modelo é estocástico quando é capaz de representar diferentes escolhas e fornecer informações sobre a probabilidade dessas escolhas. Ele difere dos modelos determinísticos , nos quais as condições determinam o resultado final e nenhuma escolha é representada. A aleatoriedade de um modelo estocástico é epistêmica ou ontológica. A aleatoriedade epistêmica representa nossa falta de conhecimento dentro de uma estrutura determinística, enquanto a aleatoriedade ontológica corresponde a uma incerteza mais fundamental. Mesmo que todas as condições iniciais de um experimento fossem conhecidas, um modelo com aleatoriedade ontológica ainda forneceria apenas probabilidades para uma gama de possíveis resultados observáveis ( Coffman, 2014 ).

Para resumir todas as maneiras possíveis de escolher o resultado de um modelo estocástico, com diferentes probabilidades, utiliza-se uma distribuição. Essa distribuição (ou verossimilhança) geralmente envolve alguns parâmetros desconhecidos (como a média ou o desvio padrão). Cada configuração possível de parâmetros dá origem a um modelo estocástico diferente. O conjunto de todos esses modelos estocásticos é geralmente denominado modelo estatístico . O objetivo da inferência estatística não é prever a aleatoriedade de um modelo estatístico (seja epistêmico ou ontológico). O melhor que podemos fazer é inferir (ou estimar/testar) os valores dos parâmetros desconhecidos e, com base nessa estimativa, as probabilidades de um determinado evento.

A

que representa um conjunto específico de resultados possíveis.

Na modelagem estatística, existem duas tradições principais para isso: as escolas Frequentista e Bayesiana (ver Figura 1 ) , que diferem na forma como tratam os parâmetros. Os Frequentistas geralmente consideram os parâmetros fixos, mas desconhecidos. As probabilidades são interpretadas como a fração de vezes que um evento ocorre, caso seja possível repetir um experimento um grande número de vezes sob circunstâncias idênticas. Os Bayesianos, por sua vez, atribuem distribuições de probabilidade aos parâmetros, de acordo com uma distribuição a priori, que representa crenças subjetivas ou conhecimento prévio. Em qualquer caso, há uma continuidade modelada entre passado e presente na estatística Bayesiana , uma vez que novas observações são usadas para atualizar crenças subjetivas ou conhecimento prévio em uma distribuição a posteriori , de acordo com a Regra de Bayes. Consequentemente, a distribuição a posteriori também leva em consideração os resultados observados do experimento. Um Bayesiano fala da probabilidade de um parâmetro ou de uma teoria.

θ

Enquanto um frequentista convicto só pode falar da consistência das evidências com o parâmetro ou a teoria, por meio de testes de hipóteses ou intervalos de confiança. Embora haja uma diferença filosófica fundamental entre as abordagens frequentista e bayesiana , muitos estatísticos utilizam ambos os modelos, dependendo do tipo de problema que estudam.

A estatística não paramétrica é uma forma de eliminar as suposições sobre a distribuição dos resultados de um modelo estocástico. O termo, na verdade, é um equívoco, visto que infinitos (ou um número muito grande de) parâmetros são usados nesses tipos de modelos para representar a maior incerteza sobre a distribuição dos dados, de modo que os dados, em grande medida, "falem por si mesmos". Embora a estatística não paramétrica tenha sido desenvolvida inicialmente em um contexto frequentista, ela também é consistente com uma abordagem bayesiana.

A estatística bayesiana foi pioneira graças ao trabalho de Thomas Bayes (que introduziu a Regra de Bayes) e Pierre-Simon Laplace. Foi a visão predominante da estatística ao longo do século XIX. Posteriormente, por meio do trabalho de Ronald Fisher, Jerzy Neyman, Egon Pearson e outros, a estatística frequentista passou a dominar durante a maior parte do século XX. Mais recentemente, a estatística bayesiana tem experimentado um crescimento, em grande parte devido ao desenvolvimento de métodos de simulação eficazes, como o método de Monte Carlo via Cadeias de Markov (MCMC) e a Computação Bayesiana Aproximada (ABC), que permitem o estudo de modelos complexos dentro de uma estrutura bayesiana ( Berger, 1985 ; Lehmann e Casella, 1998 ; Gilks et al., 1996 ).

Ambas as escolas possuem históricos impressionantes de aplicações bem-sucedidas. A estatística frequentista clássica é particularmente adequada para experimentos repetíveis e planejados. Seu histórico é mais extenso porque inúmeros resultados, adaptados a esses métodos, foram obtidos com calculadoras mecânicas e tabelas impressas de funções de distribuição estatística específicas. Os métodos bayesianos têm se mostrado altamente eficazes na análise de informações naturalmente amostradas sequencialmente (como radar e sonar). Eles também têm sido aplicados em áreas tão diversas quanto filosofia, religião e ciências sociais, por exemplo, para analisar processos complexos de tomada de decisão , nos quais debates e outros tipos de interações sociais são levados em consideração ( Korb, 2003 ; Colin e Urbach, 2006 ; Chen et al., 2010 ; Chandler e Harrison, 2012 ).

Uma tarefa comum na comprovação do ajuste fino é demonstrar que um determinado evento

A

é muito improvável que ocorra por acaso, ou seja, mostrar que a probabilidade

P (A)

A prevalência desse evento é pequena. Normalmente,

A

é uma classificação ; que uma observação existente é refinada. Mas também é possível que

A

corresponde a uma observação futura sendo refinada, uma previsão . Independentemente de

A

Representa uma classificação ou uma previsão; um modelo estocástico (II ou IV na Fig. 1 ) pode ser usado para determinar a probabilidade.

(1)

P (A | θ) = \sum_{x \in A} P (x | θ)

para cada valor de parâmetro

θ

, somando as probabilidades de todos os resultados incluídos em

A

. Uma vez que o parâmetro

θ

Geralmente é desconhecido, sendo necessário estimá-lo a partir de dados.

Com uma abordagem frequentista, uma estimativa pontual.

\hat{θ} = \hat{θ} (d a t a)

é utilizado, e isso leva a uma estimativa

(2)

\hat{P} (A) = P (A | \hat{θ})

da prevalência. Para quantificar a incerteza de (2) , um frequentista poderia traduzir uma região de confiança de valores possíveis de

θ

em um intervalo de confiança de valores possíveis de

P (A | θ)

Por outro lado, um bayesiano considera o parâmetro como aleatório e calcula uma distribuição posterior do parâmetro, combinando a distribuição a priori e a verossimilhança de acordo com a Regra de Bayes, ou seja,

P (θ | d a t a) = P (d a t a | θ) P (θ) / P (d a t a)

Isso leva a uma estimativa .

(3)

\hat{P} (A) = \sum_{θ} P (A | θ) P (θ | d a t a)

da prevalência. Para avaliar a incerteza de (3) , um Bayesiano pode traduzir a distribuição posterior do parâmetro.

θ

em uma distribuição posterior da prevalência

P (A | θ)

Para modelos complexos, independentemente de se utilizar uma abordagem frequentista ou bayesiana, é comum que

P (A | θ)

é desconhecido para todos os valores

θ

do parâmetro. Nesse caso, normalmente se calcula uma estimativa.

\hat{P} (A | θ)

P (A | θ)

e então o insere em (2) ou (3).

A equação (1) é, na verdade, consistente também com um modelo determinístico (I ou III na Fig. 1 ), com

P (A | θ)

igual a 1 ou 0, dependendo se o evento observado

A

é consistente com a teoria

θ

ou não. Em particular, existe uma forma de raciocínio denominada raciocínio abdutivo (cf. III da Fig. 1 ) ou inferência para a melhor explicação ( Walton, 2001 ). Uma explicação é uma história.

θ

sobre um evento

A

que ocorreu, e esse tipo de inferência explicativa desempenha um papel central, tanto na vida cotidiana quanto na ciência contemporânea. A abdução foi introduzida por Charles Peirce como uma forma de inferência lógica que começa com um conjunto de observações.

A

e busca encontrar a explicação mais simples e provável para as observações. Peirce considerou isso um tópico de lógica, mas não como lógica formal ou matemática . Ciência da computação, sistemas especialistas e pesquisa em inteligência artificial frequentemente empregam abdução. Em nossa estrutura, ela pode ser vista como um procedimento de escolha da hipótese ou teoria.

\hat{θ}

que melhor explica os dados disponíveis

A

, com base em algum princípio orientador. Esse processo produz uma conclusão plausível, mas não a verifica positivamente. Ernan McMullin (1992) chega a se referir à abdução como “a inferência que faz a ciência”.

Embora a versão original da abdução não fosse estocástica, ainda se considera um resultado plausível como relativamente provável de ser verdadeiro, em comparação com hipóteses concorrentes , dado o conhecimento prévio. Na Figura 1 III, isso significaria que todas as hipóteses, teorias, explicações ou valores de parâmetros prováveis geram resultados deterministicamente dentro do evento observado.

A

, ou seja

P (A | θ) = 1

Nos últimos anos, vários estatísticos têm se interessado por uma versão mais matemática da abdução, de natureza probabilística, com a inferência Bayesiana como um caso especial ( Douven e Wenmackers, 2017 ). Alguns autores argumentam que a abdução não só é compatível com o Bayesianismo , como também o complementa de forma muito necessária ( Douven, 2017 ). Isso leva a uma visão probabilística da abdução, na qual eventos passados são analisados por meio de um modelo Bayesiano estocástico (II), com uma distribuição sendo atribuída a todas as teorias ou explicações possíveis. O analista deve então atribuir uma probabilidade a priori a todas as explicações possíveis, usando algum critério como simplicidade ou abrangência. A verossimilhança, por outro lado, descreve a distribuição dos resultados para cada explicação possível e, assim, quantifica se uma teoria explica bem ou não o evento observado. Em princípio, também podemos enquadrar a abdução em uma estrutura frequentista (IV), na qual todas as explicações são tratadas como fixas. Pode-se argumentar, no entanto, que uma abordagem frequentista é menos atraente, visto que o evento passado ocorreu apenas uma vez, enquanto a verossimilhança, dentro de uma estrutura frequentista, envolve probabilidades que requerem uma suposição hipotética de como o resultado se apresentaria se o experimento fosse repetido (um contrafactual). Com uma abordagem bayesiana, há mais liberdade na modelagem da distribuição de contrafactuais e, portanto, da verossimilhança. Quando um evento passado é observado antes do início do estudo, os estatísticos se referem a ele como um estudo observacional . É sabido que, às vezes (mas nem sempre), a verossimilhança de tal estudo precisa ser ajustada para levar em conta a forma como o evento passado foi observado, também dentro de uma abordagem bayesiana ( Rosenbaum, 2010 ). Um experimento planejado, por outro lado, é elaborado antes que os resultados ocorram, e então a verossimilhança simplesmente descreve a aleatoriedade envolvida no experimento.

3. Alguns antecedentes históricos do ajuste fino

O bioquímico Lawrence Henderson (1878–1942), da Universidade de Harvard, escreveu um dos primeiros livros a explorar os conceitos de ajuste fino no universo ( Henderson, 1913 ). Ele discute a importância da água e do meio ambiente para os seres vivos, argumentando que a vida depende inteiramente das condições ambientais muito específicas da Terra, particularmente no que diz respeito à abundância e às propriedades da água.

Na década de 1970, o astrofísico Brandon Carter trabalhou em uma espécie de análise contrafactual da cosmologia, questionando: suponha que as leis da física fossem um pouco diferentes do que são na realidade, quais seriam as consequências? ( Davies, 2006 ). Carter foi o primeiro a nomear e empregar o termo Princípio Antrópico em sua importante contribuição para a conferência de 1973 na Polônia, em homenagem ao 500º aniversário de Copérnico. Para sua surpresa, descobriu-se que muitos dos parâmetros necessários para a existência de vida em nosso universo devem se enquadrar em margens muito estreitas, ou o universo não existiria ou não seria capaz de sustentar a vida. Em sua palestra, Carter derivou o Princípio Antrópico (PA) em reação ao Princípio Copernicano, que afirma que os humanos não ocupam uma posição privilegiada no universo. Como Carter disse no aniversário de Copérnico:

“Embora nossa situação não seja necessariamente central, ela é inevitavelmente privilegiada em certa medida” ( Carter, 1974 ).

As chances de o universo ser propício à vida são tão infinitesimais que são incompreensíveis e incalculáveis.

Dito isto, cabe também observar que existe uma crítica ao Princípio Antrópico, conhecida como Princípio Antrópico Fraco (PAF). O PAF afirma que somente em um universo que sustenta a vida haverá seres vivos capazes de observá-la. Na terminologia da Seção 2 , dizemos que o ato de descobrir que vivemos em um universo que permite a vida faz parte de um estudo observacional e, portanto, precisamos modificar a probabilidade de acordo. Embora haja alguma verdade nessa objeção ao Princípio Antrópico, ela também é problemática. De fato, se aplicarmos o princípio do PAF consistentemente a outras situações em que descobrimos padrões regulares ou inesperados, nunca deveríamos ser capazes de inferir ajuste fino ou design como explicação. O filósofo John Leslie ilustra o caso de uma pessoa que sobrevive inesperadamente a um ataque de fuzilamento. Ele pode então inferir que todos os disparos erraram o alvo deliberadamente (por causa de alguém que planejou isso) ou não? ( Leslie, 1989 ).

É difícil dar uma resposta definitiva sobre o número de parâmetros de ajuste fino. Com base nos itens discutidos no livro clássico de Barrow e Tiplers (1988), existem cerca de 100, e o astrônomo real Martin Rees lista seis constantes adimensionais que proporcionam um ajuste fino geral ao universo ( Rees, 1999 ). O universo finamente ajustado é como um painel que controla os parâmetros do universo com cerca de 100 botões que podem ser ajustados para determinados valores. No contexto da Seção 2 , o parâmetro

θ

é um vetor com 100 componentes (os botões), o espaço amostral

Ω

é o conjunto de todos os universos possíveis (incluindo a ausência total de universo), enquanto

A

é o conjunto de universos possíveis, ou o conjunto daqueles universos possíveis que também são habitáveis. Se você girar qualquer botão um pouco para a direita ou para a esquerda, o resultado será um universo inóspito à vida ou nenhum universo. Se o Big Bang tivesse sido um pouco mais forte ou mais fraco, a matéria não teria se condensado e a vida nunca teria existido. As probabilidades contra o desenvolvimento do nosso universo eram "enormes" – e, no entanto, aqui estamos, um ponto que se equipara a implicações religiosas, como expressou Brian Schmidt, da Universidade Nacional da Austrália:

Como uma fuga de Bach, o Universo possui uma bela elegância, governado por leis cuja precisão matemática é dosada ao metrônomo do tempo. Essas equações da física são finamente equilibradas, com as constantes da natureza que as sustentam ajustadas a valores que permitem que nosso notável Universo exista de uma forma que nós, a humanidade, possamos estudar. Uma ligeira mudança nessas constantes e, num passe de mágica, num sopro de experimentação mental, temos um cosmos onde os átomos deixam de existir ou onde os planetas são incapazes de se formar. Parece que somos verdadeiramente afortunados por fazer parte do Nosso Universo ( Lewis e Barnes, 2016 , p. xi).

O que Brian Schmidt chama de "experimento mental" é frequentemente denominado "multiuniversos", ou seja, uma enorme quantidade de universos, cada um ligeiramente diferente do outro. Há uma diferença sutil entre o conjunto de universos possíveis .

Ω

A teoria do multiverso, mencionada anteriormente (da qual presume-se a existência de uma), e a teoria do multiverso, que defende que alguns ou todos esses universos existem em paralelo. Essa hipótese do multiverso não possui qualquer respaldo empírico e pode ser considerada uma ideia bastante especulativa.

Um argumento probabilístico pressupõe conhecimento adequado dos limites do espaço de possibilidades. Pressupõe que o conhecimento atual forneça uma descrição estatística precisa e imparcial, ou meios de determinar, o que pode ou não acontecer por acaso. Como argumentaram Colyvan et al., 2005 , e Dembski, 2014 , o argumento do ajuste fino para o nosso universo não é um argumento estritamente estatístico, uma vez que envolve características que precisam estar presentes antes que se possa dizer que o universo existe e opera. E não há como atribuir uma distribuição de probabilidade como referência associada ao universo nesse estágio inicial. As probabilidades para a formação inicial do universo são, por sua natureza, independentes dos processos conhecidos que operam em nosso universo atual, ou seja, “probabilidades mentais”.

William Dembski, que pertence principalmente à escola frequentista em estatística , considera o argumento do ajuste fino como sugestivo, indicando um projeto subjacente. Podemos descrever essa inferência como raciocínio abdutivo ou inferência para a melhor explicação. Esse raciocínio leva a uma conclusão plausível que é relativamente provável de ser verdadeira, em comparação com hipóteses concorrentes , dado o nosso conhecimento prévio. No caso do ajuste fino do nosso cosmos, o projeto é considerado uma explicação melhor do que um conjunto de multiuniversos que carece de qualquer evidência empírica ou histórica. Se a existência/habitabilidade de um universo decorre deterministicamente das condições iniciais ajustadas com precisão, essa abordagem frequentista leva a um modelo para o universo físico que é essencialmente determinístico (cf. III da Fig. 1 ). Uma abordagem bayesiana , por outro lado, corresponde a um modelo com resultados determinísticos para cada parâmetro, mas a aleatoriedade ainda entra na escolha dos parâmetros (cf. I da Fig. 1 ).

Como observado na Seção 2 , um tipo mais geral de raciocínio abdutivo está intimamente relacionado a um modelo estocástico Bayesiano. Aplicando métodos da estatística Bayesiana , diversos autores formularam uma conclusão mais robusta do que a de Dembski. Robin Collins (2012) , Richard Swinburne (2012) , Palonen (2008) e Palonen (2017) apresentam a descrição mais completa e atualizada do argumento, concluindo que a possível existência de um multiverso não diminui significativamente a força do argumento do ajuste fino para a existência de um design. O principal argumento de suas análises Bayesianas é que, mesmo sob a hipótese de um multiverso, devemos usar a proposição "este universo é finamente ajustado" como dado, mesmo que não conheçamos o "verdadeiro estado" do nosso universo. Uma vez que as hipóteses de multiverso não predizem o ajuste fino para este universo em particular melhor do que a hipótese de um único universo, conclui-se que as hipóteses de multiverso não são explicações plausíveis para o ajuste fino. Portanto, nossos dados sobre o ajuste fino cósmico não oferecem suporte às hipóteses do multiverso. Para a física em geral, independentemente da existência ou não de um multiverso, a consequência racional da discussão acima é que devemos preferir as teorias que melhor preveem (para este ou qualquer universo) os fenômenos que observamos em nosso universo.

Uma das descobertas surpreendentes da biologia moderna foi que a célula opera de maneira semelhante à tecnologia moderna, enquanto a informação biológica é organizada de forma similar a um texto simples. Palavras e termos como “código de sequência”, “informação” e “máquina” provaram ser muito úteis para descrever e compreender a biologia molecular ( Wills, 2016 ). Os blocos de construção básicos da vida são as proteínas, longas moléculas em forma de cadeia compostas por diversas combinações de 20 aminoácidos diferentes . Máquinas bioquímicas complexas são geralmente compostas por muitas proteínas, cada uma dobrada e configurada em uma estrutura tridimensional única, dependente da sequência exata dos aminoácidos dentro da cadeia. As proteínas empregam uma grande variedade de dobras para desempenhar sua função biológica , e cada proteína possui uma forma altamente específica com algumas pequenas variações.

Na década de 1990, uma enorme quantidade de publicações e anais de congressos começou a surgir, com o livro "Evidence of Purpose" (Evidência de Propósito), editado por Sir John Marks Templeton com artigos de 10 cientistas renomados, sendo um dos primeiros ( Templeton, 1994 ). Michael Behe e outros apresentaram ideias de design em biologia molecular e publicaram evidências de "máquinas bioquímicas irredutivelmente complexas" em células vivas. Em sua argumentação, algumas partes dos sistemas complexos encontrados na biologia são extremamente importantes e afetam a função geral de seu mecanismo. O ajuste fino pode ser delineado através das partes vitais e interativas dos organismos vivos. Em "Darwin's Black Box" (Caixa Preta de Darwin) ( Behe, 1996 ), Behe exemplificou sistemas, como o flagelo que as bactérias usam para nadar e a cascata de coagulação sanguínea, que ele chamou de irredutivelmente complexos, configurados como um notável trabalho em equipe de várias (frequentemente dezenas ou mais) proteínas interagindo. Seria possível, em um modelo incremental, que tal sistema pudesse evoluir para algo que ainda não existe? Muitos sistemas biológicos não parecem ter um predecessor funcional viável a partir do qual pudessem ter evoluído gradualmente, e a ocorrência de um salto único por acaso é extremamente pequena. Parafraseando o primeiro homem na Lua: "Não se trata de pequenos passos de proteínas, nem de um salto gigantesco para a biologia."

Os seres vivos exibem estruturas e funções que podem ser melhor compreendidas como engenharia em nanoescala. Em 1998, Bruce Alberts, presidente da Academia Nacional de Ciências, publicou um artigo importante que preparou a próxima geração de biólogos moleculares: A Célula como uma Coleção de Máquinas de Proteínas ( Alberts, 1998 ).

4. Principais resultados e discussão

Nesta seção, apresentaremos e discutiremos algumas observações relevantes da biologia experimental. Isso será feito à luz da teoria dos modelos estocásticos, descrita na Seção 2. Mais especificamente, identificaremos eventos.

A

cuja probabilidade

P (A)

é muito baixo em modelos estocásticos naturalistas, e argumenta-se que estes representam exemplos extremos de ajuste fino.

4.1 . Proteínas funcionais

Sabe-se que as proteínas naturais se dobram apenas em um número limitado de conformações. A capacidade de design de uma estrutura é definida como o número de sequências que se dobram nessa estrutura ( Zhang et al., 2014 ). Algumas dessas conformações ocorrem frequentemente e são geralmente consideradas altamente projetáveis, enquanto outras são raramente observadas e menos projetáveis. Li et al. (1996) introduziram o conceito de capacidade de design de proteínas. Um aspecto interessante do estudo deles foi que as estruturas diferiam bastante em termos de capacidade de design, e as estruturas altamente projetáveis representavam apenas uma pequena fração do total.

Um objetivo importante é obter uma estimativa da prevalência geral de sequências que adotam dobras proteicas funcionais , ou seja, a estrutura dobrada correta, com a dinâmica adequada e um sítio ativo preciso para sua função específica. Douglas Axe trabalhou nessa questão no Centro do Conselho de Pesquisa Médica em Cambridge. Os experimentos que ele realizou mostraram uma prevalência entre 1 em 10⁵⁰ e 1 em 10⁷⁴ de sequências proteicas que formam uma dobra funcional de 150 aminoácidos ( Axe, 2004 ). Portanto, proteínas funcionais requerem sequências altamente organizadas, como ilustrado na Figura 2. Embora as proteínas tolerem uma gama de aminoácidos possíveis em algumas posições da sequência, um processo aleatório que produza cadeias de aminoácidos desse comprimento resultaria em uma proteína funcional apenas em cerca de uma em cada 10⁵⁰ a 10⁷⁴ tentativas devido à variação genética . Esse resultado empírico é bastante análogo à inferência da física finamente ajustada. Ou seja, podemos considerar o espaço

Ω

de todas as proteínas possíveis como resultados de um modelo estocástico, onde cada resultado é uma sequência de letras (aminoácidos). A prevalência

P (A_{p})

é a probabilidade do evento

A_{p}

que uma sequência de aminoácidos escolhida aleatoriamente leva a uma proteína funcional (ou, de forma mais geral, a uma proteína com alguns padrões característicos), enquanto

θ_{p}

Envolve todas as constantes bioquímicas relevantes para a formação de proteínas.

Os resultados experimentais relatados por Douglas Axe são estudos empíricos de uma única proteína que tipicamente estaria envolvida como uma das partes constituintes de um sistema Behe coerente (ver Seção 4.2 ). O espaço de sequências de proteínas pode parecer um deserto ilimitado de sequências mal ajustadas com apenas alguns oásis de sequências funcionais, como descrito por Axe. Outro estudo examina a probabilidade de encontrar proteínas de ligação a ATP a partir de uma amostra aleatória do espaço de sequências, independentemente do dobramento ( Ferrada e Wagner, 2010 ). Os autores estimaram uma probabilidade de 1 em 10¹¹ de encontrar uma proteína de ligação a ATP, sugerindo uma probabilidade maior do que a encontrada por Axe. Recentemente, Kozulic e Leisola (2015) realizaram análises cuidadosas desses resultados e concluíram que, mesmo com condições muito conservadoras, a probabilidade de encontrar atividade de ligação a ATP que funcionaria em uma célula seria menor que 1 em 10³² . Estimativas como essas dependem de vários fatores (os componentes do vetor de parâmetros) .

θ_{p}

), incluindo o comprimento das proteínas consideradas. Eles indicam que a probabilidade de encontrar uma proteína funcional no espaço de sequências pode variar amplamente, mas geralmente permanece muito além do alcance dos processos darwinianos ( Axe, 2010a ). Alguns autores chegaram a sugerir que o repertório original de aminoácidos consistia em apenas quatro ou cinco aminoácidos, a fim de reduzir o gigantesco espaço de sequências e “eliminar o jogo dos grandes números” ( Dryden et al., 2008 ). No entanto, isso exigiria outro tipo de código genético, algo considerado altamente especulativo. Portanto, para uma proteína funcional típica, podemos afirmar experimentalmente:

(4)

\hat{P} (A_{p}) < 10^{- 50}

Os argumentos sobre proteínas funcionais descritos acima são estudos empíricos baseados em uma estimativa estatística padrão de prevalência, usando uma abordagem frequentista ou bayesiana (2)-(3). Tais estudos são comumente realizados em pesquisas científicas por meio de estimativas de Monte Carlo da prevalência (cf. a discussão abaixo (3) ), examinando uma amostra selecionada aleatoriamente de toda a população. Usando tais estimativas, as proteínas da vida são consideradas tipos específicos de eventos com baixa probabilidade. Observe, no entanto, que a prevalência dependerá de como o modelo estocástico de formação de proteínas é construído. A abordagem mais simples é escolher os aminoácidos da sequência proteica de forma independente e aleatória, como acima. Uma abordagem mais refinada é modelar a evolução de proteínas (como brevemente discutido na Seção 5 ). A aleatoriedade é então incorporada a uma árvore ancestral de proteínas, cuja dinâmica é impulsionada pela deriva genética aleatória por meio da reprodução, mutações aleatórias e seleção natural . Os parâmetros

θ_{p}

Os parâmetros de tal modelo incluem o tamanho da população de proteínas, o tamanho efetivo da população , as taxas de mutação e a aptidão dos organismos que carregam uma determinada proteína, onde organismos com proteínas funcionais apresentam maior aptidão. Axe também discorre sobre as enormes improbabilidades de que algo como proteínas funcionais surja por seleção natural ( Axe, 2016 ). O espaço de busca se mostra vasto demais para que a seleção cega tenha sequer uma pequena chance de sucesso. A visão contrastante é a de inovações baseadas em engenhosidade, astúcia e inteligência. Um elemento disso é o que Axe chama de “coerência funcional”, que sempre envolve planejamento hierárquico, sendo, portanto, um produto de ajuste fino. Ele conclui: “A coerência funcional torna a invenção acidental fantasticamente improvável e, portanto, fisicamente impossível” ( Axe, 2016, p. 160 ).

A vida como a conhecemos hoje é um mundo interdependente de DNA e proteínas ( Voie, 2006 ). No entanto, as moléculas de RNA podem funcionar tanto como enzimas (“proteínas”) quanto como replicadores (“DNA”). Eugene Koonin (2007 , 2012) realizou um estudo teórico sobre o caminho de um suposto mundo de RNA para um sistema de tradução explícito (como um “mundo de DNA-proteína”). Ele descobriu que esse caminho é incrivelmente íngreme ( Koonin, 2012, p. 376 ), mesmo no melhor cenário possível. Koonin estudou os requisitos para que um sistema de RNA acoplado de replicação-tradução específico emergisse, após a formação do nosso universo, em uma região O de planetas. Supondo que o sistema de RNA de replicação-tradução corresponda a um

n

-mer com

n = 1800

nucleotídeos, ele calculou probabilidades infinitesimalmente pequenas

(5)

\hat{P} (A_{RNA}) \approx \frac{t}{E (T)} < 10^{- 1018}

para que surja dentro de um intervalo de tempo de duração

t = 3 \times 10^{17}

segundos após o Big Bang. A quantidade

E (T) = 4^{n} / (10^{21} \times 5 \times 10^{22})

no denominador de (5) está o tempo de espera esperado até que o primeiro sistema de RNA acoplado de replicação-tradução surja por acaso em algum lugar entre os

10^{21}

planetas da região O. Assume-se que cada um desses planetas tenha a mesma dimensão da Terra e uma taxa de

5 \times 10^{22}

moléculas por segundo em que

n

Os -meros são formados dentro de sua camada habitável.

Koonin apresenta uma solução bastante especulativa para um multiverso infinito: os Muitos Mundos em Um (MWO). Isso altera a própria definição do que é possível e provável, de tal forma que a probabilidade de qualquer cenário se concretizar em um multiverso infinito passa a ser 1. As probabilidades deixam de importar. Mesmo assim, Koonin apresentou um cálculo detalhado de um limiar para a evolução biológica. Ele também afirma que o Mundo do RNA dificilmente tem potencial para evoluir além de “organismos” muito simples ( Koonin, 2012, p. 366 ).

4.2 . Complexos proteicos

As proteínas raramente atuam sozinhas. Elas podem interagir com uma variedade de moléculas diferentes, mas são as suas interações simultâneas entre si, no mesmo local, que explicam muitas das funções da célula ( Jones e Thornton, 1996 ). As proteínas em um complexo proteico são ligadas por interações não covalentes proteína-proteína. Os complexos proteicos são uma forma de estrutura quaternária . Esses complexos são fundamentais em muitos processos biológicos e, juntos, formam vários tipos de maquinário molecular que executam uma vasta gama de funções biológicas . Os conjuntos de proteínas estão na base de inúmeras máquinas biológicas, realizando ações que nenhuma das proteínas individuais seria capaz de realizar. Existem milhares, talvez milhões, de diferentes tipos e estados de proteínas em um organismo vivo, e o número de interações possíveis entre elas é enorme. A montagem adequada de complexos multiproteicos é importante, e a mudança de um estado ordenado para um desordenado leva a uma transição da função para a disfunção do complexo. Alguns complexos proteicos podem ser bastante constantes e existir durante toda a vida da célula, enquanto outros podem ser transitórios, acumulados para algum propósito e degradados quando não são mais necessários. Na Seção 3 , foi mencionado um sistema de Behe de complexidade irredutível . Ele é composto por diversos módulos bem combinados e interativos que contribuem para a função básica, sendo que a remoção de qualquer um dos módulos faz com que o sistema deixe de funcionar.

Behe não ignora o papel das leis da natureza. A biologia permite mudanças e modificações evolutivas. A evolução existe, o design irredutível existe, e ambos são observados. As leis da natureza podem organizar a matéria e forçá-la a mudar. A questão de Behe é que existem alguns sistemas irredutivelmente complexos que não podem ser produzidos pelas leis da natureza.

“Se uma estrutura biológica pode ser explicada em termos dessas leis naturais [reprodução, mutação e seleção natural], então não podemos concluir que ela foi projetada… no entanto, mostrei por que muitos sistemas bioquímicos não podem ser construídos pela seleção natural atuando sobre mutações: não existe uma rota direta e gradual para esses sistemas complexos irredutíveis, e as leis da química atuam fortemente contra o desenvolvimento não direcionado dos sistemas bioquímicos que produzem moléculas como o AMP 1 ” ( Behe, 1996, p. 203 ).

Então, mesmo que as leis naturais atuem contra o desenvolvimento dessas “complexidades irredutíveis”, elas ainda existem. A forte sinergia dentro do complexo proteico o torna irredutível a um processo incremental. Elas devem ser reconhecidas, antes, como condições iniciais finamente ajustadas das sequências proteicas constituintes . Essas estruturas são exemplos biológicos de nanoengenharia que superam qualquer coisa que os engenheiros humanos tenham criado. Tais sistemas representam um sério desafio para uma explicação darwiniana da evolução, uma vez que sistemas irredutivelmente complexos não possuem uma série direta de intermediários selecionáveis e, além disso, como vimos na Seção 4.1 , cada módulo (proteína) tem baixa probabilidade de existir isoladamente.

Diversos argumentos têm sido escritos sobre se a evolução darwiniana pode ou não explicar plausivelmente sistemas irredutivelmente complexos ( Behe, 2001 , Behe, 2004 , Behe, 2019 , Miller, 2004 , Dembski, 2004 , Pallen e Matzke, 2006 , Liu e Ochman, 2007 , Doolittle, 2012 ). Complexidade irredutível não significa que sistemas irredutivelmente complexos sejam logicamente impossíveis de evoluir com base em módulos existentes. Não se pode descartar definitivamente a possibilidade de uma rota indireta e tortuosa. Um subsistema bem conhecido do flagelo bacteriano (chamado sistema de secreção do tipo III) desempenha uma função distinta da do flagelo. No entanto, encontrar um subsistema de um sistema funcional que desempenhe alguma outra função dificilmente é um argumento para o sistema original ter evoluído a partir desse outro sistema. À medida que a complexidade de um sistema interativo aumenta, a probabilidade de tal rota indireta diminui rapidamente. Portanto, explicações darwinianas para sistemas irredutivelmente complexos são improváveis. Em última análise, esta é uma questão que deve ser estudada tanto experimentalmente quanto por meio de simulações computacionais. O conceito de complexidade irredutível de Behe não foi refutado por modelos computacionais ( Ewert, 2014 ; Ewert et al., 2014 ), e atualmente não existem relatos darwinianos detalhados da evolução de qualquer sistema bioquímico ou celular desse tipo, “apenas uma variedade de especulações otimistas” ( Harold, 2003, p. 205 ).

No âmbito da Seção 2 , o conjunto de todos os complexos proteicos possíveis é considerado como o espaço amostral.

Ω

de um modelo estocástico. De acordo com um modelo naturalista, os resultados são gerados aleatoriamente pela evolução, impulsionados pela deriva genética aleatória por meio da reprodução, mutações aleatórias e seleção natural. A prevalência

P (A)

, ou seja, a fração de complexos proteicos funcionais, será tipicamente ainda menor do que na Seção 4.1 , uma vez que é necessário ainda mais para que um complexo de proteínas funcione em comparação com uma única proteína.

De fato, o modelo estocástico de complexos proteicos é bastante complexo, incluindo, por exemplo, a interação física. As interações físicas entre proteínas são tipos específicos de interações, e um sistema de Behe pode ser analisado pelo princípio bioquímico da complementaridade . Quando um complexo proteico biologicamente ativo consiste em mais de uma subunidade separada, a chamada estrutura quaternária descreve a topologia dos contatos, ou seja, como as unidades constituintes se unem no espaço. As moléculas da superfície em tal sistema biológico se encaixam devido à complementaridade espacial e eletrostática . Os contornos de uma subunidade do sistema são complementares aos contornos das outras, e regiões de excesso de carga positiva na superfície de uma unidade devem se encaixar perfeitamente com regiões de excesso de carga negativa nas outras, como ilustrado na Figura 3. Além disso, a hidrofobicidade e outras propriedades físico-químicas também estão envolvidas na configuração final. A assimetria entre as proteínas envolvidas é convencionalmente dividida em “isca” e “presa” ( Scholtens et al., 2008 ). A isca é a proteína cujos parceiros de interação estamos buscando; As proteínas-alvo são aquelas proteínas que interagem com uma determinada isca. As subunidades básicas se encaixam no sistema de múltiplas subunidades como um grande quebra-cabeça tridimensional.

O princípio da complementaridade foi proposto inicialmente pelo ganhador do Prêmio Nobel Paul Ehrlich (1854–1915). Ele ressoa em toda a bioquímica e continua a fundamentar grande parte da pesquisa moderna sobre o modo de ação das enzimas ( Hall, 2000, p. 303 ). O acoplamento de proteínas e o reconhecimento de padrões em nível molecular são baseados na complementaridade multinível (geometria, carga, hidrofobicidade etc.).

Dembski aplica o termo “Objeto Combinatório Discreto” a qualquer sistema biomolecular que tenha sido definido por Behe como tendo “complexidade irredutível” ( Dembski, 2002, pp. 289-302 ). A equação de Drake é uma expressão frequentemente usada em astrobiologia para estimar a prevalência de civilizações ativas em nossa galáxia. Por analogia à equação de Drake, Dembski propõe uma equação baseada em três eventos independentes: A p : originar os blocos de construção (cadeias proteicas) do complexo proteico (conforme descrito na Seção 4.1 ), A l : localizar os blocos de construção no mesmo local e A c : configurar os blocos de construção corretamente para formar o complexo. Assim, a probabilidade de um complexo proteico é o produto multiplicativo das probabilidades de origem de suas partes constituintes, da localização dessas partes em um local e da configuração dessas partes no sistema resultante (topologia de contato). Isso leva à seguinte estimativa para a probabilidade de um complexo proteico ( PC ) composto por N blocos de construção independentes:

(6)

\hat{P} (A_{PC}) = \prod_{n = 1}^{N} [P (A_{p}^{(n)} | {\hat{θ}}_{p}^{(n)}) ∙ P (A_{l}^{(n)} | {\hat{θ}}_{l}^{(n)}) ∙ P (A_{c}^{(n)} | {\hat{θ}}_{c}^{(n)})],

onde

θ_{p}^{(n)}

θ_{l}^{(n)}

, e

θ_{c}^{(n)}

são os parâmetros envolvidos na formação da cadeia proteica, a localização e a configuração do

n

O processo de formação de estruturas como complexos proteicos, através de um processo de três partes (produção, convergência e montagem), é problemático, pois os parâmetros do modelo são muito difíceis de estimar. Portanto, analogamente à equação de Drake, a utilidade da equação não reside na sua resolução, mas sim na reflexão sobre os diversos conceitos que a ciência deve incorporar ao considerar como explicar esse tipo de estrutura complexa. Mesmo que consideremos P(A p ) igual a 1, e, portanto, assumamos que não há obstáculos problemáticos na geração dos blocos de construção, e também eliminemos a probabilidade de localização, reduzindo o acaso à necessidade (auto-organização), P(A c ) ainda pode representar grandes obstáculos à configuração aleatória da estrutura quaternária de sistemas biológicos operacionais ( Csermely et al., 2010 ). Esse problema de estimar P(A c ) parece bastante intratável, mas pode ser abordado por meio de experimentos de perturbação ( Antal et al., 2009 ). A ideia é pegar um sistema funcional, perturbá-lo e determinar como essa perturbação afeta a probabilidade de retenção da função. Há muito trabalho biológico a ser feito nessa área, tanto empiricamente quanto teoricamente, e é importante estarmos abertos a qualquer tipo de conclusão proveniente de novos experimentos. Por exemplo, podemos admitir que a complexidade irredutível no presente nos diz pouco ou nada sobre os precursores funcionais no passado?

Como vimos, o modelo estocástico de complexos proteicos envolve tipos de resultados mais complexos do que os modelos de proteínas da Seção 4.1 . Enquanto proteínas individuais correspondem a cadeias de aminoácidos, os complexos proteicos são frequentemente representados como grafos (Figura 4 ). Grande parte da pesquisa no estudo de interações proteicas tem sido realizada com o uso da teoria matemática dos grafos ( Chiang et al., 2007 ; Su et al., 2018 ). A teoria dos grafos é uma maneira direta e flexível de implementar sistemas interativos reais. A linguagem da teoria dos grafos oferece uma abstração matemática para a descrição de tais relações. Um papel importante dos grafos é a modelagem estatística . Um modelo de grafo direcionado é apropriado para sistemas de isca-presa, nos quais um modelo de erro multinomial é usado para representar as interações. Estatísticas globais e locais sobre a topologia dos grafos de interação visam inferir a natureza e o comportamento das interações do complexo proteico. Su et al. (2018) abordaram a questão dos procedimentos de teste de significância para complexos proteicos biológicos reais. Seus estudos estatísticos mostram que as interações nesses complexos ocorrem de forma muito menos aleatória do que o esperado pelo acaso.

O modelo isca-presa é, em si, uma forma de modelar o ajuste fino de módulos proteicos. Além disso, a função final do complexo proteico é alcançada pela complementaridade entre a cavidade de ligação da proteína e seu substrato. Isso envolve um nível adicional de complementaridade finamente ajustada em relação aos grupos de átomos interagentes envolvidos na função final do complexo proteico, um fator que reduz ainda mais a prevalência.

P (A_{PC})

de complexos proteicos funcionais.

Existe também um nível adicional de informação que deve ser considerado em um modelo estocástico de complexos proteicos. Esse nível de informação está inserido na linguagem da complementaridade molecular, que também pode ser entendida como uma linguagem de sinais biosemiótica , ou seja, sinais escritos e lidos em nível molecular. A biosemiótica é, em geral, o estudo dos signos, da comunicação e da informação em organismos vivos. Charles Peirce é considerado um dos fundadores da semiótica e, portanto, também da biosemiótica. Na biosemiótica, o signo, e não a molécula, é a unidade básica para o estudo da vida ( Hoffmeyer, 1997 ). Nosso foco preferencial atual no genoma e nas sequências de aminoácidos precisa ser complementado por um foco semelhante no senoma ( Baluška e Miller, 2018 ), que representa a soma de todas as atividades da célula viva e seu aparato ( Compagno, 2018 ).

4.3 . Redes celulares

Como afirma Denis Noble, os sistemas biológicos funcionam como uma orquestra completa, com seus diferentes elementos tocando em conjunto a partitura da vida ( Noble, 2006 ). Os complexos proteicos desempenham suas funções biológicas de maneira cooperativa, participando de diversos processos e redes biológicas , do núcleo à membrana celular . Sabe-se também que as redes celulares contêm circuitos e ciclos de retroalimentação. Um modelo estocástico com redes celulares como resultados é extremamente complexo. No entanto, os modelos Bayesianos oferecem uma das estruturas mais flexíveis para modelar tais redes em termos de Redes Bayesianas Dinâmicas . Para descrever essas estruturas, os livros didáticos modernos frequentemente utilizam as semelhanças pedagógicas entre a rede celular e uma cidade moderna, ou “cidade inteligente” ( Daempfle, 2016 ).

O estudo das redes de interação proteica de todas as proteínas em um organismo (os “interactomas”) permanece um dos maiores desafios da biologia moderna e constitui o objetivo da biologia de sistemas (Figura 5 ). Métodos estatísticos para reconstruir redes celulares são uma área de pesquisa vasta e em rápido desenvolvimento, incluindo redes Bayesianas, modelos gráficos Gaussianos e métodos baseados em grafos para dados de intervenções e perturbações experimentais ( Markowetz e Spang, 2007 ). Grafos aleatórios também podem ser usados para modelar redes celulares. Eles são descritos em termos de um processo aleatório que os gera e dos parâmetros.

θ

As arestas desse processo aleatório são escolhidas de forma que a configuração do grafo aleatório resultante faça sentido em comparação com dados reais . Esses grafos resultantes devem capturar o fato de que genes e produtos gênicos estão conectados em redes altamente organizadas de fluxo de informação através da célula, que por sua vez não funcionam isoladamente. Observamos correlações entre genes pela presença de outros genes. Grafos de correlação geram as estruturas de correlação mais simples entre genes, enquanto redes Bayesianas abrangem um conjunto mais sofisticado de modelos, com correlações mais complexas.

Experimentos de perturbação são essenciais para inferir a função gênica e as vias regulatórias, e uma técnica genética comum consiste em perturbar um gene de interesse e estudar quais expressões de outros genes são afetadas. Diversos tipos de perturbações têm um grande efeito na estabilidade da rede, e um estudo de teoria dos grafos mostra que as redes de interação de complexos proteicos são redes não aleatórias ( Jalan, 2013 ; Huang et al., 2016 ; Huang et al., 2019 ). Baixa aleatoriedade significa que a probabilidade de dois nós quaisquer escolhidos aleatoriamente estarem conectados entre si é muito baixa ou zero. Contudo, embora resultados como esses indiquem a dificuldade de processos naturais aleatórios gerarem redes de proteínas, ainda há muito trabalho a ser feito antes que possamos compreender melhor as redes biológicas à luz do ajuste fino. A análise baseada em redes se divide nas seguintes categorias principais: (a) identificação e análise de motivos, (b) estudo da arquitetura global, (c) propriedades topológicas locais e (d) robustez da rede sob diferentes tipos de perturbações.

Como descrevemos acima, a organização interna da célula compreende muitas camadas. O genoma refere-se ao conjunto de informações armazenadas no DNA, enquanto o proteoma abrange o conjunto de todas as proteínas. O metaboloma contém pequenas moléculas (açúcares, sais, nucleotídeos e aminoácidos) que participam de reações metabólicas necessárias para a manutenção e o funcionamento normal de uma célula, e todas as proteínas da célula interagem em uma grande rede chamada interactoma . Para compreender a complexidade das células vivas, a pesquisa precisará construir modelos em todas essas camadas. A modelagem estatística desses sistemas pode fornecer uma visão mais profunda de nossa compreensão do universo físico e biológico, conforme demonstrado na Tabela 1 .

Tabela 1. A tabela apresenta uma visão geral dos dados científicos e modelos estatísticos. A estrutura dos dados corresponde ao resultado. $x$ do modelo correspondente para proteínas, motores moleculares e redes celulares, ou a especificidade (funcionamento) $f (x)$ desse resultado para a física refinada.

Dados empíricos	Estrutura de dados	Tipo de modelo	Seção
Física finamente ajustada	Indicador binário de função.	Inferência Bayesiana ou Inferência Abdutiva	3
Proteínas	Sequências aleatórias	Inferência frequentista ou inferência bayesiana	4.1
Motores moleculares	Gráficos aleatórios	Inferência frequentista ou inferência bayesiana (preliminar)	4.2
Redes celulares	Gráficos aleatórios	Inferência Bayesiana (preliminar)	4.3

Nas duas seções seguintes, discutiremos algumas implicações adicionais e questões de modelagem matemática relacionadas a sistemas finamente ajustados.

5. Obtendo o ajuste fino em um modelo darwiniano convencional: O problema do tempo de espera

Nesta seção, vamos nos aprofundar na relação entre a probabilidade de um evento e o tempo disponível para que esse evento ocorra. No contexto dos sistemas vivos , precisamos questionar se os mecanismos darwinianos convencionais têm a capacidade de realizar ajustes finos durante um período de tempo determinado . Isso é importante para interpretar corretamente o registro fóssil, que muitas vezes é interpretado como tendo longos períodos de estase interrompidos por mudanças abruptas e repentinas ( Bechly e Meyer, 2017 ). Exemplos dessas mudanças repentinas incluem a origem da fotossíntese , as explosões cambrianas, a evolução de olhos complexos e a evolução do voo animal. Acredita-se que as mudanças genéticas concomitantes tenham ocorrido muito rapidamente, pelo menos em uma escala de tempo macroevolutiva, durante um período de tempo de duração

t

Para testar se isso é possível, é necessário um modelo matemático para estimar a prevalência.

P (A)

do evento

A

que as alterações genéticas necessárias em uma espécie ocorram dentro de um período de tempo de duração

t

Mais especificamente, no âmbito da Seção 2, consideramos um intervalo de tempo de duração

t

(normalmente medidas em unidades de gerações) e questionam se os mecanismos evolutivos (mutações, seleção natural e deriva genética aleatória) podem alterar uma sequência de nucleotídeos do DNA de toda uma população (espécie), de um padrão para outro, através de uma série de

m

alterações genéticas coordenadas. O resultado

x

é o caminho evolutivo do sistema a partir do ponto inicial do intervalo,

T = T (x)

é o tempo necessário para provocar uma série de

m

mudanças específicas e

A

é o conjunto de todos os resultados

x

para as quais essas mudanças ocorrem dentro do tempo

t

Isso corresponde a uma prevalência.

P (A | θ) = P (T (X) \leq t | θ)

, onde

X

é aleatório, com uma distribuição que atribui probabilidades a todos os resultados possíveis , de acordo com um modelo genético populacional do sistema, enquanto

θ

inclui os parâmetros desse modelo, como o tamanho (efetivo) da população, o comprimento da cadeia de DNA, a taxa de mutação , o tipo de alterações genéticas necessárias em cada um dos

m

passos e a aptidão seletiva de indivíduos que adquiriram

i = 0, 1, \dots, m

alterações genéticas. Por exemplo, se o objetivo final do processo evolutivo for um sistema irremediavelmente complexo com

m

subunidades, a aptidão da sequência de DNA alvo correspondente é maior do que a aptidão de indivíduos sem alterações genéticas (

i = 0)

, enquanto indivíduos que adquiriram

i = 1, \dots, m - 1

As alterações genéticas devem ter uma aptidão ainda menor do que aquelas sem alterações genéticas. Quanto maior a população, mais difícil é para as mutações deletérias das etapas intermediárias se espalharem e se fixarem em toda a população. Portanto, a prevalência

P (A)

A capacidade de um sistema irredutivelmente complexo é extremamente pequena para todas as populações, exceto as muito pequenas.

É importante aqui diferenciar entre adaptações mutacionais baseadas em informações codificadas internamente e aquelas que são resultado do mero acaso. Mais especificamente, uma ou mais mutações do primeiro tipo são necessárias para construir novas informações e levar o sistema de um estado para outro.

i

para

i + 1

Mas, ao mesmo tempo, outras mutações aleatórias do segundo tipo surgirão e, às vezes, essas mutações destroem informações e fazem o sistema retroceder do estado inicial.

i

para declarar

i - 1

O efeito dessas mutações reversas é aumentar o tempo necessário.

T

para atingir a meta de

m

alterações genéticas coordenadas e, consequentemente, tornando a prevalência

P (A)

de um sistema irredutivelmente complexo ainda menor.

Para estimar a prevalência do sistema, precisamos, portanto, encontrar a distribuição do tempo de espera.

T

até

m

ocorrem mudanças genéticas coordenadas. Para uma única mudança (

m = 1)

, este é um problema bem estudado de genética de populações quando o alvo representa uma única mutação pontual ( Crow e Kimura, 1970 ; Durrett, 2008 ). Esses resultados foram generalizados para cenários mais complexos com

m = 1

, onde o alvo representa uma cadeia inteira de DNA de nucleotídeos, usando aproximações analíticas ( Durrett e Schmidt, 2007 , Behrens e Vingron, 2010 , Tugrul et al., 2015 ) ou simulações ( Sanford et al., 2015 ).

A distribuição do tempo de espera para

m = 2

As alterações genéticas incluem um artigo pioneiro de Kimura (1985) e publicações mais recentes no contexto da disseminação tumoral por Komarova et al., 2003 , e Iwasa et al., 2004. Os resultados matemáticos destes dois últimos artigos foram utilizados por Durrett e Schmidt, 2008 , 2009, para estimar o tempo necessário para que duas mutações coordenadas alterem a expressão de um gene de tal forma que a primeira mutação desative um sítio de ligação em uma região regulatória próxima, enquanto a segunda mutação ativa um segundo sítio de ligação na mesma região regulatória. Este trabalho foi posteriormente ampliado por Durrett et al. (2009) para um número arbitrário de anos.

m

de mutações.

Behe (2007) argumentou que

m = 2

Mutações coordenadas parecem ser o limite do que a evolução é capaz de alcançar, sendo o desenvolvimento de resistência à cloroquina no parasita causador da malária ( P. falisparum ) um exemplo bem conhecido. Behe (2009) também enfatizou a importância de incluir mutações reversas em modelos para o tempo de espera de mutações coordenadas. Isso foi confirmado, em diferentes contextos, por Axe (2010b , 2010a) e Hössjer et al. (2018) . Em uma seção deste último artigo, os autores consideram um sistema com

m

subunidades, cada uma das quais pode sofrer mutações diretas e reversas independentemente, para frente e para trás, em qualquer ordem. Além disso, assumem um modelo neutro onde todos os estados intermediários de

i = 1, \dots, m - 1

As mutações diretas adquiridas não apresentam desvantagem seletiva. Está demonstrado na equação (12.109) de Hössjer et al. (2018) que o tempo de espera esperado até que o sistema adquira todas as mutações diretas é dado por:

m

mutações diretas, é aproximadamente

(7)

E (T) \approx \frac{{(1 + C)}^{m}}{mCu}

quando

m

é grande, com

u > 0

a probabilidade de uma mutação direta por geração e indivíduo, e a probabilidade de uma mutação reversa por geração e indivíduo, denotadas por

Cu > 0

Se cada subunidade for um único nucleotídeo de DNA (A, G, C ou T), os valores típicos dos parâmetros serão:

u = 10^{- 8} / 3

C = 3

, visto que apenas uma mutação em três é uma mutação direta (correspondente ao nucleotídeo alvo dessa subunidade), enquanto todas as mutações são mutações reversas. O tempo de espera em (7) é aproximadamente distribuído exponencialmente, portanto, pela expansão de Taylor, a prevalência é dada por

(8)

P (A) = P (T \leq t) \approx 1 - \exp (- \frac{t}{E (T)}) \approx \frac{t}{E (T)} .

Observe, em particular, que o tempo de espera esperado em (7) aumenta com

m

a uma taxa exponencial quando mutações reversas são permitidas (

C > 0)

, enquanto a prevalência em (8) diminui exponencialmente com

m

O tempo de espera aumenta ainda mais rapidamente com

m

Para um sistema irredutivelmente complexo com mutações reversas, uma vez que os estados intermediários não são neutros, mas deletérios. Consequentemente, a prevalência

P (A)

de um sistema irredutivelmente complexo com mutações reversas é extremamente pequeno, mesmo para valores moderadamente grandes.

m

Diversos autores tentaram superar o problema do tempo de espera propondo mecanismos de mudança dentro da via evolutiva.

X

que reduzem o tempo necessário para atingir o alvo. Esses mecanismos incluem simbiogênese , a ação de elementos transponíveis , transferência horizontal de genes e o uso de vias evolutivas alternativas. No entanto, LeMaster (2018) argumenta que nenhum desses mecanismos realmente resolve o problema do tempo de espera.

Também é possível abordar o problema do tempo de espera no contexto do ajuste fino de estruturas da célula viva que se conectam à origem da vida, como proteínas (ver equação (5) da Seção 4.1 ), complexos proteicos ( Seção 4.2 ) ou o código genético ( Wichmann e Ardern, 2019 ). A prevalência

P (A) = P (T (X) \leq t) \approx t / E (T)

então corresponde à probabilidade de que (algum aspecto da) vida tenha surgido puramente por acaso dentro de um período de tempo predeterminado.

t

Considerando que o ajuste fino da diversidade da vida (desde que a vida tenha surgido) requer um processo evolutivo darwiniano (biológico)

X

a fim de estimar a probabilidade

P (A)

Considerando que a estrutura genômica observada ocorreu aleatoriamente, dentro de um período de tempo predeterminado, a origem da vida corresponde a um cenário onde

X

É um processo de evolução química.

6. Modelagem do ajuste fino em sistemas biológicos

6.1 . Trabalhos de modelagem anteriores

O Design Inteligente (DI) tem despertado grande interesse e atenção nos últimos anos, principalmente nos EUA , atraindo a atenção do público e provocando debates acalorados nos meios científicos e populares. O DI busca aderir aos mesmos padrões de investigação racional que outras áreas científicas e filosóficas, estando sujeito aos mesmos métodos de avaliação e crítica. O DI tem sido criticado tanto por sua lógica subjacente quanto por suas diversas formulações ( Olofsson, 2008 ; Sarkar, 2011 ).

William Dembski propôs originalmente o que chamou de “filtro explicativo” para distinguir entre eventos devidos ao acaso, à regularidade ordenada ou a um desígnio ( Dembski, 1998 ). Em um nível suficientemente abstrato, sua lógica se baseia em princípios e técnicas bem estabelecidos da teoria de testes de hipóteses estatísticas . No entanto, é difícil aplicá-lo a muitas aplicações ou contextos biológicos interessantes, porque um grande número de cenários potenciais, porém desconhecidos, pode existir, o que dificulta a formulação de uma hipótese nula para um teste estatístico ( Wilkins e Elsberry, 2001 ; Olofsson, 2008 ).

A versão reformulada de uma medida de complexidade publicada por Dembski e seus colaboradores é denominada Complexidade Algorítmica Especificada (ASC) ( Ewert et al., 2013 , Ewert, 2014 , Ewert et al., 2014 ). A ASC incorpora as medidas de complexidade de Shannon e Kolmogorov e quantifica o grau em que um evento é improvável e segue um padrão. A complexidade de Kolmogorov está relacionada à compressão de dados (e, portanto, de padrões), mas sofre da propriedade de ser incognoscível, pois não existe um método geral para calculá-la. No entanto, é possível estabelecer limites superiores para a complexidade de Kolmogorov e, consequentemente, a ASC pode ser limitada sem ser calculada exatamente. A ASC é baseada no contexto e medida em bits. Os mesmos autores aplicaram esse método à linguagem natural, ruído aleatório, dobramento de proteínas, imagens etc. ( Marks et al., 2017 ).

6.2 . Rumo a uma estrutura estatística geral para testar o ajuste fino

Mais recentemente, George Montañez publicou um modelo para detecção de ajuste fino que incorpora aleatoriedade e especificidade, e que unifica muitas tentativas anteriores ( Montañez, 2018 ). Para descrever esse método, vamos considerar...

f (x)

seja uma função que quantifique, para cada resultado

x \in Ω

, o quão específico ele é, com um valor maior correspondendo a um maior grau de especificidade. Seja

x_{o b s}

seja o resultado observado e defina o conjunto

(9)

A = \{x \in Ω; \frac{P (x | θ)}{f (x)} \leq \frac{P (x_{o b s} | θ)}{f (x_{obs})}\}

5">de resultados que são pelo menos tão improváveis ou pelo menos tão específicos quanto o observado. A prevalência

P (A)

corresponde ao caráter atípico de

x_{o b s}

Ou seja, qual a probabilidade de observar um resultado pelo menos tão improvável e/ou especificado quanto

x_{o b s}

Outra possibilidade é definir um evento.

(10)

A = \{x \in Ω; f (x) \geq f (x_{o b s})\},

que consiste em todos os resultados pelo menos tão especificados quanto o observado. Uma vantagem de (10) sobre (9) é que (10) torna possível tratar modelos onde alguns resultados são discretos enquanto outros são contínuos, como é comum em problemas com censura e truncamento.

A escolha da função de especificidade

f

é crucial. No caso mais simples, um resultado é especificado ou não, quantificado como 1 ou 0. Isso corresponde a uma função indicadora.

(11)

f (x) = 1 (x \in A),

onde

A

é o conjunto de resultados especificados, ou seja, uma função que é igual a 1 para todos os resultados em

A

e 0 para todos os resultados fora de

A

Observe que (10) recupera

A

em qualquer momento

f

satisfaz (11) e observamos um resultado especificado (

x_{o b s} \in A

Em outras aplicações, existem diferentes graus de especificidade, o que exige escolhas mais sofisticadas de

f

do que (11) . É possível, por exemplo, formular o Dilema de Haldane no contexto de (10). Haldane (1932) questionou se a seleção natural é capaz de remover mutações deletérias à medida que surgem em uma espécie ao longo do tempo. Caso contrário, elas podem causar uma carga mutacional que aumenta a tal ponto que a sobrevivência da espécie fica ameaçada ( Lynch et al., 1993 ). Tal aumento na carga mutacional corresponde a um aumento da entropia genética ( Sanford, 2008 ) ou a uma diminuição da aptidão biológica. O Dilema de Haldane está, na verdade, relacionado ao problema do tempo de espera da Seção 5. Mais especificamente, fazemos a seguinte pergunta: Se uma população evoluiu aleatoriamente durante um período de tempo de duração

t

Então, ao final desse período, qual será a fração de indivíduos?

x

dentro da população

Ω

teria um condicionamento físico

f (x)

pelo menos tão grande quanto o observado,

f (x_{o b s})

, para algum indivíduo vivo neste momento ? No contexto de (8), isso corresponde a uma prevalência

P (A | θ) = P (f (X) \geq f (x_{o b s}) | θ)

, onde

f (X)

é a aptidão de um indivíduo escolhido aleatoriamente.

X

ao final do período, de acordo com as previsões de um modelo evolutivo.

Os parâmetros

θ

Neste modelo, incluem-se a distribuição de aptidão no início do período, o tamanho (efetivo) da população, a taxa de mutação e o espectro mutacional (a distribuição das mudanças de aptidão causadas por mutações). Se o espectro mutacional for tal que as mutações sejam neutras em média, então o Teorema Fundamental da Seleção Natural de Fisher ( Fisher, 1930 ; Price, 1972 ) prevê que a aptidão biológica aumenta ao longo do tempo, correspondendo a uma alta prevalência.

P (A)

No entanto, é bem conhecido ( Kimura, 1979 ) que a maioria das mutações é ligeiramente prejudicial. Basener e Sanford (2018) recentemente estenderam o Teorema de Fisher, permitindo espectros mutacionais arbitrários. Em particular, eles mostraram que o espectro mutacional de Kimura implica uma diminuição da aptidão ao longo do tempo, em consonância com as previsões do Dilema de Haldane. Consequentemente, a prevalência

P (A)

é muito pequeno para espécies que existem há muito tempo.

t

de tempo.

Independentemente de (9) ou (10) ser usado, e independentemente de

f

corresponde a uma função binária ou contínua, a prevalência

P (A)

envolve uma série de parâmetros desconhecidos

θ

Portanto, para estimar a prevalência, precisamos de um conjunto de dados de treinamento (=dados) diferente de

x_{o b s}

para estimar os parâmetros desconhecidos, seja por meio de uma abordagem frequentista (2) ou de uma abordagem Bayesiana (3). No primeiro caso

P (A)

é chamado de

p

-valor. Também enfrentamos o desafio da prevalência

P (A)

depende de

f

Precisamos saber.

f

antecipadamente ou ser capaz de estimá-la de alguma forma (isso está relacionado à dificuldade mencionada anteriormente de formular uma hipótese nula de teste). Nossos exemplos anteriores nas Seções 3 a 5 correspondem a uma especificidade binária (11) , onde

f (x) = 1

(ou equivalentemente)

x \in A

) quando

x

é um universo que existe ou é habitável ( Seção 3 ) ou quando

x

é uma proteína ou complexo proteico que desempenha uma função ( Seções 4.1–4.2 ). Na Seção 5, abordamos o problema do tempo de espera e questionamos se o tempo

T = T (x)

até que uma sequência pré-especificada de mudanças de um caminho evolutivo ocorra.

x

ocorrer, é menor que

t

ou não. Isso corresponde à função de especificidade binária (11) com

A = \{x; T (x) \leq t\}

Para o Dilema de Haldane, utilizamos uma função de especificidade contínua que corresponde à aptidão biológica.

6.3 . Seleção do modelo

Uma abordagem geral consiste em detectar o ajuste fino demonstrando que a prevalência do evento (9) ou (10) é baixa. Um crítico pode argumentar que isso, em certa medida, é um argumento de "ajuste fino das lacunas", visto que talvez nunca saibamos com certeza se um modelo naturalista melhor, com uma prevalência muito maior, será encontrado no futuro. Ou seja, se a prevalência

P (A)

é baixo, pois refutamos apenas um modelo naturalista específico, não necessariamente o naturalismo em geral. É claro que nunca podemos ter certeza se uma explicação naturalista melhor será encontrada posteriormente. No entanto, pode-se argumentar que a abordagem mais adequada da ciência é comparar as melhores explicações encontradas até o momento dentro de duas visões de mundo concorrentes. Isso leva naturalmente à seleção de modelos. Relembrando a Figura 1 , um modelo estatístico

M

é uma coleção de mecanismos geradores de dados

P (∙ | θ)

para todos os parâmetros

θ

que o modelo permite. É possível que alguns problemas sugiram um modelo de projeto.

M_{1}

que compete com o modelo naturalista mais promissor atualmente

M_{2}

, em termos de qual modelo explica melhor os dados.

Essa seleção de modelo pode ser realizada por meio do cálculo de estimativas.

\hat{P} (A | M_{1})

\hat{P} (A | M_{2})

da prevalência de

A

(escolhido como em (9) ou (10)) para ambos os modelos e, em seguida, escolhendo o modelo com a maior prevalência estimada. A prevalência de cada modelo pode ser estimada por uma abordagem frequentista (2) ou bayesiana (3). Em ambos os casos, a prevalência corresponde à discrepância de

x_{o b s}

, de modo que o modelo escolhido seja aquele para o qual

x_{o b s}

é o mínimo de um valor discrepante. Podemos interpretar essa seleção de modelo entre

M_{1}

M_{2}

como uma comparação da qualidade do ajuste dos dois modelos ao conjunto

A

de todos os conjuntos de dados possíveis que sejam pelo menos tão especificados quanto

x_{o b s}

Um tipo mais tradicional de seleção de modelo, que não leva em consideração a especificidade, consiste em comparar a qualidade do ajuste do resultado observado.

x_{o b s}

para ambos os modelos concorrentes, comparando

\hat{P} (x_{o b s} | M_{1})

\hat{P} (x_{o b s} | M_{2})

ou versões dessas probabilidades que são penalizadas pelo tamanho do modelo. Isso corresponde a escolher

A = \{x_{o b s}\}

em (2) ou (3).

Acreditamos que a abordagem de seleção de modelos é muito promissora para futuras pesquisas de ajuste fino. Ela pode ser usada, por exemplo, para decidir se a diversidade da vida é melhor explicada pela macroevolução darwiniana (

M_{2}

) ou um modelo inspirado no design (

M_{1}

Exemplos de modelos inspirados em design incluem o Grafo de Dependência de Winston Ewert (2018) e uma floresta de árvores genealógicas microevolutivas , onde as espécies dentro de cada árvore genealógica descendem de uma população ancestral comum projetada ( Tan, 2015 ; Tan, 2016 ). Também é possível estudar o problema mais restrito da ancestralidade humana/chimpanzé e comparar um modelo.

M_{2}

com ancestralidade comum entre as duas espécies, com um modelo de origem único.

M_{1}

, segundo a qual cada espécie é fundada por um único casal ( Sanford e Carter, 2014 ; Hössjer et al., 2016a ; Hössjer et al., 2016b ; Carter et al., 2018 ; Hössjer e Gauger, 2019 ). Para ampliar e fortalecer os resultados desses artigos, dados

x

pode envolver não apenas padrões de DNA, mas também uma ou várias camadas de organização da célula, conforme descrito na Seção 4 .

7. Considerações finais

A modelagem e inferência estatística em sistemas moleculares podem fornecer informações valiosas para a nossa compreensão do universo físico e biológico. Neste artigo, elaboramos informações básicas a partir de sequências de DNA , proteínas, complexos proteicos, vias de sinalização e redes, utilizando a prevalência

P (A)

de um evento observado

A

de ajuste fino, que corresponde a uma informação de Shannon de

{- l o g}_{2} P (A)

Ao elaborarmos tais modelos, podemos capturar adequadamente parte da riqueza do mundo natural. Nesse contexto, os métodos estatísticos fazem parte de uma nova abordagem que, em muitos casos, nos permite quantificar o quão desafiador é para processos aleatórios e naturalistas explicar as observações e os dados científicos contemporâneos, propondo, em vez disso, o ajuste fino como uma explicação alternativa plausível.

As leis, constantes e condições iniciais primordiais da natureza representam o fluxo natural. Esses objetos puramente naturais, descobertos nos últimos anos, aparentam ter sido deliberadamente ajustados com precisão. Proteínas funcionais, máquinas moleculares e redes celulares são improváveis quando consideradas como resultados de um modelo estocástico, com uma distribuição de probabilidade relevante (tendo uma pequena margem de erro).

P (A)

), e ao mesmo tempo estão em conformidade com uma especificação independente ou separada (o conjunto

A

sendo definidos em termos de especificidade). Esses resultados são importantes e deduzidos de fenômenos centrais da ciência básica. Tanto na física quanto na biologia molecular, o ajuste fino emerge como um princípio unificador e de síntese – uma observação interessante por si só.

Neste artigo, argumentamos que uma análise estatística de ajuste fino é uma abordagem útil e consistente para modelar algumas das categorias de projeto: “complexidade irredutível” (Michael Behe) e “complexidade especificada” (William Dembski). Como mencionado na Seção 1 , essa abordagem requer a) a introdução de uma distribuição de probabilidade para o conjunto de resultados possíveis e b) que um conjunto

A

de eventos finamente ajustados ou, de forma mais geral, uma função de especificidade

f

é definido. Aqui, b) requer algum entendimento prévio do que significa ajuste fino, para cada tipo de aplicação, enquanto a) requer um modelo naturalista de como as estruturas observadas teriam sido produzidas por acaso. As propriedades matemáticas de tal modelo dependem do tipo de dados analisados. Tipicamente, deve-se usar um processo estocástico que modele uma característica dinâmica, como a evolução estelar, química ou biológica (darwiniana). No caso mais simples, o espaço de estados de tal processo estocástico é um escalar (um nucleotídeo ou aminoácido), um vetor (uma cadeia de DNA ou de aminoácidos) ou um grafo (complexos de proteínas ou redes celulares).

Uma das principais conclusões do nosso trabalho é que o ajuste fino é uma característica evidente dos sistemas biológicos. De fato, o ajuste fino é ainda mais extremo em sistemas biológicos do que em sistemas inorgânicos. Ele é detectável no âmbito da metodologia científica. A biologia é inerentemente mais complexa do que o universo em grande escala, e, portanto, o ajuste fino é uma característica ainda mais marcante. Ainda há muito trabalho a ser feito para analisar estruturas de dados mais complexas, utilizando critérios empíricos mais sofisticados. Tipicamente, tais critérios correspondem a uma função de especificidade.

f

que não se trata apenas de uma abstração útil de um padrão subjacente, como a aptidão biológica. É necessária uma função de especificidade que, embora de origem não física, possa ser quantificada e medida empiricamente em termos de propriedades físicas, como a funcionalidade. A longo prazo, esses critérios são necessários para legitimar as explicações tanto científica quanto filosoficamente. No entanto, temos evidências suficientes para demonstrar que o ajuste fino e o design merecem atenção da comunidade científica como ferramentas conceituais para investigar e compreender o mundo natural. A principal agenda é explorar algumas possibilidades fascinantes para a ciência e criar espaço para novas ideias e explorações. Os biólogos precisam de recursos conceituais mais ricos do que as ciências físicas têm sido capazes de iniciar até agora, em termos de estruturas complexas que utilizam informações não físicas como entrada ( Ratzsch, 2010 ). Contudo, os pesquisadores ainda têm muito trabalho a fazer para estabelecer o ajuste fino como uma hipótese científica sustentável e totalmente testável e, em última instância, como uma Ciência do Design .

8. Declaração do autor

ST iniciou o estudo e OH desenvolveu o modelo estatístico na Seção 2. ST e OH conceberam o estudo e escreveram o manuscrito final em conjunto. Ambos os autores contribuíram igualmente para este trabalho e aprovam o manuscrito.

Declaração de Conflito de Interesses

Os autores declaram não possuir quaisquer interesses financeiros ou relações pessoais que possam ter influenciado o trabalho apresentado neste artigo.

Reconhecimento

Os autores agradecem a um revisor anônimo pelos valiosos comentários sobre uma versão anterior deste manuscrito.

Referências

Alberts, 1998
B. Alberts
A célula como uma coleção de máquinas moleculares: preparando a próxima geração de biólogos moleculares.
Célula , 92 ( 1998 ) , pp. 291-294 , 10.1016 / S0092-8674 (00)80922-8
Ver PDF
Ver artigo Ver no Scopus Google Scholar
Antal e outros, 2009
MA Antal , C. Böde , P. Csermely
Ondas de perturbação em proteínas e redes proteicas: Aplicações das teorias de percolação e jogos na sinalização e no desenvolvimento de fármacos.
Curr. Protein Pept. Sci. , 10 ( 2009 ) , pp. 161 - 172 , 10.2174/138920309787847617
Ver no Scopus Google Scholar
Machado, 2004
Machado DD
Estimativa da prevalência de sequências de proteínas que adotam dobras enzimáticas funcionais.
J. Mol. Biol. , 341 ( 5 ) ( 2004 ) , pp. 1295 - 1315 , 10.1016/j.jmb.2004.06.058
Ver PDF
Ver artigo Ver no Scopus Google Scholar
Machado, 2010a
Machado DD
Argumentos contra uma origem darwiniana para o dobramento de proteínas
BIO-Complexidade , 2010 ( 1 ) ( 2010 ) , pp. 1 - 12 , 10.5048/BIO-C.2010.1
Google Acadêmico
Machado, 2010b
Machado DD
Os limites da adaptação complexa: uma análise baseada em um modelo simples de populações bacterianas estruturadas.
BIO-Complexidade , 2010 ( 4 ) ( 2010 ) , 10.5048/BIO-C.2010.4
Google Acadêmico
Machado, 2016
Machado DD
Inegável: Como a biologia confirma nossa intuição de que a vida é projetada.
HarperOne ( 2016 )
Google Acadêmico
Baluška e Miller, 2018
F. Baluška , WB Miller
Visão senômica da célula: Senoma versus Genoma
Commun. Integr. Biol. , 11 ( 3 ) ( 2018 ) , pp. 1 - 9 , 10.1080/19420889.2018.1489184
Ver no Scopus Google Scholar
Barnes, 2012
LA Barnes
O ajuste fino do universo para a vida inteligente.
Publicação Astron. Soc. Austrália. , 29 ( 4 ) ( 2012 ) , pp. 529 - 564 , 10.1071/AS12015
Ver no Scopus Google Scholar
Barrow e Tipler, 1988
JD Barrow , FJ Tipler
O Princípio Cosmológico Antrópico
Oxford University Press ( 1988 )
Google Acadêmico
Basener e Sanford, 2018
WF Basener , JC Sanford
O teorema fundamental da seleção natural
J. Math. Biol. , 76 ( 2018 ) , pp. 1589 - 1622 , 10.1007/s00285-017-1190-x
Ver no Scopus Google Scholar
Bechly e Meyer, 2017
M. Bechly , SC Meyer
O registro fóssil e a ancestralidade comum universal
JP Moreland , SC Meyer , C. Shaw , AK Gauger , W. Grudem ( Eds.) , Evolução Teísta: Uma Crítica Científica, Filosófica e Teológica , Crossway Publ , Wheaton IL ( 2017 ) , pp . 331-361
Google Acadêmico
Behe, 1996
MJ Behe
A Caixa Preta de Darwin: O Desafio Bioquímico à Evolução
The Free Press , Nova Iorque ( 1996 )
Google Acadêmico
Behe, 2001
MJ Behe
Resposta aos meus críticos: Uma réplica às resenhas de A Caixa Preta de Darwin: O Desafio Bioquímico à Evolução
Biol. Philos. , 16 ( 2001 ) , pp. 685 - 709 , 10.1023/A:1012268700496
Google Acadêmico
Behe, 2004
MJ Behe
Complexidade Irredutível: Obstáculo à Evolução Darwiniana
M. Ruse ( Ed.) , Debating Design: From Darwin to DNA , Cambridge University Press ( 2004 ) , pp . 352-370
Ver no Scopus Google Scholar
Behe, 2007
MJ Behe
À Beira da Evolução: A Busca pelos Limites do Darwinismo
Imprensa Livre , Nova Iorque ( 2007 )
Google Acadêmico
Behe, 2009
MJ Behe
Aguardar mais tempo por duas mutações
Genética , 181 ( 2 ) ( 2009 ) , pp. 819-820 , 10.1534 / genetics.108.098905
Ver no Scopus Google Scholar
Behe, 2019
MJ Behe
Darwin em Devolução: A Nova Ciência sobre o DNA que Desafia a Evolução
HarperOne ( 2019 )
Google Acadêmico
Behrens e Vingron, 2010
S. Behrens , M. Vingron
Estudando a evolução de sequências promotoras: um problema de tempo de espera
J. Comput. Biol. , 17 ( 12 ) ( 2010 ) , pp. 1591 - 1606 , 10.1089/cmb.2010.0084
Ver no Scopus Google Scholar
Berger, 1985
JO Berger
Teoria da Decisão Estatística e Análise Bayesiana
( 2ª ed. ) , Série Springer em Estatística , Nova Iorque ( 1985 )
Google Acadêmico
Carter, 1974
B. Carter
Coincidências de Grande Número e o Princípio Antrópico em Cosmologia. Simpósio 63 da IAU: Confronto de Teorias Cosmológicas com Dados Observacionais
Reidel , Dordrecht ( 1974 ) , pp .
Ver no Scopus Google Scholar
Carter e outros, 2018
Carter, RW, Lee, SS, Sanford, JC, 2018. Uma visão geral das histórias independentes do cromossomo Y humano e do cromossomo mitocondrial humano. Proc. Eighth Int. Conf. Creat. Whitmore JH (ed.), pp. 131–151. http://dx.doi.org/10.15385/jpicc.2018.8.1.15 .
Google Acadêmico
Chandler e Harrison, 2012
J. Chandler , VS Harrison
Probabilidade na Filosofia da Religião , Oxford University Press , Oxford ( 2012 )
Google Acadêmico
Chen e outros, 2010
MH Chen (Ed.) , Fronteiras da Tomada de Decisão Estatística e Análise Bayesiana. Em homenagem a James O. Berger , Springer , Nova Iorque ( 2010 )
Google Acadêmico
Chiang et al., 2007
T. Chiang , D. Scholtens , D. Sarkar , R. Gentleman , W. Huber
Modelos de cobertura e erro de dados de interação proteína-proteína por análise de grafos direcionados
Genome Biol. , 9 ( 2007 ) , p. R186 , 10.1186/gb-2007-8-9-r186
Ver no Scopus Google Scholar
Coffman, 2014
J.A. Coffman
Sobre o significado do acaso na biologia
Biosemiótica , 7 ( 3 ) ( 2014 ) , pp. 377 - 388
https://doi.1007/s12304-014-9206-z
Ver no Scopus (CrossRef) Google Scholar
Colin e Urbach, 2006
H. Colin , P. Urbach
Raciocínio científico. A abordagem bayesiana.
Tribunal Aberto , Peru, IL ( 2006 )
Google Acadêmico
Collins, 2012
R. Collins
O argumento teleológico: uma exploração do ajuste fino do universo
WL Craig , JP Moreland ( Eds.) , The Blackwell Companion to Natural Theology , WileyBlackwell , Chichester ( 2012 ) , pp . 202-281
Ver no Scopus Google Scholar
Colyvan e outros, 2005
M. Colyvan , JL Garfield , G. Priest
Problemas com o argumento do ajuste fino
Synthese , 145 ( 39 ) ( 2005 ) , pp. 325-338 , 10.1007 /s11229-005-6195-0
Ver no Scopus Google Scholar
Compagno, 2018
D. Compagno (Ed.) , Lecture Notes in Morphogenesis , Springer ( 2018 ) , 10.1007/978-3-319-61593-6
Google Acadêmico
Crow e Kimura, 1970
JF Crow , M. Kimura
Uma Introdução à Teoria da Genética de Populações
The Blackburn Press , Caldwell, Nova Jersey ( 1970 )
Google Acadêmico
Csermely et al., 2010
P. Csermely , R. Palotai , R. Nussinov
Ajuste induzido, seleção conformacional e segmentos dinâmicos independentes: uma visão ampliada dos eventos de ligação.
Tendências em Bioquímica e Ciência , 35 ( 10 ) ( 2010 ) , pp. 539 - 546 , 10.1016/j.tibs.2010.04.009
Ver PDF
Ver artigo Ver no Scopus Google Scholar
Daempfle, 2016
P. Daempfle
Biologia Essencial: Uma Abordagem Aplicada
Capítulo 3.
Kendall Hunt Publishing Company ( 2016 )
Google Acadêmico
Davies, 2006
Davies, P., 2006. O Enigma de Cachinhos Dourados: Por que o Universo é Perfeito para a Vida? Houghton Mifflin Harcourt, p. ix.
Google Acadêmico
Dembski, 1998
WA Dembski
A inferência do projeto: eliminar o acaso por meio de pequenas probabilidades.
Cambridge University Press , Cambridge ( 1998 )
Google Acadêmico
Dembski, 2002
WA Dembski
Não existe almoço grátis. Por que a complexidade especificada não pode ser adquirida sem inteligência , Rowman & Littlefield ( 2002 ) , pp. 289-302
Google Acadêmico
Dembski, 2004
Dembski, WA, 2004. Ainda girando perfeitamente: uma resposta a Ken Miller: 1–12. Disponível em: http://www.arn.org/docs2/news/wd_still_spinning.htm . (Acessado em 6 de novembro de 2018).
Google Acadêmico
Dembski, 2014
WA Dembski
Ser como Comunhão: Uma Metafísica da Informação
Ashgate ( 2014 )
Google Acadêmico
Doolittle, 2012
RF Doolittle
A Evolução da Coagulação Sanguínea nos Vertebrados
Univ Science Books ( 2012 )
Google Acadêmico
Douven e Wenmackers, 2017
I. Douven , S. Wenmackers
Inferência para a melhor explicação versus a regra de Bayes em um contexto social.
Br. J. Philos. Sci. , 68 ( 2 ) ( 2017 ) , pp. 535 - 570 , 10.1093/bjps/axv025
Ver no editorVer no Scopus Google Scholar
Douven, 2017
Douven, I., 2017. Abdução. A Enciclopédia de Filosofia de Stanford (Edição de Verão de 2017). Zalta EN (ed.). https://plato.stanford.edu/archives/sum2017/entries/abduction/ .
Google Acadêmico
Dryden e outros, 2008
DT Dryden , AR Thomson , JH White
Que porção do espaço de sequências proteicas já foi explorada pela vida na Terra?
JR Soc. Interface , 5 ( 25 ) ( 2008 ) , pp. 953 - 956
Ver no editor Ver no Scopus (CrossRef) Google Scholar
Durrett, 2008
R. Durrett
Modelos de probabilidade para a evolução da sequência de DNA
Springer , Nova Iorque ( 2008 )
Google Acadêmico
Durrett e Schmidt, 2007
R. Durrett , D. Schmidt
Aguardando o aparecimento das sequências regulatórias
Ann. Appl. Prob. , 17 ( 1 ) ( 2007 ) , pp. 1 - 32 , 10.1214/105051606000000619
Ver no editorVer no Scopus Google Scholar
Durrett e Schmidt, 2008
R. Durrett , D. Schmidt
Aguardando duas mutações: com aplicações à evolução de sequências regulatórias e aos limites da evolução darwiniana.
Genética , 180 ( 2008 ) , pp. 1501-1509 , 10.1534 / genetics.107.082610
Ver no editorVer no Scopus Google Scholar
Durrett e Schmidt, 2009
R. Durrett , D. Schmidt
Resposta a Michael Behe
Genética , 181 ( 2 ) ( 2009 ) , pp. 821-822 , 10.1534 / genetics.109.100800
Ver no editorVer no Scopus Google Scholar
Durrett e outros, 2009
R. Durrett , D. Schmidt , J. Schweinsberg
Um problema de tempo de espera decorrente do estudo da carcinogênese em múltiplos estágios.
Ana. Apl. Provavelmente. , 19 ( 2 ) ( 2009 ) , pp. 676 - 718 , 10.1214/08-AAP559
Ver no Scopus Google Scholar
Edwards e outros, 2017
AJ Edwards , CF Mackenzie , PR Spackman , D. Jayatilaka , MA Spackman
Interações intermoleculares em cristais moleculares: o que há em um nome?
Faraday Discuss. , 203 ( 2017 ) , pp. 93 - 112 , 10.1039/C7FD00072C
Ver no Scopus Google Scholar
Ewert, 2014
W. Ewert
Complexidade irredutível digital: uma análise da complexidade irredutível em simulações computacionais.
BIO-Complex. , 2014 ( 1 ) ( 2014 ) , pp. 1 - 10 , 10.5048/BIO-C.2014.1
Google Acadêmico
Ewert, 2018
W. Ewert
O gráfico de dependência da vida
BIO-Complex. , 2018 ( 3 ) ( 2018 ) , pp. 1 - 27 , 10.5048/BIO-C.2018.3
Google Acadêmico
Ewert et al., 2013
Ewert, W., Marks II, RJ, Dembski, WA, 2013. Sobre a improbabilidade da complexidade algorítmica especificada. In: Simpósio do Sudeste sobre Teoria de Sistemas, IEEE, Universidade Baylor, Waco, pp. 68–70.
Google Acadêmico
Ewert et al., 2014
Ewert, W., Dembski, WA, Marks II, RJ, 2014. Complexidade Algorítmica Especificada. Em Jonathan Bartlett et al. (org.), Engenharia e o Último: Uma Investigação Interdisciplinar da Ordem e do Design na Natureza e no Artesanato. Blyth Institute Press, pp. 131–149.
Google Acadêmico
Ferrada e Wagner, 2010
E. Ferrada , A. Wagner
Inovações evolutivas e a organização das funções proteicas no espaço genotípico
PLoS One , 5 ( 11 ) ( 2010 ) , 10.1371/journal.pone.0014172
Número do artigo e14172
Google Acadêmico
Fisher, 1930
RA Fisher
A teoria genética da seleção natural , Clarendon Press , Oxford, Inglaterra ( 1930 ) , 10.5962/bhl.title.27468
Google Acadêmico
Friedrich, 2018
Friederich, S., 2018. Ajuste fino. A Enciclopédia de Filosofia de Stanford (Edição de Inverno de 2018), Edward N. Zalta (ed.). Disponível em https://plato.stanford.edu/archives/win2018/entries/fine-tuning/ .
Google Acadêmico
Gilks e outros, 1996
WR Gilks , S. Richardson , DJ Spiegelhalter (Eds.) , Markov Chain Monte Carlo in Practice , Chapman and Hall , Londres ( 1996 )
Google Acadêmico
Haldane, 1932
JB Haldane
As causas da evolução
Princeton University Press , Princeton, NJ ( 1932 )
Google Acadêmico
Hall, 2000
N. Hall (Ed.) , A Nova Química , Cambridge University Press ( 2000 )
Google Acadêmico
Harold, 2003
F. Harold
O Caminho da Célula: Moléculas, Organismos e a Ordem da Vida
Oxford University Press , Nova Iorque ( 2003 )
Google Acadêmico
Henderson, 1913
LJ Henderson
A adequação do ambiente: uma investigação sobre o significado biológico das propriedades da matéria
A Companhia Macmillan ( 1913 )
Google Acadêmico
Hoffmeyer, 1997
J. Hoffmeyer
Biosemiótica: rumo a uma nova síntese em biologia
Eur. J. Semiotic Stud. , 9 ( 2 ) ( 1997 ) , pp. 355 - 376
Google Acadêmico
Huang et al., 2016
CH Huang , TH Chen , KL Ng
Teoria dos grafos e análise de estabilidade de redes de interação de complexos proteicos
Sistema IET. Biol. , 10 ( 2 ) ( 2016 ) , pp. 64 - 75 , 10.1049/iet-syb.2015.0007
Ver no Scopus Google Scholar
Huang et al., 2019
Huang, CH, Tsai, JPJ, Kurubanjerdjit, N., Ng, KL, 2019. Análise computacional de redes moleculares usando teoria espectral de grafos, medidas de complexidade e teoria da informação (manuscrito). http://dx.doi.org/10.1101/536318 .
Google Acadêmico
Hössjer et al., 2018
Hössjer, O., Bechly, G., Gauger, A., 2018. Aproximações de distribuição do tipo fase do tempo de espera até que mutações coordenadas se fixem em uma população. Silvestrov, S., Malyarenko, A., Rancíc, M. (Eds.), Processos Estocásticos e Estruturas Algébricas - Da Teoria às Aplicações, 1. Springer, pp. 245–313. http://dx.doi.org/10.1007/978-3-030-02825-1_12 .
Google Acadêmico
Hössjer et al., 2016a
O. Hössjer , A. Gauger , C. Reeves
Modelagem genética da história humana, parte 1: Comparação das abordagens de descendência comum e origem única.
BIO-Complexidade , 2016 ( 3 ) ( 2016 ) , pp. 1-36 , 10.5048 / BIO-C.2016.3
Google Acadêmico
Hössjer et al., 2016b
O. Hössjer , A. Gauger , C. Reeves
Modelagem genética da história humana, parte 2: Um algoritmo de origem única
BIO-Complexidade , 2016 ( 4 ) ( 2016 ) , pp. 1-36 , 10.5048 / BIO-C.2016.4
Google Acadêmico
Hössjer e Gauger, 2019
O. Hössjer , A. Gauger
É possível que um único casal tenha origem humana.
BIO-Complexidade , 2019 ( 1 ) ( 2019 ) , pp. 1 - 21 , 10.5048/BIO-C.2019.1
Google Acadêmico
Iwasa e outros, 2004
Y. Iwasa , F. Michor , M. Nowak
Túneis estocásticos na dinâmica evolutiva
Genética , 166 ( 2004 ) , pp . 1571-1579
Ver no Scopus Google Scholar
Jalan, 2013
S. Jalan
Importância da aleatoriedade em redes biológicas: uma análise de matriz aleatória.
Pramana-J. Física. , 84 ( 29 ) ( 2013 ) , pp. 285 - 293
Google Acadêmico
Jones e Thornton, 1996
S. Jones , JM Thornton
Princípios das interações proteína-proteína
Proc. National Acad. Sci. USA , 93 ( 1996 ) , pp. 13 - 20 , 10.1073/pnas.93.1.13
Ver no Scopus Google Scholar
Kimura, 1979
M. Kimura
Modelo de mutações efetivamente neutras no qual a restrição seletiva é incorporada.
PNAS , 76 ( 7 ) ( 1979 ) , pp. 3440 - 3444 , 10.1073/pnas.76.7.3440
Ver no Scopus Google Scholar
Kimura, 1985
M. Kimura
O papel das mutações neutras compensatórias na evolução molecular.
J. Genetics , 64 ( 1 ) ( 1985 ) , pp. 7 - 19 , 10.1007/BF02923549
Ver no Scopus Google Scholar
Komarova et al., 2003
NL Komarova , A. Sengupta , M. Nowak
Redes de mutação-seleção na iniciação do câncer: genes supressores de tumor e instabilidade cromossômica
J. Theor. Biol. , 223 ( 4 ) ( 2003 ) , pp. 433 - 450 , 10.1016/S0022-5193(03)00120-6
Ver PDF
Ver artigo Ver no Scopus Google Scholar
Koonin, 2007
EV Koonin
O modelo cosmológico da inflação eterna e a transição do acaso para a evolução biológica na história da vida.
Biol Direct , 2007 ( 2007 ) , pp. 2-15 , 10.1186 / 1745-6150-2-15
Google Acadêmico
Koonin, 2012
EV Koonin
A Lógica do Acaso: A Natureza e a Origem da Evolução Biológica
FT Press , Upper Saddle River ( 2012 )
Google Acadêmico
Korb, 2003
KA Korb
Lógica informal Bayesiana e Falácias
Lógica Informal , 23 ( 2 ) ( 2003 ) , pp . 41-70
Google Acadêmico
Kozulic e Leisola, 2015
Kozulic, B., Leisola, M., 2015. Os cientistas já conseguiram superar as capacidades da evolução? viXra Biochemistry 1504.0130. http://vixra.org/bioch/1504 . (Acessado em 8 de novembro de 2018).
Google Acadêmico
Lehmann e Casella, 1998
EL Lehmann , G. Casella
Teoria da Estimação Pontual
( 2ª ed .) , Springer Texts em Estatística , Nova Iorque ( 1998 )
Google Acadêmico
LeMaster, 2018
JC LeMaster
O problema do tempo de espera na evolução e sugestões de como superá-lo - Uma análise crítica
BIO-Complexidade , 2018 ( 2 ) ( 2018 ) , pp. 1-9 , 10.5048 / BIO-C.2018.2
Google Acadêmico
Leslie, 1989
J. Leslie
Universos
Routledge , Londres ( 1989 )
Google Acadêmico
Lewis e Barnes, 2016
GF Lewis , LA Barnes
Um Universo Afortunado: A Vida em um Cosmos Finamente Ajustado
Cambridge University Press ( 2016 )
Google Acadêmico
Li et al., 1996
H. Li , R. Helling , C. Tang , N. Wingreen
Emergência de estruturas preferenciais em um modelo simples de enovelamento de proteínas.
Ciência , 273 ( 1996 ) , pp . 666-669
Ver no Scopus (CrossRef) Google Scholar
Liu e Ochman, 2007
R. Liu , H. Ochman
Formação gradual do sistema flagelar bacteriano
PNAS , 104 ( 17 ) ( 2007 ) , pp. 7116 - 7121 , 10.1073/pnas.0700266104
Ver no Scopus Google Scholar
Lynch e outros, 1993
Sr. Lynch , D. Burger , Açougueiro , W. Gabriel
O colapso mutacional em populações assexuadas
J. Heredity , 84 ( 5 ) ( 1993 ) , pp. 339 - 344 , 10.1093/oxfordjournals.jhered.a111354
Ver no Scopus Google Scholar
Markowetz e Spang, 2007
F. Markowetz , R. Spang
Inferência de redes celulares – uma revisão
BMC Bioinf. , 8 ( Supl. 6 ) ( 2007 ) , p. S5 , 10.1186/1471-2105-8-S6-S5
Ver no Scopus Google Scholar
Marks e outros, 2017
RJ Marks II , WA Dembski , W. Ewert
Introdução à Informática Evolutiva
World Scientific ( 2017 )
Google Acadêmico
McMullin, 1992
E. McMullin
A inferência que cria a ciência
Editora da Universidade Marquette , Milwaukee, WI ( 1992 )
Google Acadêmico
Miller, 2004
KR Miller
O flagelo desfeito: o colapso da complexidade irredutível
M. Ruse ( Ed.) , Debating Design: From Darwin to DNA , Cambridge University Press ( 2004 ) , pp . 81-97
Ver no Scopus Google Scholar
Montañez, 2018
GD Montañez
Um modelo unificado de informações específicas complexas
BIO-Complexidade , 2018 ( 4 ) ( 2018 ) , pp. 1-26 , 10.5048 / BIO-C.2018.4
Google Acadêmico
Noble, 2006
D. Noble
A Música da Vida: Biologia Além do Genoma
Oxford Univ. Press ( 2006 )
Google Acadêmico
Olofsson, 2008
P. Olofsson
Design Inteligente e Estatística Matemática: Uma Aliança Problemática
Biol. Philos. , 23 ( 4 ) ( 2008 ) , pp. 545 - 553 , 10.1007/s10539-007-9078-6
Ver no Scopus Google Scholar
Pallen e Matzke, 2006
MJ Pallen , NJ Matzke
Da origem das espécies à origem dos flagelos bacterianos.
Nat. Rev. Microbiol. , 4 ( 10 ) ( 2006 ) , pp. 784 - 790 , 10.1038/nrmicro1493
Ver no Scopus Google Scholar
Palonen, 2008
Palonen, V. (2008). Considerações Bayesianas sobre a explicação do multiverso para o ajuste fino cósmico, arXiv.org > physics > arXiv. https://arxiv.org/abs/0802.4013
Google Acadêmico
Palonen, 2017
V. Palonen
Uma linha de base Bayesiana para a crença em eventos incomuns
Eur. J. Philos. Religion , 9 ( 3 ) ( 2017 ) , pp. 159 - 175 , 10.24204/EJPR.V9I3.1909
Ver no Scopus Google Scholar
Preço, 1972
Preço GR
O 'Teorema Fundamental' de Fisher Explicado
Ana. Zumbir. Geneta. , 36 ( 2 ) ( 1972 ) , pp. 129 - 140
Ver no Scopus (CrossRef) Google Scholar
Quarteroni, 2009
A. Quarteroni
Modelos matemáticos em ciência e engenharia
Avisos da AMS , 56 ( 1 ) ( 2009 ) , pp . 10-19
Ver no Scopus Google Scholar
Ratzsch, 2010
D. Ratzsch
Há espaço para o design inteligente na filosofia da biologia: design inteligente na (filosofia da) biologia: alguns papéis legítimos
FJ Ayala , R. Arp ( Eds.) , Debates Contemporâneos em Filosofia da Biologia , Wiley-Blackwell ( 2010 ) , pp . 343-363
Google Acadêmico
Rees, 1999
Rees, M., 1999. Apenas Seis Números: As Forças Profundas que Moldam o Universo. Phoenix.
Google Acadêmico
Rosenbaum, 2010
P. Rosenbaum
Desenho de estudos observacionais
Springer , Nova Iorque ( 2010 )
Google Acadêmico
Sanford, 2008
JC Sanford
Entropia Genética e o Mistério do Genoma
( 3ª ed. ) , FMS Publications , Waterloo, Nova Iorque ( 2008 )
Google Acadêmico
Sanford e outros, 2015
Sanford, J., Brewer, W., Smith, F., Baumgardner, J. 2015. O problema do tempo de espera em uma população modelo de hominídeos. Theor. Biol. Med. Model. 12, 18. https://doi.org/10.1186/s12976-015-0016-z .
Google Acadêmico
Sanford e Carter, 2014
JC Sanford , R. Carter
À luz da genética. Adão, Eva e a Criação/Queda.
Revista de Apologética Cristã , 12 ( 2 ) ( 2014 ) , pp . 51-98
Google Acadêmico
Sarkar, 2011
S. Sarkar
A questão científica no design inteligente
Synthese , 178 ( 2 ) ( 2011 ) , pp. 291-305 , 10.1007 /s11229-009-9540-x
Ver no Scopus Google Scholar
Scholtens e outros, 2008
D. Scholtens , et al.
Estimativa do grau dos nós em grafos presa-isca
Bioinformática , 24 ( 2008 ) , pp. 218-224, 10.1093 / bioinformatics /btm565
Ver no Scopus Google Scholar
Su et al., 2018
Y. Su , C. Zhao , Z. Chen , B. Tian , Z. He
Sobre a significância estatística do complexo proteico
Biol. Quantitativa , 6 ( 4 ) ( 2018 ) , pp. 313 - 320 , 10.1007/s40484-018-0153-6
Ver no Scopus Google Scholar
Swinburne, 2012
R. Swinburne
Bayes, Deus e o Multiverso
J. Chandler , V. Harrison ( Eds.) , Probabilidade na Filosofia da Religião , Oxford University Press ( 2012 ) , pp . 103-126
Crossref Google Scholar
Tan, 2015
CL Tan
Utilizando genes essenciais taxonomicamente restritos para determinar se dois organismos podem pertencer à mesma árvore genealógica.
Respostas Res. J. , 8 ( 2015 ) , pp. 413 - 435
Ver no Scopus Google Scholar
Tan, 2016
CL Tan
Grandes lacunas e pontes curtas: um modelo para resolver o problema da descontinuidade.
Respostas Res. J. , 9 ( 2016 ) , pp. 149 - 162
Crossref Google Scholar
Templeton, 1994
JM Templeton (Ed.) , Evidências de Propósito. Cientistas Descobrem o Criador , Continuum Publishing Company , NY ( 1994 )
Google Acadêmico
Thorvaldsen e Øhrstrøm, 2013
S. Thorvaldsen , P. Øhrstrøm
O paradoxo intrigante de Darwin: o design inteligente na natureza.
Perspect. Biol. Med. , 56 ( 1 ) ( 2013 ) , pp. 78 - 98 , 10.1353/pbm.2013.0000
Ver no Scopus Google Scholar
Tugrul e outros, 2015
M. Tugrul , T. Paixão , NH Barton , G. Tkacik
Dinâmica da evolução do sítio de ligação do fator de transcrição
PLoS Genet. , 11 ( 11 ) ( 2015 ) , Artigo e1005639 , 10.1371/journal.pgen.1005639
Ver no Scopus Google Scholar
Voie, 2006
Ø.A. Voie
A função biológica e o código genético são interdependentes.
Caos, Sólitons Fractais , 28 ( 4 ) ( 2006 ) , pp. 1000-1004 , 10.1016 /j.chaos.2005.08.146
Ver PDF
Ver artigo Ver no Scopus Google Scholar
Walton, 2001
D. Walton
Argumentos abdutivos, presuntivos e plausíveis
Lógica Informal , 21 ( 2 ) ( 2001 ) , pp . 141-169
https://doi.org/10.22329/il.v21i2.2241
Google Acadêmico
Wichmann e Ardern, 2019
S. Wichmann , Z. Ardern
A otimalidade no código genético padrão é robusta em relação a conjuntos de códigos de comparação.
Biossistemas , 185 ( 2019 ) , Artigo 104023 , 10.1016/j.biosystems.2019.104023
Ver PDF
Ver artigo Ver no Scopus Google Scholar
Wilkins e Elsberry, 2001
JS Wilkins , WR Elsberry
As vantagens do roubo sobre o trabalho árduo: a inferência do projeto e o argumento da ignorância.
Bio Philos. , 16 ( 5 ) ( 2001 ) , pp. 711 - 724 , 10.1023/A:1012282323054
Google Acadêmico
Testamentos, 2016
Testamentos de Relações Públicas
O DNA como informação
Phil. Trans. R. Soc. A , 374 ( 2016 ) , 10.1098/rsta.2015.0417
Google Acadêmico
Zhang et al., 2014
Jian Zhang , Fan Zheng , Gevorg Grigoryan
Projeto e capacidade de projeto de conjuntos baseados em proteínas
Curr. Opin. Struct. Biol. , 27 ( 2014 ) , pp. 79 - 86 , 10.1016/j.sbi.2014.05.009
Ver PDF
Ver artigo Ver no Scopus Google Scholar

Citado por (13)

Capacidades causais da teleologia e da teleonomia na vida e na evolução
2023, Organon F
Às vezes, o tamanho não importa.
2023, Fundamentos da Física
Avaliando, testando e estimando o grau de ajuste fino por meio de informações ativas.
2022, Entropia
Uma estrutura formal para aquisição de conhecimento: indo além do aprendizado de máquina.
2022, Entropia
O ajuste cosmológico é fino ou grosseiro?
2021, Revista de Cosmologia e Física de Astropartículas
A Estratégia do Esquilo: Vantagens de sobrevivência da percepção de intenção baseada em artefatos
2021, Icaart 2021 Anais da 13ª Conferência Internacional sobre Agentes e Inteligência Artificial

Brasil Pensa

Pesquisar este blog