Reflexões sobre ancestralidade do ser humano com chimpanzés

 1 - https://pmc.ncbi.nlm.nih.gov/articles/PMC129726/


"Resumo

Cinco sequências de cromossomos artificiais bacterianos (BAC) de chimpanzés (descritas no GenBank) foram comparadas com as melhores regiões correspondentes da sequência do genoma humano para avaliar a quantidade e o tipo de divergência de DNA. A conclusão é que o velho ditado de que compartilhamos 98,5% de nossa sequência de DNA com o chimpanzé provavelmente está errado. Para esta amostra, uma estimativa melhor seria que 95% dos pares de bases são exatamente compartilhados entre o DNA do chimpanzé e o humano.

Nesta amostra de 779 kb, a divergência devido à substituição de base é de 1,4%, e há uma diferença adicional de 3,4% devido à presença de indels. As lacunas no alinhamento estão presentes em quantidades aproximadamente iguais nas sequências do chimpanzé e do humano. Elas ocorrem igualmente em sequências repetidas e não repetidas, conforme detectado pelo repeatmasker ( http://ftp.genome.washington.edu/RM/RepeatMasker.html )"


2 - https://answersresearchjournal.org/how-genomes-sequenced/


"Nos primórdios da biotecnologia, tornou-se aparente que humanos, macacos e outros mamíferos compartilhavam sequências de proteínas muito semelhantes. Na verdade, muitas proteínas humanas exibem alta similaridade de aminoácidos em táxons de macacos e mamíferos não primatas (Clamp et al. 2007).

Uma das principais questões de preocupação em vários estudos evolutivos é que a maioria dos cientistas só leva em consideração similaridades entre sequências biológicas presentes em humanos e macacos que são pré-selecionadas e já consideradas semelhantes em algum nível.

Além disso, sequências de DNA que não se alinham bem são frequentemente descartadas ou lacunas podem não ser contabilizadas em análises de alinhamento.

Outra consideração importante é se um produto genômico expresso está fazendo a mesma coisa em humanos que faz em macacos e é expresso da mesma forma? Esses fatores geralmente não recebem o reconhecimento adequado.

A maioria do público e da comunidade científica não está ciente dessas advertências e ainda é informada de que o genoma humano é 98 a 99% semelhante ao do chimpanzé, o que provavelmente não é o caso. O fato é que grandes diferenças entre a estrutura dos genomas humano e do chimpanzé estão sendo documentadas à medida que os recursos genômicos melhoram."


3 - https://creation.com/human-chimp-dna-similarity-re-evaluated-portuguese





"O genoma do chimpanzé no seu estado final anotado e montado é, claramente, um produto tendencioso.

Além disso, quase todos os relatórios de investigação sobre a semelhança entre o ADN do ser humano e do chimpanzé omitem quantidades significativas de dados que não alinham ou representam espaçamentos na sequência.

Efetivamente, um número significativo de artigos nem sequer inclui dados suficientes para permitir a um leitor independente a capacidade de contabilizar a quantidade de dissemelhança original que existia antes de serem apresentados os números finais, altamente filtrados.

No que diz respeito a uma estimativa da semelhança entre o genoma do ser humano e do chimpanzé a partir de dados apresentados (mas muitas vezes enterrados) em relatórios publicados, é seguro afirmar que não é mais de 81 a 87% e muito possivelmente inferior.".


"Corroborando esta conclusão, um projeto de investigação em grande escala de comparação entre o genoma humano e do chimpanzé foi recentemente publicado numa revista separada.39 Este estudo fundamenta e confirma totalmente os dados apresentados neste relatório. Nesse estudo, o autor, Tomkins, relata os dados de alinhamento de pares de 40.000 sequências genómicas aleatórias de chimpanzé em comparação com quatro versões diferentes do genoma humano utilizando o algoritmo blastn corrido em 30 combinações de parâmetros diferentes. Este esforço produziu um total de 1,2 milhões de tentativas de alinhamentos — 4,8 milhões se contabilizarmos as quatro montagens diferentes do genoma humano. Excluindo os dados relativos à grande quantidade da sequência do chimpanzé que não alinhou, Tomkins relatou uma estimativa muito conservadora da semelhança entre o ADN do ser humano e do chimpanzé apenas nas regiões alinhadas de 86 a 89% (em função dos parâmetros do algoritmo). Os resultados deste estudo extenso e muito objetivo indicam, inequivocamente, que os genomas humano e do chimpanzé são pelo menos 10 a 12% menos idênticos do que frequentemente se reclama. O paradigma do antepassado comum do ser humano e do chimpanzé, que reivindica um conteúdo de ADN praticamente idêntico, baseia-se, claramente, mais em mitos e propaganda do que em dados factuais reais."



"Um dos principais problemas com a investigação geral no domínio da genética comparativa, tal como iremos mostrar, é que na maioria dos estudos existe uma grande quantidade de seleção prévia aplicada às amostras e dados biológicos disponíveis antes da realização da análise final. Só os dados mais promissores de um grupo maior são geralmente extraídos para uma análise final. É evidente que’só podemos comparar aquilo que sabemos ser altamente comparável, caso contrário não existe comparação de sequências disponível na maioria dos casos. Os dados de sequências biológicas passam frequentemente por vários níveis de pré-seleção, filtragem e seleção antes de serem resumidos e discutidos. As regiões e os espaçamentos não alinháveis nos alinhamentos de sequências’são muitas vezes omitidos nos resultados finais ou o seu impacto é obscurecido. Tal como discutido abaixo, isto pode ser feito de várias formas e deve ser avaliado numa base caso a caso relativamente a cada estudo publicado."











4 - https://academic.oup.com/mbe/article/24/10/2266/1072057




"Resumo

O genoma humano é um mosaico com relação à sua história evolutiva. Com base em uma análise filogenética de 23.210 alinhamentos de sequências de DNA de humanos, chimpanzés, gorilas, orangotangos e rhesus, apresentamos um mapa da ancestralidade genética humana.

Para cerca de 23% do nosso genoma, não compartilhamos ancestralidade genética imediata com nosso parente vivo mais próximo, o chimpanzé. Isso abrange genes e exons na mesma extensão que regiões intergênicas. Concluímos que cerca de 1/3 dos nossos genes começaram a evoluir como linhagens específicas de humanos antes que a diferenciação de humanos, chimpanzés e gorilas ocorresse.

Isso explica descobertas recorrentes de características morfológicas específicas de humanos muito antigas no registro fóssil, que antecedem o surgimento recente da espécie humana cerca de 5-6 MYA. Além disso, a classificação desses polimorfismos fenotípicos ancestrais em eventos de especiação subsequentes fornece uma explicação parcimoniosa do porquê características derivadas da evolução são compartilhadas entre espécies que não são parentes mais próximos umas das outras."
- Para cerca de 23% do nosso genoma, não compartilhamos ancestralidade genética imediata com nosso parente vivo mais próximo, o chimpanzé.



5 - https://www.nature.com/articles/nature04072





"Restrição evolutiva em sítios de aminoácidos dentro da linhagem hominídea. No geral, os genes humanos e de chimpanzés são extremamente semelhantes, com as proteínas codificadas idênticas nas duas espécies em 29% dos casos."

"
  • Há diferenças notáveis ​​na taxa de inserções de elementos transponíveis: elementos intercalados curtos (SINEs) foram três vezes mais ativos em humanos, enquanto os chimpanzés adquiriram duas novas famílias de elementos retrovirais.

  • Proteínas ortólogas em humanos e chimpanzés são extremamente semelhantes, com cerca de 29% sendo idênticas e o ortólogo típico diferindo em apenas dois aminoácidos, um por linhagem."



(Minha consideração): Parece-me uma forma de esconder o fato de que são, portanto, diferentes em 71% dos casos.

"Sob a suposição de que mutações sinônimas são seletivamente neutras, os resultados implicam que 77% das alterações de aminoácidos em genes de hominídeos são suficientemente deletérias para serem eliminadas pela seleção natural. Como mutações sinônimas não são inteiramente neutras (veja abaixo), a proporção real de alterações de aminoácidos com consequências deletérias pode ser maior."

(Minha consideração): Parece-me uma forma de usar positivamente uma informação devastadora e contrária à evolução - mais de 77% das alterações em aminoácidos em genes de hominídeos são deletérias (e aí eles induzem o leitor à conclusão de que isso seria eliminado pela seleção natural - enxergo isso como condição de que algo referente à TDE - Teoria da Degeneração das Espécies - pode ter grande evidência).





6 - https://www.semanticscholar.org/paper/Documented-Anomaly-in-Recent-Versions-of-the-BLASTN-Tomkins/a1a703d9600ea482cc7075161d4218ce038c6f45


  • ID do corpus: 51773215

Anomalia documentada em versões recentes do algoritmo BLASTN e uma reanálise completa da similaridade do DNA do genoma humano e do chimpanzé usando Nucmer e LASTZ

  • J. Tomkins
  • Publicado em 2015 
  • Biologia, Ciência da Computação
As análises com BLASTN v 2.2.2.25+ e nucmer indicam que as porções alinháveis ​​da montagem atual do genoma do chimpanzé são 88% semelhantes, em média, ao humano, enquanto o algoritmo LASTZ retornou apenas uma similaridade geral média de 73%








por Publicado em 
Revista de Pesquisa Answers 8 (2015): 379–390.


"Chegou ao conhecimento deste autor que versões recentes do algoritmo BLASTN empregadas como uma instalação local podem estar omitindo níveis significativos de sequências de consulta em pesquisas genômicas em larga escala. Esta alegação afeta potencialmente os resultados de pesquisas anteriores feitas por este autor, particularmente em relação à similaridade de DNA humano-chimpanzé. "











"Uma alegação evolucionária comum é que o DNA dos chimpanzés ( Pan troglodytes ) e dos humanos ( Homo sapiens ) são quase idênticos, apesar do fato de que existe um vasto abismo de diferenças fenotípicas. Essa alegação simplificada demais foi até questionada por alguns evolucionistas, como Todd Preuss, que recentemente declarou: "Agora está claro que as diferenças genéticas entre humanos e chimpanzés são muito mais extensas do que se pensava anteriormente; seus genomas não são 98 ou 99% idênticos" (Preuss 2012). Na estimativa de Preuss, no entanto, as regiões alinháveis ​​dos genomas são, em média, cerca de 96% semelhantes.

Conforme observado em vários relatórios recentes, um dos principais problemas com pesquisas evolutivas passadas em análise comparativa de DNA entre chimpanzés e humanos é que uma grande quantidade de análise preferencial e seletiva de dados foi empregada (Bergman e Tomkins 2012; Tomkins e Bergman 2012). Em todos os estudos examinados por Tomkins e Bergman, apenas os dados mais evolutivamente favoráveis, como sequências ricas em genes e outras regiões altamente alinháveis ​​que existem em ambas as espécies, são utilizados, frequentemente após vários níveis de filtragem de dados para homogeneidade de sequência. Além disso, regiões não alinháveis ​​e grandes lacunas em alinhamentos de sequência de DNA são tipicamente omitidas, aumentando assim os níveis de similaridade relatados."




"A principal publicação sobre o genoma do chimpanzé e sua comparação com o humano foi o artigo de 2005 do Chimpanzee Genome Sequencing Consortium (The Chimpanzee Sequencing and Analysis Consortium 2005). Infelizmente, este artigo teve vários problemas importantes de preocupação. O primeiro problema a ser observado foi o fato de que as sequências individuais de shotgun do chimpanzé foram montadas usando o genoma humano como uma estrutura de referência. Curiosamente, os pesquisadores também realizaram uma montagem de novo (sem um genoma de referência) usando um algoritmo diferente daquele usado para relatar os resultados no artigo, mas não empregaram essa montagem para os estudos comparativos usados ​​no relatório. Os dados comparativos com humanos utilizaram a montagem mais semelhante à humana e foram feitos de uma maneira altamente seletiva e ofuscada usando parâmetros de algoritmo que omitiram sequências não semelhantes. No geral, a bioinformática tendeu a se concentrar principalmente em análises evolutivas hipotéticas para várias taxas de divergência e forças seletivas supostamente operando em regiões homólogas altamente semelhantes. No entanto, dados suficientes do projeto genoma do chimpanzé de 2005 estavam disponíveis para permitir estimativas ad hoc aproximadas da similaridade geral do genoma quando comparadas às estatísticas da montagem humana de sua época, nas quais Tomkins e Bergman (2012) derivaram uma similaridade geral de 81%, que incluía substituições, inserções e exclusões relatadas, e a quantidade de sequência não alinhável ao humano. O geneticista Richard Buggs adotou uma abordagem um tanto semelhante e chegou a uma estimativa ainda menor de cerca de 72% de similaridade geral (Buggs 2008)." [Por que esta última parte não é mais encontrada nas citações/estudo de Richard Buggs? Creio que, provavelmente, ele retirou as citações/estudos a respeito após alguma pressão, mas não há como, até o momento, verificar isso. Pode ter ocorrido que o autor tenha confundido o local de pesquisa com alguma página que estivesse aberta em seu computador, também. De qualquer forma, o que aparece atualmente é:]





A continuação do material mostra que a referência a Richard Buggs, ainda que não mais encontrada (até o momento em que pude pesquisar), em nada interfere no material.




"Essas estimativas ad hoc de uma similaridade genômica muito menor entre chimpanzés e humanos pareciam ter múltiplas fontes de suporte empírico. Durante uma fase inicial do projeto de sequenciamento do genoma do chimpanzé, três milhões de leituras individuais foram consultadas em relação ao genoma humano e os pesquisadores relataram que apenas "cerca de dois terços puderam ser alinhados de forma inequívoca às sequências de DNA em humanos" (Ebersberger et al. 2002). O terço que não pôde ser alinhado "de forma inequívoca" era altamente repetitivo (tinha muitas correspondências) ou não se alinhava de forma alguma. Em outro estudo, os pesquisadores extraíram 10.000 segmentos de 30 bases aleatoriamente de cada cromossomo de chimpanzé montado e então compararam cada fragmento com seu homólogo de cromossomo humano e só alcançaram uma média de cerca de 66% de similaridade para todos os cromossomos (Cosmo 2012). Então, em 2013, este autor realizou um alinhamento abrangente de cada cromossomo do chimpanzé com seu equivalente humano usando tamanhos de fatias de sequência otimizados e o algoritmo BLASTN (v2.2.27+) e alcançou uma similaridade média geral do genoma de cerca de 70% — em concordância geral com os esforços anteriores mencionados anteriormente (Tomkins 2013).

Em 2013, a questão da similaridade geral do genoma entre chimpanzés e humanos parecia ser de cerca de 70% com base em cinco relatórios diferentes, três dos quais eram baseados em análises de dados reais. No entanto, em 2014, um programador de computador de algoritmos de negociação financeira descobriu um bug aparente no algoritmo BLASTN e notificou este autor da situação (Glenn Williamson, Tibra Capital, comunicação pessoal)."

[A referência a Richard Buggs, no entanto, foi apenas uma entre outras, não prejudicando o estudo independente deste material e de outro que se referiu a ele, como veremos.]

No site abaixo, chega-se a citar o conteúdo do trabalho de Buggs, mostrando que realmente existia, mas que por algum motivo, foi retirado:

https://answersresearchjournal.org/chimpanzee-and-human-chromosomes/




E a mesma referência é utilizada, ou seja, provavelmente o material foi retirado e substituído:




"Curiosamente, o geneticista Richard Buggs adotou uma abordagem ainda mais rigorosa ao calcular a similaridade do DNA em todo o genoma usando dados do relatório do genoma do chimpanzé de 2005 e do projeto genoma humano em uma breve reportagem publicada em 2008. Como as estimativas de Buggs correspondem muito ao resultado deste estudo, seu trabalho é citado abaixo.

Para comparar os dois genomas, a primeira coisa que precisamos fazer é alinhar as partes de cada genoma que são semelhantes. Quando fazemos esse alinhamento, descobrimos que apenas 2.400 milhões das 3.164,7 milhões de “letras” do genoma humano se alinham com o genoma do chimpanzé — ou seja, 76% do genoma humano. Alguns cientistas argumentaram que os 24% do genoma humano que não se alinham com o genoma do chimpanzé são “DNA lixo” inúteis. No entanto, agora parece que esse DNA pode conter mais de 600 genes codificadores de proteínas e também codificar moléculas de RNA funcionais.

Olhando de perto para os 76% do genoma humano, semelhantes aos dos chimpanzés, descobrimos que, para fazer um alinhamento exato, muitas vezes temos que introduzir lacunas artificiais no genoma humano ou do chimpanzé. Essas lacunas dão outra diferença de 3%. Então, agora temos uma similaridade de 73% entre os dois genomas.

Nas sequências nitidamente alinhadas, agora encontramos outra forma de diferença, onde uma única “letra” é diferente entre os genomas humano e do chimpanzé. Isso fornece outra diferença de 1,23% entre os dois genomas. Assim, a diferença percentual está agora em torno de 72%.

Também encontramos lugares onde dois pedaços do genoma humano se alinham com apenas um pedaço do genoma do chimpanzé, ou dois pedaços do genoma do chimpanzé se alinham com um pedaço do genoma humano. Essa “variação do número de cópias” causa outra diferença de 2,7% entre as duas espécies. Portanto, a similaridade total dos genomas pode ser abaixo de 70%.

Esta figura não inclui diferenças na organização dos dois genomas. No momento, não podemos avaliar completamente a diferença na estrutura dos dois genomas, porque o genoma humano foi usado como um modelo (ou “andaime”) quando o genoma de rascunho do chimpanzé foi montado (Buggs 2008)."


Utilizando Google Tradutor:

"To compare the two genomes, the first thing we need to do is align the parts of each genome that are similar. When we do this alignment, we find that only 2.4 billion of the 3.164.7 billion “letters” in the human genome align with the chimpanzee genome—that’s 76 percent of the human genome. Some scientists have argued that the 24 percent of the human genome that doesn’t align with the chimpanzee genome is useless “junk DNA.” However, it now appears that this DNA may contain over 600 protein-coding genes and also encode functional RNA molecules.

Looking closely at the 76 percent of the human genome that is similar to the chimpanzee genome, we find that in order to make an accurate alignment, we often have to introduce artificial gaps into either the human or chimpanzee genome. These gaps add up to another 3 percent difference. So now we have a 73 percent similarity between the two genomes.

In the clearly aligned sequences, we now find another form of difference, where a single “letter” is different between the human and chimpanzee genomes. This provides another 1.23% difference between the two genomes. Thus, the percentage difference is now around 72%.

We also find places where two pieces of the human genome align with only one piece of the chimpanzee genome, or two pieces of the chimpanzee genome align with one piece of the human genome. This “copy number variation” causes another 2.7% difference between the two species. Therefore, the overall similarity of the genomes may be below 70%.

This figure does not include differences in the organization of the two genomes. At present, we cannot fully assess the difference in the structure of the two genomes, because the human genome was used as a template (or “scaffold”) when the draft chimpanzee genome was assembled (Buggs 2008)."


Utilizando Deepl:



"To compare the two genomes, the first thing we need to do is align the parts of each genome that are similar. When we do this alignment, we find that only 2,400 million of the 3,164.7 million “letters” in the human genome align with the chimpanzee genome - that is, 76% of the human genome. Some scientists have argued that the 24% of the human genome that doesn't line up with the chimp genome is useless “junk DNA”. However, it now appears that this DNA may contain more than 600 protein-coding genes and also encode functional RNA molecules.

Looking closely at the 76% of the human genome that is similar to that of chimpanzees, we discovered that in order to make an exact alignment, we often have to introduce artificial gaps into the human or chimpanzee genome. These gaps give another 3% difference. So now we have a similarity of 73% between the two genomes.

In the clearly aligned sequences, we now find another form of difference, where a single “letter” is different between the human and chimp genomes. This gives another difference of 1.23% between the two genomes. So the percentage difference is now around 72%.

We also found places where two pieces of the human genome line up with just one piece of the chimpanzee genome, or two pieces of the chimpanzee genome line up with one piece of the human genome.

This “copy number variation” causes another 2.7% difference between the two species.Therefore, the total similarity of the genomes may be below 70%.

This figure does not include differences in the organization of the two genomes. At the moment, we cannot fully assess the difference in the structure of the two genomes, because the human genome was used as a template (or “scaffold”) when the draft chimpanzee genome was assembled (Buggs 2008)."

Encontrei, então, uma possível fala dele informando onde encontrar o que escreveu:


E o local para pesquisar:




Percebam que a fonte é exatamente a mesma informada nos materiais: Reformatorisch Dagblad

https://www.digibron.nl/viewer/collectie/Digibron/id/tag:RD.nl,20081206:newsml_2c141fadc037a7c73051c3379be2ff4a








"

70% Chimpanzé?

3 minutos de tempo de leitura  Desativar hachura

Recentemente escrevi aqui sobre a diferença genética entre humanos e chimpanzés. Isso provou ser mais controverso do que eu esperava. Várias pessoas me enviaram e-mails para fazer perguntas ou me dizer que estou errado. Hoje vou revisitar esse tópico para esclarecer algumas coisas.

O meu ponto principal foi que agora sabemos que a diferença genética entre humanos e chimpanzés é muito maior do que pensávamos. Nossos genomas não são 99% iguais aos genomas dos chimpanzés. Há apenas alguns meses, uma importante revista científica disse isto numa reportagem intitulada "Diferenças relativas: O mito de 1%" (Science 316:1836).

Este relatório destacou um estudo recente que mostra que 6,4% de todos os genes no genoma humano não têm contrapartes muito semelhantes no genoma do chimpanzé (Demuth et al, PLoS ONE 1: e85). Ele também citou o rascunho do genoma do chimpanzé que mencionei em meu artigo anterior (Nature 437:69-87) e declarou como os autores deste estudo alinharam 2,4 bilhões de bases do genoma humano com o genoma do chimpanzé e encontraram uma proporção de 1,23. % de diferença em polimorfismos de nucleotídeo único (SNPs) e uma diferença de 3% em inserções/deleções (indels).

Tendo em conta estas estatísticas, é factualmente incorrecto dizer que os humanos são 99% iguais aos chimpanzés. No entanto, ainda no mês passado, o Museu de História Natural de Londres e a University of Chicago Press, nos EUA, publicaram um livro intitulado “99% Ape: How Evolution Addup”. Este título enganoso foi sem dúvida escolhido por um guru de marketing e não pelo editor, que é um cientista respeitável e distinto em ecologia evolutiva vegetal (a área na qual fiz minha pesquisa de doutorado)

Essa promoção do "mito de 1%" ao público como evidência da evolução é provavelmente o motivo pelo qual alguns não-cientistas sugeriram na internet que meu artigo anterior, dissipando esse mito, é de alguma forma um golpe mortal para a evolução - não é . Meu artigo sobre chimpanzés foi um passo além do relatório da Science. Peguei a quantidade do genoma do chimpanzé que foi alinhado com o genoma humano (2,4 bilhões de bases) e dividi pelo tamanho do genoma humano (3,16 bilhões de bases), para descobrir que apenas 76% do genoma humano mostra o 1,23% de SNP e 3% de diferenças de indel (ver acima). Usando estes números, e citando uma variação de 2,7% no número de cópias entre as duas espécies (Nature 437:88-93), defendi uma semelhança total de cerca de 70%.

Esta é uma estimativa conservadora do que podemos ter certeza de que é semelhante. Como todas as estimativas, faz suposições. A principal questão aqui é que as partes do genoma do chimpanzé que não se alinham com o genoma humano são diferentes do genoma humano. Em geral, isto é obviamente verdade - apenas sequências semelhantes podem ser alinhadas - mas é possível que o procedimento complexo através do qual os cientistas alinharam os dois genomas possa ter feito com que algumas sequências semelhantes não fossem incluídas. Além disso, os 4% do genoma do chimpanzé que ainda não foi sequenciado, ou porções que não foram sequenciadas com precisão, também podem revelar alguma semelhança com o genoma humano. Isso poderia aumentar a similaridade geral em alguns por cento, mas prevejo que quando tivermos um genoma completo e confiável do chimpanzé, a similaridade geral do genoma humano será próxima de 70% (e muito longe de 99%).

O autor é geneticista pesquisador da Universidade da Flórida"





https://www.digibron.nl/viewer/collectie/Digibron/id/tag:RD.nl,20081011:newsml_aa4ea926b26e85db10529970cc88ffad



"

Chimpanzee?

3 minuten leestijd  Arcering uitzetten

From 1964 to 2004, it was believed that humans are almost identical to apes at the genetic level. Ten years ago, we thought that the information coded in our DNA is 98.5% the same as that coded in chimpanzee DNA. This led some scientists to claim that humans are simply another species of chimpanzee. They argued that humans did not have a special place in the world, and that chimpanzees should have the same 'rights' as humans.

Other scientists took a different view. They said that it is obvious that we are very different from chimpanzees in our appearance and way of life: if we are almost the same as chimpanzees in our DNA sequence, this simply means that DNA sequence is the wrong place to look in trying to understand what makes humans different. By this view, the 98.5% figure does not undermine the special place of humans. Instead it undermines the importance of genetics in thinking about what it means to be a human.

Fortunately (for both the status of human beings and the status of genetics) we now know that the 98.5% figure is very misleading. In 2005 scientists published a draft reading of the complete DNA sequence (genome) of a chimpanzee. When this is compared with the genome of a human, we find major differences.

To compare the two genomes, the first thing we must do is to line up the parts of each genome that are similar. When we do this alignment, we discover that only 2400 million of the human genome's 3164.7 million 'letters' align with the chimpanzee genome - that is, 76% of the human genome. Some scientists have argued that the 24% of the human genome that does not line up with the chimpanzee genome is useless "junk DNA". However, it now seems that this DNA could contain over 600 protein-coding genes, and also code for functional RNA molecules.

Looking closely at the chimpanzee-like 76% of the human genome, we find that to make an exact alignment, we often have to introduce artificial gaps in either the human or the chimp genome. These gaps give another 3% difference. So now we have a 73% similarity between the two genomes.

In the neatly aligned sequences we now find another form of difference, where a single 'letter' is different between the human and chimp genomes. These provide another 1.23% difference between the two genomes. Thus, the percentage difference is now at around 72%.

We also find places where two pieces of human genome align with only one piece of chimp genome, or two pieces of chimp genome align with one piece of human genome. This "copy number variation" causes another 2.7% difference between the two species. Therefore the total similarity of the genomes could be below 70%.

This figure does not take include differences in the organization of the two genomes. At present we cannot fully assess the difference in structure of the two genomes, because the human genome was used as a template (or "scaffold") when the chimpanzee draft genome was assembled.

Our new knowledge of the human and chimpanzee genomes contradicts the idea that humans are 98% chimpanzee, and undermines the implications that have been drawn from this figure. It suggests that there is a huge amount exciting research still to be done in human genetics.

The author is a research geneticist at the University of Florida."




"

Chimpanzé?

3 minutos de tempo de leitura  Desativar hachura

De 1964 a 2004, acreditava-se que os humanos eram quase idênticos aos macacos no nível genético. Há dez anos, pensávamos que a informação codificada no nosso ADN era 98,5% igual à codificada no ADN do chimpanzé. Isto levou alguns cientistas a afirmar que os humanos são simplesmente outra espécie de chimpanzé. Eles argumentaram que os humanos não ocupavam um lugar especial no mundo e que os chimpanzés deveriam ter os mesmos “direitos” que os humanos.

Outros cientistas tiveram uma visão diferente. Eles disseram que é óbvio que somos muito diferentes dos chimpanzés na nossa aparência e modo de vida: se somos quase iguais aos chimpanzés na nossa sequência de ADN, isso significa simplesmente que a sequência de ADN é o local errado para olhar na tentativa de compreender o que torna os humanos diferentes. Segundo esta visão, o número de 98,5% não prejudica o lugar especial dos seres humanos. Em vez disso, mina a importância da genética na reflexão sobre o que significa ser humano.

Felizmente (tanto para o estatuto dos seres humanos como para o estatuto da genética) sabemos agora que o número de 98,5% é muito enganador. Em 2005, os cientistas publicaram um rascunho da sequência completa do DNA (genoma) de um chimpanzé. Quando isto é comparado com o genoma de um ser humano, encontramos grandes diferenças.

Para comparar os dois genomas, a primeira coisa que devemos fazer é alinhar as partes de cada genoma que são semelhantes. Quando fazemos este alinhamento, descobrimos que apenas 2.400 milhões dos 3.164,7 milhões de “letras” do genoma humano se alinham com o genoma do chimpanzé – ou seja, 76% do genoma humano. Alguns cientistas argumentaram que os 24% do genoma humano que não se alinham com o genoma do chimpanzé são "DNA lixo" inútil. No entanto, parece agora que este ADN pode conter mais de 600 genes codificadores de proteínas e também codificar moléculas funcionais de ARN.

Olhando atentamente para 76% do genoma humano semelhante ao do chimpanzé, descobrimos que, para fazer um alinhamento exato, muitas vezes temos de introduzir lacunas artificiais no genoma humano ou no genoma do chimpanzé. Essas lacunas dão outra diferença de 3%. Portanto, agora temos uma semelhança de 73% entre os dois genomas.

Nas sequências perfeitamente alinhadas encontramos agora outra forma de diferença, onde uma única “letra” é diferente entre os genomas humano e do chimpanzé. Estes fornecem outra diferença de 1,23% entre os dois genomas. Assim, a diferença percentual ronda agora os 72%.

Também encontramos locais onde dois pedaços do genoma humano se alinham com apenas um pedaço do genoma do chimpanzé, ou dois pedaços do genoma do chimpanzé se alinham com um pedaço do genoma humano. Esta “variação no número de cópias” causa outra diferença de 2,7% entre as duas espécies. Portanto, a similaridade total dos genomas poderia ser inferior a 70%.

Este número não inclui diferenças na organização dos dois genomas. Actualmente não podemos avaliar completamente a diferença na estrutura dos dois genomas, porque o genoma humano foi utilizado como modelo (ou "andaime") quando o esboço do genoma do chimpanzé foi montado.

O nosso novo conhecimento dos genomas humanos e dos chimpanzés contradiz a ideia de que os humanos são 98% chimpanzés e mina as implicações que foram extraídas deste número. Isso sugere que ainda há uma enorme quantidade de pesquisas interessantes a serem feitas em genética humana.

O autor é geneticista pesquisador da Universidade da Flórida."





O genoma humano é quase idêntico ao do chimpanzé? — uma reavaliação da literatura


https://www.icr.org/article/wide-alignment-similarity-identity


"O uso de mascaramento de sequência de baixa complexidade teve o efeito de diminuir o tempo computacional em cerca de 5–6 vezes, alongando os alinhamentos ligeiramente, diminuindo o número de acessos ao banco de dados e diminuindo ligeiramente a porcentagem de identidade de nucleotídeos. Dependendo da combinação de parâmetros BLASTN, a identidade média da sequência para os 30 experimentos separados entre humanos e chimpanzés variou entre 86 e 89%. O comprimento médio da sequência de consulta do chimpanzé foi de 740 bases e, dependendo da combinação de parâmetros BLASTN, o comprimento médio do alinhamento variou entre 121 e 191 bases."


"As sequências de chimpanzés foram posteriormente implicadas por correspondência pessoal com a equipe do NCBI e dados de apoio deste estudo para serem pré-selecionadas para algum nível de homologia com o genoma humano. No entanto, excluindo dados para a grande quantidade de sequência de chimpanzés que não se alinharam, uma estimativa muito conservadora da similaridade do DNA humano-chimpanzé em todo o genoma é de 86–89%. Os resultados deste estudo indicam inequivocamente que os genomas humano e do chimpanzé são pelo menos 10–12% menos idênticos do que é comumente alegado. Esses resultados estão mais claramente alinhados com as grandes diferenças anatômicas e comportamentais observadas entre humanos e chimpanzés."





"Em um próximo artigo, Tomkins e Bergman (2012) discutem a maioria dos principais artigos de pesquisa sobre similaridade de DNA entre humanos e chimpanzés caso a caso e mostram que a inclusão de dados descartados (quando fornecidos) na verdade sugere uma similaridade de DNA para humanos e chimpanzés não maior que 80–87% e possivelmente até menos. Listados abaixo estão breves análises de três artigos-chave de comparação de genoma evolucionário entre humanos e chimpanzés que fornecem dados que são consistentes com os resultados obtidos no presente estudo. Para uma revisão de literatura mais completa sobre este assunto, veja Tomkins e Bergman (2012).

Uma das primeiras publicações a comparar grandes regiões do genoma do chimpanzé com o humano foi o laboratório de Britten em 2002 usando um programa de computador Fortran interno. O estudo foi baseado em cinco grandes fragmentos de DNA (clones BAC) de chimpanzés conhecidos por serem homólogos ao humano que foram completamente sequenciados. O comprimento total da sequência de DNA para todos os 5 BACs foi de 846.016 bases, mas apenas 92% do DNA alinhado ao humano e o artigo relatou apenas 779.132 bases. O alinhamento com inserções e deleções (indels) indicou uma similaridade humano-chimpanzé de 95% (Britten 2002). No entanto, quando a sequência completa de todos os 5 BACs é incluída, uma similaridade final de DNA de 87% é o número final para as regiões homólogas comparadas entre chimpanzé e humano."

"Em 2004, Watanabe et al. usaram uma variedade de bibliotecas BAC para selecionar clones para sequenciamento de DNA representando o cromossomo 22 do chimpanzé. A sequência foi então comparada a regiões homólogas em humanos. Uma das ressalvas é que os BACs do chimpanzé foram escolhidos apenas se cada um contivesse de 6 a 10 marcadores de DNA humano. Esses níveis iniciais de pré-seleção tendenciosa são uma técnica comumente empregada. Como é o caso de várias publicações evolucionárias, as estatísticas gerais de alinhamento de DNA não são fornecidas no artigo ou nas informações suplementares. Para os segmentos alinhados, os autores fornecem uma taxa de substituição de nucleotídeos de 1,44%, mas não fornecem estimativas de similaridade para incluir indels. Os autores indicam que havia 82.000 indels e fornecem um histograma mostrando a distribuição de tamanho. Dados para tamanho médio de indel ou comprimento total de indel estavam visivelmente ausentes. Além disso, o número de lacunas de sequência foi fornecido, mas dados específicos sobre o comprimento total da lacuna estavam ausentes. Apesar do fato de que regiões ortólogas bem sequenciadas estão sendo comparadas, dados que permitiriam o cálculo da similaridade precisa de DNA entre humanos e chimpanzés são omitidos. Com base em estimativas derivadas de dados gráficos sobre substituições de bases e indels, uma estimativa de cerca de 80–85% de similaridade geral pode ser inferida."


"A publicação mais importante sobre a comparação do genoma humano-chimpanzé foi o artigo da Nature de 2005 do The Chimpanzee Sequencing and Analysis Consortium. Infelizmente, os dados comparativos foram fornecidos em um formato altamente seletivo e confuso, e dados tabularizados detalhados sobre os alinhamentos estavam ausentes. A maior parte do artigo estava preocupada principalmente com uma variedade de análises evolutivas hipotéticas para várias taxas de divergência e forças seletivas. No entanto, com base nos números fornecidos naquele artigo, uma similaridade geral aproximada do genoma entre humanos e chimpanzés pode ser calculada. Os autores afirmam:

Os melhores alinhamentos recíprocos de nível de nucleotídeos dos genomas do chimpanzé e do ser humano cobrem ~2,4 gigabases (Gb) de sequência de alta qualidade (The Chimpanzee Sequencing and Analysis Consortium 2005, p. 71).

Neste ponto do tempo, a montagem do genoma humano foi estimada como quase completa em 2,85 Gb e teve uma taxa de erro de 1 em 100.000 bases (International Human Chimpanzee Genome Sequencing Consortium 2004). Os autores do genoma do chimpanzé em 2005 também declaram:

as diferenças indel entre os genomas totalizam ~90 Mb. Essa diferença corresponde a ~3% de ambos os genomas e supera a diferença de 1,23% resultante das substituições de nucleotídeos (The Chimpanzee Sequencing and Analysis Consortium 2005, p. 71).

Ao aplicar os dados de indel e substituição (4,23%) às 2,4 gigabases de sequência alinhada de humanos e chimpanzés, e fatorando a quantidade de sequência humana que não se alinhou, uma similaridade máxima de 80,6% pode ser calculada. Esta é uma estimativa muito conservadora porque os alinhamentos padrão de nucleotídeos BLAST mascaram grandes quantidades de sequência de baixa complexidade. Além disso, a estrutura mais recente do genoma do chimpanzé (montagem ENSEMBL contígua “golden path”; http://uswest.ensembl.org/Pan_troglodytes/Info/Index ) indica que o genoma do chimpanzé é aproximadamente 8% maior que o humano. A inclusão desses dados reduziria ainda mais a similaridade em todo o genoma abaixo de 74% de identidade. Para uma revisão recente sobre como os genomas do chimpanzé e do humano foram sequenciados e por que uma compreensão dessas tecnologias é essencial para interpretar problemas de similaridade de DNA, veja a revisão recente de Tomkins (2011a)"




"Embora a maioria do genoma seja agora conhecida por ser amplamente funcional (Wells 2011), o uso de mascaramento de sequência de baixa complexidade em pesquisas BLASTN exclui muitas dessas principais características genéticas. Argumentos para empregar mascaramento de sequência de DNA de baixa complexidade foram feitos pelos desenvolvedores originais do BLAST (Altschul et al. 1994) com base no fato de que tais sequências frequentemente confundem análises evolutivas e eles fazem a seguinte declaração sobre essas características de DNA:

a maioria desses segmentos geralmente não fornece alinhamentos significativos posição por posição de maneiras que reflitam a história estrutural e mutacional real: eles evidentemente evoluem relativamente rápido.

A falta de mascaramento de sequência de baixa complexidade também causa a inclusão de quantidades consideráveis ​​de sequência de DNA adicional, resultando em um aumento acentuado nos recursos de processamento computacional. No entanto, melhorias no desempenho do hardware do computador desde 1994 tornam as análises de DNA em larga escala mais viáveis ​​e a inclusão de sequências de baixa complexidade agora é facilmente testável. Portanto, dois conjuntos separados de experimentos foram empregados. Um conjunto de experimentos empregou mascaramento para consulta e assunto, enquanto o outro desabilitou completamente o mascaramento."


"A identidade máxima para alinhamentos entre humanos e chimpanzés é de 86–89%

Veja as Tabelas 1 e 2 para um resumo de dados de todos os 30 experimentos BLASTN, resumindo 1,2 milhão de tentativas de alinhamentos de 40.000 sequências de chimpanzés em quatro versões diferentes do genoma humano.

A similaridade geral da sequência humano-chimpanzé para regiões alinháveis ​​dos dois genomas variou ligeiramente entre os grupos de experimentos em relação ao uso de mascaramento de sequência de baixa complexidade. Para o conjunto de experimentos não mascarados, a similaridade do DNA variou de um mínimo de 86,4% de identidade a um máximo de 88,9%, dependendo do tamanho da palavra e da combinação de parâmetros de e-valor (Tabela 1). O uso da sequência não mascarada é uma consideração importante, dada a pesquisa recente que sugere que as principais diferenças entre humanos e chimpanzés estão dentro de regiões de baixa complexidade dos genomas (Polavarapu et al. 2011). Para o conjunto de experimentos que empregaram mascaramento de sequência de baixa complexidade para consulta e sujeito, a similaridade do DNA variou de um mínimo de 86,2% de identidade a um máximo de 88,8%, dependendo do tamanho da palavra e da combinação de parâmetros de e-valor (Tabela 2). O uso do mascaramento pareceu ter um leve efeito nas estatísticas gerais de similaridade da sequência. A diferença mais notável, no entanto, foi no tempo de processamento computacional, que diminuiu rapidamente com o mascaramento habilitado (dados não mostrados)."


"Os números gerais de similaridade de sequência de DNA neste estudo estão dentro do intervalo de várias publicações evolucionárias anteriores, onde identidades de 85–87% podem ser calculadas para dados omitidos (Tomkins e Bergman 2012)."




7 - https://uncommondescent.com/intelligent-design/a-simple-statistical-test-for-the-alleged-99-genetic-identity-between-humans-and-chimps/




"Os números típicos publicados na literatura científica para as similaridades percentuais entre os genomas de seres humanos ( Homo sapiens ) e chimpanzés ( Pan troglodytes ) variam de 95% a 99%."



"No entanto, o desenvolvimento de um programa de computador automatizado que seja capaz de executar uma comparação funcional completa entre genomas humanos e de chimpanzés é praticamente impossível, pela simples razão de que a arquitetura funcional desses genomas ainda não é perfeitamente conhecida."


"A comparação que realizei foi completamente diferente daquelas geralmente realizadas por geneticistas, porque era puramente estatística por natureza. Em certo sentido, poderia ser descrita como uma aplicação do conhecido método de Monte Carlo. O método de Monte Carlo é frequentemente usado quando os dados ou processos envolvidos são enormes e se deseja reduzir o tempo de execução do computador. Em suma, envolve lidar com uma amostra aleatória parcial, em vez de todo o espaço que está sob investigação. No método de Monte Carlo, apenas uma pequena porção da população de dados é realmente investigada; no entanto, essa porção é estatisticamente grande o suficiente para revelar as características do todo."



"Os resultados obtidos são estatisticamente válidos. O mesmo teste foi executado anteriormente em uma amostragem de 1.000 padrões aleatórios de 30 bases e as porcentagens obtidas foram quase idênticas às obtidas no teste final, com 10.000 padrões aleatórios de 30 bases. Quando os genomas humano e de chimpanzé são comparados, o cromossomo X é o que mostra o maior grau de similaridade de 30BPM (72,37%), enquanto o cromossomo Y mostra o menor grau de similaridade de 30BPM (30,29%). Em média, a similaridade geral de 30BPM, quando todos os cromossomos são levados em consideração, é de aproximadamente 62%. Aqui temos o caso clássico do copo que algumas pessoas percebem como meio cheio, enquanto outras o percebem como meio vazio. Quando comparado a duas sequências aleatórias que são 0% semelhantes, 62% é um valor muito grande, então ninguém negaria que os genomas humano e de chimpanzé são bastante semelhantes! Por outro lado, 62% é um valor muito baixo quando comparado às porcentagens de similaridade de mais de 95% que são publicadas por pesquisadores evolucionistas de bioinformática. Agora, percebo que pode parecer um tanto arbitrário escolher padrões de 30 bases, como fiz no meu teste, e de fato é arbitrário até certo ponto. No entanto, se os dois genomas fossem realmente 95% similares ou mais, como é comumente alegado, também um teste estatístico de 30BPM deveria produzir resultados de 95%, e não produz."








O Limite da Evolução?

  
Design Inteligente



"Agora, um artigo recente do Dr. Branko Kozulic, um bioquímico que atua no conselho editorial do periódico Intelligent Design Bio-Complexity , argumenta que cada espécie de ser vivo foi projetada de forma inteligente, e que o conceito biológico de uma espécie pode ser melhor definido em termos das proteínas e genes únicos que a caracterizam. Em poucas palavras, o argumento do Dr. Kozulic é que existem literalmente centenas de proteínas quimicamente únicas em cada espécie de organismo vivo. Essas proteínas "singleton" não têm parentes químicos próximos, tornando sua origem um mistério desconcertante. O Dr. Kozulic afirma que a presença não de uma, mas de centenas de proteínas quimicamente únicas em cada espécie é um evento além do alcance do acaso e que cada espécie deve, portanto, ser o resultado de um planejamento inteligente."

"Se a conclusão do Dr. Kozulic estiver correta, então ela teria implicações interessantes para a controvérsia criação-evolução. Em um nível material , os seres vivos ainda podem ser biologicamente relacionados, na medida em que surgiram de um estoque ancestral comum: em outras palavras, a descendência comum ainda pode ser verdadeira. No entanto, em um nível formal , cada espécie de ser vivo seria o produto do Design Inteligente e poderia ser vista como uma criação separada, pois os genes e proteínas únicos que o dotam com suas características definidoras foram essencialmente construídos do zero. Em outras palavras: os seres vivos podem compartilhar uma ancestralidade comum, mas suas proteínas constituintes certamente não. Eles foram criados.

Essa conclusão significaria que até mesmo animais tão semelhantes quanto ratos e camundongos, que divergiram entre 12 e 24 milhões de anos atrás ) foram projetados separadamente. O rato norueguês comum (foto acima, cortesia da Wikipedia) é popularmente imaginado como sendo apenas uma versão ampliada de um camundongo. No entanto, os cientistas identificaram nada menos que 75 genes únicos (69 genes de camundongo e 6 genes de rato) para os quais há boas evidências de origem de novo desde a divergência de camundongo e rato. Cada um desses genes é encontrado apenas nas linhagens de camundongo ou rato. Se o Dr. Kozulic estiver correto, isso significa que ratos e camundongos devem ser vistos como designs separados. O mesmo vale para humanos e chimpanzés, ambos com proteínas e genes quimicamente únicos."

"O artigo recente do Dr. Kozulic, que eu gostaria de discutir hoje, é intitulado, Proteins and Genes, Singletons and Species . O artigo foi enviado ao VIXRA, um arquivo alternativo de e-prints relacionados à ciência e matemática que atende a toda a comunidade científica, em 16 de maio de 2011. Nesta postagem, vou citar extensivamente partes do artigo do Dr. Kozulic, para orientar os leitores em seu argumento. Aqui está o resumo:

Dados experimentais recentes de proteômica e genômica são interpretados aqui de maneiras que desafiam o ponto de vista predominante na biologia, segundo o qual os quatro processos evolutivos, incluindo mutação, recombinação, seleção natural e deriva genética, são suficientes para explicar a origem das espécies.

O ponto de vista predominante parece incompatível com a descoberta de que o genoma sequenciado de cada espécie contém centenas, ou mesmo milhares, de genes únicos – os genes que não são compartilhados com nenhuma outra espécie. Esses genes e proteínas únicos, singletons, definem o próprio caráter de cada espécie. Além disso, a distribuição de famílias de proteínas dos genomas sequenciados indica que a complexidade dos genomas cresce de uma maneira diferente daquela das redes auto-organizadas: a dominância de singletons leva à conclusão de que em organismos vivos um fenômeno muito improvável pode ser o mais comum. 

A fim de fornecer uma justificativa adequada para essas conclusões relacionadas aos singletons, o artigo primeiro trata da frequência de proteínas funcionais entre sequências aleatórias, seguido por uma discussão sobre o espaço da estrutura da proteína, e termina questionando a ideia de que os domínios de proteínas representam unidades conservadas de evolução."

"E agora, sem mais delongas, aqui estão os destaques do artigo do Dr. Kozulic.

Quão grande é o espaço da sequência de proteínas? Muito maior do que alguns evolucionistas (Dryden et al.) gostariam que fosse

Uma estratégia para neutralizar o problema associado à descoberta de proteínas funcionais por busca aleatória através do enorme espaço de sequência de proteínas tem sido reduzir arbitrariamente o tamanho desse espaço. Como o tamanho do espaço está relacionado ao comprimento da proteína (L) como 20^L, onde 20 denota o número de aminoácidos diferentes dos quais as proteínas são feitas, o número de sequências de proteínas únicas diminuirá rapidamente se assumirmos que o número de aminoácidos diferentes pode ser menor que 20. O mesmo é verdade se tomarmos valores pequenos de L. Dryden et al. usaram essa estratégia para ilustrar a viabilidade de buscar em todo o espaço de sequência de proteínas na Terra, estimando que o número máximo de proteínas diferentes que poderiam ter sido formadas no planeta Terra em tempo geológico era 4 x 10^43 [9].  

No laboratório , os pesquisadores projetaram proteínas funcionais com menos de 20 aminoácidos [10, 11], mas na natureza todos os organismos vivos estudados até agora, de bactérias ao homem, usam todos os 20 aminoácidos para construir suas proteínas. Portanto, as conclusões baseadas nos cálculos que dependem de menos de 20 aminoácidos são irrelevantes em biologia. Em relação ao comprimento da proteína, os comprimentos medianos relatados de proteínas bacterianas e eucarióticas são 267 e 361 aminoácidos, respectivamente [12]. Além disso, cerca de 30% das proteínas em eucariotos têm mais de 500 aminoácidos, enquanto cerca de 7% delas têm mais de 1.000 aminoácidos [13]. A maior proteína conhecida, a titina, é construída com mais de 30.000 aminoácidos [14].  

Apenas esses valores encontrados experimentalmente para L são significativos para calcular o tamanho real do espaço da sequência da proteína, que, portanto, corresponde a um valor mediano de 10^347 (20^267) para bactérias e 10^470 (20^361) para proteínas eucarióticas. (pp. 2-3)

Qual proporção de cadeias de aminoácidos são capazes de funcionar como proteínas?

Embora os cientistas geralmente concordem que apenas uma minoria de todas as sequências de proteínas possíveis tem a propriedade de se dobrar e criar uma estrutura 3D estável, o número adequado para quantificar essa minoria tem sido objeto de muito debate. (p. 6)

Em 1976, Hubert Yockey estimou a probabilidade de cerca de 10^-65 [que é 1 em 100.000 milhões de milhões de milhões de milhões de milhões de milhões de milhões de milhões de milhões – VJT] para encontrar uma sequência de citocromo c entre sequências de proteínas aleatórias [48]. Para o repressor λ[lambda] do bacteriófago, Reidhaar-Olson e Sauer estimaram que a probabilidade era de cerca de 10^-63 [49]. Com base nos dados de mutação da β[beta]-lactamase, Douglas Axe estimou a prevalência de dobras funcionais na faixa de 10^-77 a 10^-53 [50]. Uma comparação dessas estimativas com aquelas relativas ao número total de moléculas de proteína sintetizadas durante a história da Terra – cerca de 10^40 [9, 51, 52] – leva à conclusão de que a montagem aleatória de aminoácidos não poderia ter produzido uma única enzima durante 4,5 bilhões de anos [48, 53]. Por outro lado, Taylor et al. estimaram que uma biblioteca de proteínas aleatórias de cerca de 10^24 membros seria suficiente para encontrar uma molécula de mutase corismata [54]. 

Além disso, de uma biblioteca real de 6×10^12 proteínas, cada uma contendo 80 aminoácidos aleatórios contíguos, Keefe e Szostak isolaram quatro proteínas de ligação de ATP e concluíram que a frequência de proteínas funcionais no espaço de sequência pode ser tão alta quanto 1 em 10^11 [1 em 100.000.000.000 – VJT], permitindo sua descoberta por meios inteiramente estocásticos [55]. No entanto, estudos in vivo subsequentes com essa proteína de ligação de ATP feita pelo homem mostraram que ela interrompeu o equilíbrio energético normal da célula, agindo essencialmente como um antibiótico [56]. Pode-se concluir, portanto: se essa proteína tivesse sido formada por mutações aleatórias, a célula com ela não teria deixado descendentes. 

Além disso, a probabilidade de sua formação em uma célula teria sido menor que 10^-11, porque mutações aleatórias de DNA introduzem códons de parada e mudanças de quadro, enquanto Keefe e Szostak evitaram códons de parada e mutações de mudança de quadro por meio de planejamento experimental [55]. A importância de distinguir os resultados de estudos in vitro de estudos in vivo é destacada pela descoberta de que apenas uma pequena fração, uma em cerca de 10^10, dos mutantes ativos da triosefosfato isomerase funcionou adequadamente in vivo [57]. (pp. 6-7)

A importância de manter a ordem correta dos aminoácidos

Em geral, há dois aspectos da função biológica de cada proteína, e ambos dependem da estrutura 3D correta. Cada proteína reconhece especificamente sua contraparte celular ou extracelular: por exemplo, uma enzima, seu substrato, hormônio, seu receptor, açúcar lectina, DNA repressor, etc. Além disso, as proteínas interagem continuamente ou transitoriamente com outras proteínas , formando uma rede interativa. 

Este segundo aspecto não é menos importante, como ilustrado em muitos estudos de interações proteína-proteína [59, 60]. Requisitos estruturais requintados devem frequentemente ser cumpridos para o funcionamento adequado de uma proteína. Por exemplo, em enzimas, o deslocamento espacial de resíduos catalíticos, mesmo por alguns décimos de angstrom, pode significar a diferença entre atividade total e nenhuma [54]. E nas palavras de Francis Crick, “Para produzir este milagre de construção molecular, tudo o que a célula precisa fazer é unir os aminoácidos (que compõem a cadeia polipeptídica) na ordem correta ” [61, itálico no original]. (pp. 7-8)

Estimativa muito generosa do Dr. Kozulic sobre as probabilidades de construir uma proteína por meio de ensaios aleatórios: 1 em 1.000.000.000.000.000.000.000 [meu acréscimo: 1 em 1 sextilhão]

Nota explicativa: o termo in vitro (latim: dentro do vidro) se refere à técnica de realizar um determinado experimento em um ambiente controlado fora de um organismo vivo; por exemplo, em um tubo de ensaio. In vivo (latim: dentro do vivo) significa aquilo que ocorre dentro de um organismo. Na ciência, in vivo se refere à experimentação feita em ou sobre o tecido vivo de um organismo inteiro e vivo, em oposição a um parcial ou morto ou a um ambiente controlado. Fonte .

Vamos avaliar a maior probabilidade de encontrar essa ordem correta por meio de ensaios aleatórios e chamá-la, para permanecer em linha com o termo de Crick, de um “milagre macromolecular”. Os dados experimentais de Keefe e Szostak indicam – se desconsiderarmos as reservas descritas acima – que um de um conjunto de 10^11 polipeptídeos montados aleatoriamente pode ser funcional in vitro , enquanto os dados de Silverman et al. [57] mostram que das 10^10 proteínas funcionais in vitro, apenas uma pode funcionar adequadamente in vivo . A combinação desses dois números define então um “milagre macromolecular” como uma probabilidade de um contra 10^21. Para simplificar, vamos arredondar esse número para um contra 10^20. (p. 8)

É importante reconhecer que o um em 10^20 representa o limite superior e, como tal, este número está de acordo com todas as estimativas anteriores de probabilidade inferior. Além disso, há dois componentes que contribuem para este número: primeiro, há um componente relacionado à atividade particular de uma proteína – por exemplo, atividade enzimática que pode ser avaliada in vitro ou in vivo – e segundo, há um componente relacionado ao funcionamento adequado dessa proteína no contexto celular: em uma via bioquímica, ciclo ou complexo. Levar em consideração ambas as contribuições é um requisito essencial porque uma proteína sintética bem ativa no tubo de ensaio pode ser letal no contexto celular , como mostrado por Stomel et al. para a proteína de ligação ao ATP de Keefe e Szostak [55, 56]. (p. 8)

Para colocar o número 10^20 no contexto de objetos observáveis, cerca de 10^20 quadrados, cada um medindo 1 mm^2, cobririam toda a superfície do planeta Terra (5,1 x 10^14 m^2). Pesquisar em tais quadrados para encontrar um único com o número correto, a uma taxa de 1000 por segundo, levaria 10^17 segundos, ou 3,2 bilhões de anos. No entanto, com base nos dados experimentais discutidos acima, um em 10^20 é a maior probabilidade que uma busca cega tem de encontrar entre sequências aleatórias uma proteína funcional in vivo . Este número denota a altura mínima da parede de tijolos. (p. 9)

As proteínas são distribuídas de acordo com uma lei de potência

Uma distribuição de lei de potência. Classificações de popularidade (por exemplo, avaliações de atores) geralmente seguem esse tipo de distribuição. À direita está a cauda longa, e à esquerda estão os poucos indivíduos que dominam (também conhecida como regra 80–20). Imagem cortesia da Wikipedia.

O que aprendemos com essas dezenas de milhões de sequências de proteínas originárias dos genomas de mais de mil espécies? Quando proteínas de sequências semelhantes são agrupadas em famílias, sua distribuição segue uma lei de potência [65-72], levando alguns autores a sugerir que o espaço da sequência de proteínas pode ser visto como uma rede semelhante à World Wide Web, rede elétrica ou rede de colaboração de atores de cinema , devido à similaridade dos respectivos gráficos de distribuição. 

Há, portanto, um pequeno número de famílias com milhares de proteínas membros tendo sequências semelhantes, enquanto, no outro extremo, há milhares de famílias com apenas alguns membros. As mais numerosas são “famílias” com apenas um membro; essas proteínas solitárias são geralmente chamadas de singletons. (pp. 9-10)

Ao plotar, em uma escala log-log, o número de citações por artigo em relação ao número total de citações, obtém-se o gráfico mostrado na Figura 2a, caracterizado por uma cauda dispersa e uma cabeça densa. Na cauda, ​​há grupos de pequenos números de artigos (1, 2, 3 e 4, aproximadamente) obtendo citações milhares de vezes. Apenas alguns artigos individuais deste conjunto de dados se aproximam da marca de 10.000 citações. Por outro lado, muitos artigos são citados 100 vezes, ainda mais deles 10 vezes, enquanto os mais numerosos são os artigos citados apenas uma vez (além daqueles nunca citados). 

Um gráfico análogo da distribuição de terremotos mostra muitos terremotos de baixas magnitudes e um número cada vez menor de terremotos mais fortes (Fig. 2b). Além disso, com base na aparência comum de atores no mesmo filme, a rede de colaboração dos atores também mostra uma distribuição de lei de potência (Fig. 2c). Na cauda, ​​há algumas superestrelas que colaboraram com milhares de outros atores, enquanto os novatos na cabeça colaboraram com apenas alguns. (pp. 10-11)

A distribuição de famílias de proteínas em genomas sequenciados é ilustrada por um gráfico semelhante (Fig. 2d). Distribuições comparáveis ​​foram observadas com conjuntos de dados de proteínas de genomas sequenciados individuais [65, 80], bem como com os conjuntos de dados que abrangeram todos os genomas sequenciados em vários pontos de tempo [66-72]. Aqui, na cauda da distribuição, há algumas famílias grandes, cada uma consistindo de milhares de proteínas com sequências semelhantes, enquanto na cabeça há muitos singletons. 

A semelhança evidente desta curva de distribuição com as da Figura 2a-c foi interpretada como evidência da natureza auto-organizada de redes de proteínas em organismos vivos. Foi, portanto, inferido que a complexidade dos genomas cresce da mesma forma que a complexidade da WWW, ou rede de atores. Essas interpretações, no entanto, estão erradas porque não levaram em conta uma diferença fundamental, conforme descrito abaixo. (p. 11)

A primeira condição que as redes da Figura 2 devem cumprir é uma adição contínua de novos membros [78]. Assim, continuamente novos atores aparecem em filmes, novos terremotos acontecem e novos artigos científicos são publicados. Aproximadamente uma pessoa em 10^5 [ou 100.000 – VJT] atua em um filme, terremotos fazem um de menos de 10^5 fenômenos geológicos, e a fração de artigos científicos entre todas as publicações é maior que um em 10^5. Então, para entrar na respectiva rede – para se tornar o primeiro ponto na cabeça da distribuição – os recém-chegados devem superar uma barreira não maior que um contra 10^5. Após a entrada, para se tornarem proeminentes, os recém-chegados têm uma chance de cerca de um em 10^5 novamente.  

Evidentemente, as duas barreiras, de entrar e de se tornar proeminentes, são comparáveis , mais ou menos algumas ordens de magnitude. O que aconteceria se a barreira de entrada fosse mil trilhões (10^15) vezes maior? Obviamente, se apenas uma em cada 10^20 pessoas pudesse se tornar ator, não conheceríamos nenhum ator: não haveria registros deles e, analogamente, não haveria registros de artigos científicos e terremotos. (p. 11)

A frequência de proteínas funcionais entre sequências aleatórias é no máximo uma em 10^20 (veja acima). As proteínas de sequências não relacionadas são tão diferentes quanto as proteínas de sequências aleatórias [22, 81, 82] – e singletons por definição são exatamente essas proteínas não relacionadas. (p. 11)

Assim, para entrar no gráfico de distribuição como um recém-chegado (Fig. 2d), cada nova proteína (singleton) deve superar a barreira de entrada de um contra pelo menos 10^20. Após a entrada, a chance do singleton de se tornar proeminente, ou seja, de crescer em uma das maiores famílias de proteínas, é de cerca de um em 10^5 (Fig. 2d). Assim, é muito mais difícil para uma proteína se tornar biologicamente funcional do que se tornar, em muitas variações, disseminada: a barreira de entrada é pelo menos quinze ordens de magnitude maior do que a barreira de proeminência.  

Essa enorme diferença entre as barreiras de entrada e proeminência é o que torna o gráfico de distribuição da família de proteínas único. Apesar dessa alta barreira de entrada, nos genomas sequenciados os recém-chegados de proteínas (singletons) sempre representam o maior e mais comum grupo: se fosse o contrário, o gráfico de distribuição quebraria... [E]m organismos vivos, o fenômeno mais improvável pode ser o mais comum. Essa característica distingue claramente a complexidade dos organismos vivos da complexidade das redes auto-organizadas. (pág. 12)

Os domínios das proteínas seguem a mesma distribuição de lei de potência

A distribuição de dobras e domínios de proteínas também segue uma lei de potência [21, 66, 67, 70, 72, 80, 83, 87], conforme previsto por Coulson e Moult [95]. Essa previsão foi considerada chocante [13]. Assim, nos genomas sequenciados, alguns domínios são representados por milhares de sequências diferentes e não homólogas, enquanto outros domínios são representados por algumas ou por uma única sequência única [21, 66, 67, 70, 72, 79, 83, 87, 95, 96]. 

Por exemplo, em um conjunto de cerca de 250.000 sequências de proteínas, Grant et al. encontraram cerca de 170.000 domínios que permaneceram como singletons [96]. Esses domínios únicos, também chamados de domínios órfãos, representam o maior grupo entre todos os grupos de domínios que compõem as distribuições. Esta é uma característica em comum com singletons do gráfico de distribuição de famílias de sequências de proteínas. (pág. 13)

Os genes órfãos também o fazem

Além do termo singleton, outros termos, com significado similar, se não sinônimo, têm sido usados ​​para denotar proteínas e genes sem parentesco. Assim, Siew e Fischer definem ORFans genômicos como quadros de leitura abertos (ORF) órfãos sem similaridade de sequência significativa com outros ORFs [103, 104]. Wilson et al. sugerem que os órfãos devem ser chamados de “genes taxonomicamente restritos” (TRGs) [105, 106], e afirmam que a abundância de genes órfãos está entre as maiores surpresas descobertas pelo sequenciamento de genomas eucarióticos e bacterianos [105]. Anteriormente, Russell Doolittle afirmou que há um grande número de genes não identificados em uma variedade de organismos, com a origem e a função dessas sequências únicas permanecendo “mistérios desconcertantes” [107]. (p. 15)

Por que a descoberta de proteínas e genes “singleton” foi um grande choque para os evolucionistas

Para entender por que a descoberta de singletons (ORF-ans, ou TRG-s) representou uma surpresa tão grande , vamos olhar para as expectativas contemporâneas. Elas foram possivelmente melhor delineadas por Chothia et al. em 2003 [108]: “todos, exceto uma pequena proporção do repertório de proteínas, são formados por membros de famílias que remontam à origem dos eucariotos ou à origem dos diferentes reinos.” E mais: “A evolução mais antiga do repertório de proteínas deve ter envolvido a invenção ab initio de novas proteínas. 

Em um nível muito baixo, isso ainda pode ocorrer. Mas está claro que os mecanismos dominantes para a expansão do repertório de proteínas, na biologia como a conhecemos, são a duplicação genética, a divergência e a recombinação.” Consequentemente: “seremos capazes de rastrear grande parte da evolução da complexidade examinando a duplicação e a recombinação dessas famílias em diferentes genomas.” Esperava-se que cerca de 1000 famílias de proteínas evolutivamente independentes abrangessem toda a diversidade de proteínas [109].  

Em consonância com o acima exposto, havia uma expectativa adicional de uma grande unificação da biologia [110]. No entanto, a distribuição de leis de potência das famílias de proteínas e a grande abundância de singletons expuseram a natureza utópica dessas expectativas e, ao mesmo tempo, abriram várias questões importantes. (p. 15)

Siew e Fischer descreveram sucintamente as questões em jogo: “Se as proteínas em diferentes organismos descendem de proteínas ancestrais comuns por duplicação e variação adaptativa, por que tantas hoje não mostram semelhança entre si?” E ainda: “Esses ORFans em rápida evolução correspondem a proteínas não essenciais ou a determinantes de espécies?” [103]. (p. 15)

Cada espécie de ser vivo tem centenas de proteínas únicas, cada uma delas diferente de todas as outras.

Um estudo recente, baseado em 573 genomas bacterianos sequenciados, concluiu que todo o conjunto de genes bacterianos – o pan-genoma bacteriano – parece ter tamanho infinito, porque cada genoma bacteriano adicional sequenciado adicionou mais de 200 novos singletons [111]. Em concordância com esta conclusão estão os resultados do projeto Global Ocean Sampling relatados por Yooseph et al., que encontraram um aumento linear no número de singletons com o número de novas sequências de proteínas, mesmo quando o número de novas sequências atingiu milhões [112]. 

A tendência para números maiores de singletons por genoma parece coincidir com uma proporção maior de genomas eucarióticos sequenciados. Em outras palavras, os eucariotos geralmente contêm um número maior de singletons do que as eubactérias e arqueias. [Os eucariotos são organismos cujas células têm um núcleo, ao contrário das bactérias – VJT.] (p. 16)

Quando um parente de um singleton é encontrado, as duas proteínas juntas criam uma família. Na ausência de dados bioquímicos, nada pode ser dito sobre a função biológica dessa família de proteínas, desde que nenhum domínio estabelecido ou motivo estrutural seja discernível das sequências de aminoácidos. Essas proteínas de função obscura, ou POFs, constituem cerca de 25% das proteínas encontradas em cada genoma [113, 114]. As POFs tendem a ser mais curtas do que as proteínas de função definida [114]. (p. 16)

Hoje, quase dez anos após o anúncio do primeiro rascunho da sequência do genoma humano, não há atribuição estrutural disponível para cerca de 38% das proteínas humanas [64]: atualmente, não temos informações básicas sobre uma grande fração das proteínas do proteoma humano [115]. (p. 16)

Cada espécie de ser vivo também possui centenas de genes únicos

Com base nos dados de 120 genomas sequenciados, em 2004 Grant et al. relataram a presença de 112.000 singletons dentro de 600.000 sequências [96]. Isso corresponde a 933 singletons por genoma. Em 2005, Orengo e Thornton relataram a presença de cerca de 150.000 singletons em 150 genomas sequenciados [72]. Em 2006, dentro de 203 genomas sequenciados e 633.546 sequências não idênticas, Marsden et al. identificaram 158.798 singletons [97]; assim, os singletons compunham 24% de todas as sequências e havia em média 782 singletons em cada genoma. Em 2008, Yeats et al. [73] encontraram cerca de 600.000 singletons em 527 espécies – 50 eucariotos, 437 eubactérias e 39 arqueias – correspondendo a 1.139 singletons por espécie. 

Nenhuma informação sobre o número de singletons está disponível no resumo mais recente dos dados de mais de 1.100 genomas sequenciados abrangendo quase 10 milhões de sequências [64]. Apesar da falta de dados recentes sobre singletons, os resultados dos cálculos acima são suficientes para uma conclusão inequívoca: cada espécie possui centenas, ou mesmo milhares, de genes únicos – os genes que não são compartilhados com nenhuma outra espécie. Esta conclusão está em total acordo com a distribuição de lei de potência das famílias de proteínas discutida acima. (p. 17)

Os genes e proteínas que são exclusivos de uma determinada espécie podem ser usados ​​para definir essa espécie

A Figura 3 mostra como o número de genes únicos (singletons), expresso como uma média por cada genoma sequenciado, estava mudando com o número total de genomas sequenciados. Evidentemente, o número de singletons tende a aumentar, de várias centenas para mais de mil. A presença de um grande número de genes únicos em cada espécie representa uma nova realidade biológica. Além disso, os singletons como um grupo parecem ser o constituinte mais distintivo de todos os indivíduos de uma espécie, porque esse grupo de singletons está ausente em todos os indivíduos de todas as outras espécies.  

A conclusão de que os singletons são os determinantes do fenômeno biológico das espécies segue logicamente. Em System of Logic, John Stuart Mill delineou seu Segundo Cânone ou Método da Diferença [133]: “Se uma instância na qual o fenômeno sob investigação ocorre, e uma instância na qual ele não ocorre, têm todas as circunstâncias em comum, exceto uma, aquela ocorrendo apenas na primeira; a circunstância em que somente as duas instâncias diferem é o efeito, ou a causa, ou uma parte indispensável da causa, do fenômeno.”(p. 18)

A descoberta de centenas de proteínas únicas em cada espécie está em desacordo com a teoria darwiniana da evolução

A ideia de que os domínios proteicos representam unidades conservadas de evolução [72, 108, 151-155] depende da capacidade presumida dos processos evolutivos – consistindo em mutações aleatórias, recombinação, deriva genética e seleção natural [156] – de manter a estrutura 3D de uma proteína enquanto altera sua sequência de aminoácidos. Esses processos cegos – que não sabem com que tipo de estrutura 3D de proteína começam, como a alteram e em que direção no espaço estrutural vão – supostamente possuem certas capacidades que são de longe superiores às de dezenas de milhares de computadores, ou superiores às de dezenas de milhares de pessoas que usam os computadores. (p. 20)

Essa hipótese – de que a evolução se esforça para preservar um domínio proteico uma vez que tropeça nele – contradiz a distribuição de domínios da lei de potência. Os gráficos de distribuição mostram claramente que domínios únicos são os mais abundantes de todos os grupos de domínios [21, 66, 67, 70, 72, 79, 82, 86, 94, 95], ao contrário de sua raridade esperada. Aqui, prevejo que a ideia de domínios proteicos como unidades básicas da evolução será refutada diretamente ao encontrar no genoma de uma espécie dois singletons com estrutura de domínio idêntica. Tal descoberta representará a refutação inequívoca e definitiva. Essa descoberta requer caracterização estrutural de vários singletons e depende de uma delimitação objetiva, matemática e não de um curador, dos elementos estruturais da proteína e da identidade 3D. (p. 20)

Cada gene único, e consequentemente cada nova proteína funcional codificada por esse gene, no entanto, representa um grande problema para a teoria evolucionista porque proteínas únicas são tão não relacionadas quanto as proteínas de sequências aleatórias – e entre as sequências aleatórias as proteínas funcionais são extremamente raras. Dados experimentais revisados ​​aqui sugerem que no máximo uma proteína funcional pode ser encontrada entre 10^20 proteínas de sequências aleatórias.  

Portanto, cada descoberta de uma nova proteína funcional (singleton) representa um testemunho da superação bem-sucedida da barreira de probabilidade de um contra pelo menos 10^20, a probabilidade definida aqui como um “milagre macromolecular”. Mais de um milhão desses “milagres macromoleculares” estão presentes nos genomas de cerca de duas mil espécies sequenciadas até agora. Assumindo que essa correlação se manterá com o restante de cerca de 10 milhões de espécies diferentes que vivem na Terra [157], o número total de “milagres macromoleculares” em todos os genomas pode chegar a 10 bilhões. Essas 10^10 proteínas únicas ainda representariam uma pequena fração das 10^470 proteínas possíveis do tamanho eucariótico médio. (p. 21)

O aparecimento de centenas de proteínas e genes únicos que caracterizam cada espécie é um acontecimento que está além do alcance do acaso

Se apenas 200 proteínas únicas estiverem presentes em cada espécie, a probabilidade de seu aparecimento simultâneo é de um contra pelo menos 10^4.000. [Os] recursos probabilísticos do nosso universo são muito, muito menores; eles permitem um máximo de 10^149 eventos [158] e, portanto, poderiam ser responsáveis ​​por um aparecimento simultâneo único de no máximo 7 proteínas únicas. A alternativa, um aparecimento sequencial de singletons, exigiria que os descendentes de uma família vivessem centenas de “milagres macromoleculares” para se tornarem uma nova espécie – novamente um cenário de probabilidade extremamente baixa.  

Portanto, agora se pode dizer que cada espécie é resultado de um Big Bang Biológico; reservar esse termo apenas para o primeiro organismo vivo [21] não se justifica mais. Essa visão sobre espécies difere nitidamente da predominante, segundo a qual a especiação é causada pelo isolamento reprodutivo de duas populações [159, 160] mediado por genes de especiação difíceis de encontrar [161-163]. (p. 21)

Os biólogos evolucionistas das gerações anteriores não anteciparam [164, 165] o desafio que os singletons representam para os biólogos contemporâneos. Ao descobrir milhões de genes únicos, os biólogos se depararam com muros de tijolos semelhantes aos atingidos pelos físicos com a descoberta dos fenômenos quânticos. O ponto de vista predominante na biologia tornou-se insustentável: estamos testemunhando uma revolução científica de proporções sem precedentes. (p. 21)" 



O genoma humano é quase idêntico ao do chimpanzé? — uma reavaliação da literatura




"Foi realizada uma revisão da literatura disponível relacionada à alegação comum de que existem poucas diferenças genéticas entre chimpanzés e humanos. Ao tomar as informações publicadas pelo valor de face, mostramos que existem diferenças significativas relatadas em relação a, não apenas sequência genômica, mas regulação genética, regiões genômicas regulatórias, código de microRNA e splicing genético. Concluímos que múltiplas facetas de diferenças em sequências de DNA e mecanismos genéticos, conforme relatado na literatura científica padrão, sugerem que existem diferenças genéticas claras e intransponíveis entre humanos e chimpanzés."

"

A era do sequenciamento de DNA — a lenda cresce

Hoje, as tecnologias de sequenciamento de DNA melhoraram e se tornaram consideravelmente mais proficientes e automatizadas. Como resultado, a pesquisa de similaridade de DNA entre humanos e chimpanzés é capaz de utilizar informações reais de pares de bases de DNA em uma escala maior. Conforme observado por Marks, é importante entender que, uma vez que existem apenas quatro bases de DNA em todos os genomas, quaisquer dois trechos aleatórios de DNA do mesmo comprimento sempre serão cerca de 25% idênticos. Em outras palavras, o ponto de partida nas comparações de DNA humano-chimpanzé não é zero, mas 25%. 7"



"

Se acredita-se que o genoma B tem um ancestral comum com o genoma A e B mudou mais do que A em uma área, ele é considerado como tendo inserções , e isso é mostrado por traços para mostrar as adições, no caso tgcggc:

Genoma A: atgccgt------t
Genoma B: atgccgt tgcggc t

Se comparado ao A, o genoma B carece de 6 pares de bases, o seguinte, chamado de deleção , seria produzido:

Genoma A: tggccctaaatccaat
Genoma B: tggccc------caat

Figura 1. Indels são de dois tipos, inserções e deleções, com base em suposições evolucionárias. Na realidade, tudo o que temos são diferenças entre duas sequências diferentes, e o conceito de indels é uma tentativa de explicar as diferenças pela evolução."


"Vários estudos frequentemente citados relataram várias similaridades de sequência de DNA de 94% ou mais entre humanos e chimpanzés. Por exemplo, Britten relatou uma similaridade de 95% em 780.000 bases alinhadas nas quais ele incluiu inserções e deleções (indels; figura 1). Quando ajustados para incluir a sequência de DNA da consulta que foi omitida dos alinhamentos, os dados de Britten indicam uma similaridade geral de 87% (veja a figura 2). 8 Embora a pesquisa de Britten tenha sido um dos primeiros artigos a incluir indels nos resultados do alinhamento de DNA, também foi um dos últimos.

Conforme discutido no artigo complementar desta revisão, 5 documentamos, caso a caso, a maioria das principais publicações de comparação de sequências de DNA que relatam similaridades percentuais. 5 Os principais artigos que relatam similaridades de sequências de DNA o fazem usando vários níveis de amostra biológica e/ou pré-seleção de dados. Na maioria dos casos, os autores relatam apenas os dados "melhores dos melhores" — uma forma de seleção seletiva bioinformática orientada por dogmas. Por exemplo, apenas as sequências de genes codificadores de proteínas de DNA altamente similar pré-selecionado são frequentemente usadas — garantindo altos níveis de similaridade. 8"


"

Se os dados reais forem os seguintes:

Sequência 1: atgctgatattggc
Sequência 2: atgggc

Então o alinhamento (chamado de processo de pré-triagem) seria:

Sequência 1: atgctgatattggc
Sequência 2: atg--------ggc

Figura 2. BLAST (Basic Local Alignment Search Tool) realiza comparações pareadas entre uma sequência biológica de interesse (consulta) e uma sequência alvo (sujeito), tipicamente um banco de dados de muitas sequências. Existem diferentes variantes do algoritmo BLAST dependendo se a sequência sendo testada é proteína ou nucleotídeo. Por exemplo, com parâmetros padrão para BLASTN (versão nucleotídeo), apenas os dados de alinhamento para identidades maiores que 90% são normalmente retornados. Além disso, esses alinhamentos omitirão muitas lacunas na consulta ou sequência de sujeito e é por isso que alegações como 98% de similaridade resultam quando na verdade existem enormes diferenças. Indels são um problema que produz grandes diferenças em comparações de genes que são editadas por evolucionistas para produzir uma similaridade maior do que de fato existe."


"Muitas diferenças estruturais importantes entre os genomas humano e do chimpanzé foram detectadas e relatadas em vários artigos. 12-17 De fato, muitos trechos grandes de sequências de DNA não mostram um padrão consistente em alinhamentos múltiplos (comparações de fragmentos de DNA) dos genomas de humanos, chimpanzés e gorilas, levando a genealogias baseadas em DNA que são diferentes das filogenias darwinianas assumidas (árvores evolutivas) para >25% dos genomas de primatas sendo estudados. 18-22 Infelizmente, essas grandes anomalias evolutivas foram ofuscadas dentro de obscuras técnicas de verborragia evolutiva e suavização de dados. Como resultado, esses resultados importantes nunca chegam à esfera pública do conhecimento."


"As muitas partes dos genomas humano e de macaco que não mostram nenhum padrão de ancestralidade comum compreendem um fenômeno chamado 'Independent Lineage Sorting' ou ILS. A questão da classificação de linhagem independente não é um problema novo na controvérsia da similaridade entre humanos e chimpanzés. Antes do advento da revolução da biologia molecular, o uso de várias medições de características anatômicas produziria, dependendo da característica, diferentes árvores evolutivas. 23 A citação sincera abaixo de um artigo evolucionário bastante recente afirma a questão muito claramente.

“No entanto, com o aumento da quantidade de dados e do número de estudos, o ponto crucial da questão emerge. Independentemente do tipo de dados filogeneticamente informativos escolhidos para análise, a história evolutiva dos humanos é reconstruída de forma diferente com diferentes conjuntos de dados.” 24"


"Árvores calculadas que não se encaixam no paradigma darwiniano esperado são chamadas de "discordantes". O problema das árvores discordantes não foi resolvido com o advento das tecnologias moleculares que dependiam de proteínas e DNA. Na verdade, o problema piorou. A resposta do biólogo para esse dilema foi simplesmente entregar o problema a matemáticos estatísticos sem formação biológica que combinassem vários conjuntos de dados para produzir a árvore filogenética politicamente correta. Usando algoritmos selecionados, combinados com o padrão metodológico existente de pré-triagem e pré-seleção para dados compatíveis, as árvores discordantes foram protegidas. Existe um número considerável de artigos neste campo e uma revisão mais completa deste tópico é necessária em uma publicação futura. Basta dizer que os artigos principais produzem dados que mostram claramente a extrema dissimilaridade entre não apenas humanos e chimpanzés, mas todos os grandes primatas.

Por exemplo, Cheng et al . foram um dos primeiros grupos que se debruçaram sobre a questão da variação estrutural entre genomas humanos e de chimpanzés. Esses pesquisadores compararam os números de regiões repetidas dos genomas humano e de chimpanzés que mostraram evidências de duplicação compartilhada e específica de linhagem. 25 Os blocos repetidos comparados de sequência foram pré-selecionados para serem altamente idênticos (>94%) e foi o nível de duplicação (repetição) para esses blocos que foi avaliado entre os genomas. No entanto, para os autossomos (os cromossomos não sexuais), apenas 66% do número total de blocos duplicados foram encontrados em humanos e chimpanzés, 33% foram duplicados em humanos e não em chimpanzés, e várias dessas duplicações caracterizadas continham genes. Das 177 sequências de genes nessas repetições, 88 foram duplicadas em humanos e não em chimpanzés, enquanto 94 foram duplicadas em chimpanzés e não em humanos. Como o número de cópias do gene é um importante regulador da expressão genética, essa foi uma descoberta significativa porque resultou em genótipos diferentes, assim como genes diferentes resultam em genótipos diferentes.

Eles também descobriram que sequências de DNA com similaridade maior que 97% tinham cinco vezes mais probabilidade de serem montadas incorretamente no genoma do chimpanzé. Isso resulta do uso da montagem do genoma humano como estrutura ou andaime quando construíram o genoma do chimpanzé. 26"



 "

Proteínas ortólogas

Estima-se que mais de 95% do genoma humano consiste em DNA não codificador de proteínas e muitos dos estudos de similaridade que encontraram uma diferença de 1–2% de nucleotídeos foram baseados em DNA codificador de proteínas de homólogos pré-selecionados (sequências semelhantes). Proteínas ortólogas são produzidas por genes em diferentes espécies que se presume terem evoluído de um único gene ancestral, como os genes da cadeia de hemoglobina beta globina. Glazko et al . compararam 44.000 resíduos de aminoácidos de chimpanzés e humanos. 27 Das 127 proteínas ortólogas completas examinadas, apenas 20% (25 proteínas) apresentaram sequências de aminoácidos idênticas. Em muitas das outras, as mudanças foram pequenas, com a maior quantidade de mudanças em genes de transdução de sinal, em comparação com enzimas, transportadores e outras proteínas fisiológicas de manutenção. É importante notar que pequenas diferenças de códon entre dois genes que produzem proteínas semelhantes podem, devido ao splicing alternativo dos exons e íntrons e diferenças de processamento, acabar produzindo proteínas que têm diferenças relativamente grandes em sua forma tridimensional e função. As diferenças resultantes dependem da regulação da proteína e suas diferenças específicas de aminoácidos. Esse fator deve ser considerado ao comparar fenótipos.

Demuth et al . localizaram 1.480 genes humanos que não tinham nenhum ortólogo no genoma do chimpanzé. 28 Esses genes não foram contabilizados no estudo de Glazko et al . Obviamente, não são apenas os genes altamente semelhantes que são importantes para estudar, mas os genes que estão presentes e/ou ausentes entre as espécies, como Hughes et al . descobriram ao comparar sequências do cromossomo Y. 29 Veja a discussão dos genes do cromossomo Y em nosso artigo complementar. 5

Esta pesquisa é especialmente significativa porque acredita-se que sequências de DNA não codificadoras de proteínas usadas para funções regulatórias são muito mais propensas a serem responsáveis ​​por grandes diferenças físicas e fisiológicas entre espécies. Muito DNA não codificador de proteínas (anteriormente chamado de DNA lixo) consiste em uma ampla variedade de elementos reguladores para transcrição e tradução, muitas classes de RNAs reguladores, código pseudogênico regulador crítico e várias características determinantes da matriz nuclear. 30

As proteínas são determinadas, em última análise, não apenas por suas transcrições específicas de DNA, mas também pelo processamento. O sistema de processamento de mRNA (RNA mensageiro) envolve o splicing de segmentos de codificação de proteínas no RNA transcrito. O splicing é o processo pelo qual os íntrons são removidos e os exons (as regiões de codificação dos genes) são unidos para gerar o mRNA maduro que especifica as proteínas a serem traduzidas. As diferenças de splicing para um único gene podem gerar muitas variantes de proteínas e isso é controlado por sistemas regulatórios muito complexos. Na verdade, a pesquisa documentou que o splicing alternativo difere significativamente entre humanos e chimpanzés. 31 Os pesquisadores descobriram que de 6 a 8% dos eventos de splicing alternativo que eles avaliaram mostraram diferenças de proteínas: uma variante que eles consideraram altamente significativa. 31

Diferenças na expressão genética

De acordo com Oldham et al ., um importante paradigma do genoma é agora reconhecido para o qual

“… a elevada extensão da homologia de sequências entre proteínas humanas e de chimpanzés apoia a hipótese de longa data de que muitas diferenças fenotípicas entre as espécies refletem diferenças na regulação da expressão genética, além de diferenças nas sequências de aminoácidos.” 32

Na verdade, já em 1975 King e Wilson postularam que as principais diferenças entre humanos e macacos eram devidas em grande parte a fatores que controlavam a expressão genética:

“Sugerimos que as mudanças evolutivas na anatomia e no modo de vida são mais frequentemente baseadas em mudanças nos mecanismos que controlam a expressão de genes do que em mudanças de sequência em proteínas. Portanto, propomos que as mutações regulatórias são responsáveis ​​pelas principais diferenças biológicas entre humanos e chimpanzés.” 33

Diferenças interespecíficas na expressão gênica em todo o genoma são uma questão complicada. Em humanos e chimpanzés, esperaríamos pequenas diferenças na regulação entre genes de manutenção altamente conservados que desempenham funções bioquímicas semelhantes não apenas em primatas, mas em mamíferos em geral. Portanto, os evolucionistas se concentraram nas principais características que tornam humanos e macacos diferentes, como a função cerebral e as principais diferenças de regulação entre genes expressos no cérebro. Quando esse fator importante é avaliado, muitas diferenças genéticas entre humanos e chimpanzés foram encontradas.

Um dos primeiros estudos de regulação de genes cerebrais, por Cáceres et al. , identificou 169 genes que foram diferencialmente expressos nos córtices cerebrais de humanos, chimpanzés e macacos. Destes genes, 90% foram regulados positivamente em níveis significativamente mais altos em humanos do que em chimpanzés. Em contraste, os genes de manutenção da casa no fígado mostraram níveis semelhantes de expressão. 34 De seu resumo, os autores concluíram que “O cérebro humano exibe um padrão distinto de expressão genética em relação aos primatas não humanos, com níveis de expressão mais altos para muitos genes pertencentes a uma ampla variedade de classes funcionais”.

Um estudo um tanto semelhante, Uddin et al ., confirmou essas diferenças e acrescentou:

“… na ancestralidade tanto dos humanos como dos chimpanzés, mas em maior extensão nos humanos, estão os perfis de expressão regulados positivamente dos genes do metabolismo energético aeróbico e dos genes relacionados com a função neuronal, sugerindo que o aumento da atividade neuronal requer maiores suprimentos de energia.” 35

Khaitovich et al . examinaram diferenças de expressão genética no cérebro, coração, fígado, rim e testículo entre humanos e chimpanzés. Em concordância com os estudos de expressão acima mencionados, as diferenças de expressão cerebral foram novamente consideradas altamente significativas. 36 Esses pesquisadores também detectaram diferenças significativas nos níveis de expressão para rim, fígado e testículo. Mais notavelmente, as diferenças de expressão genética do cromossomo sexual associadas aos genes do cromossomo Y foram excepcionalmente marcadas no testículo. 37 Esses resultados foram posteriormente apoiados por um relatório de 2010 que mostrou diferenças dramáticas entre a estrutura dos cromossomos Y de humanos e chimpanzés, particularmente para genes expressos no testículo. 16

Em relação ao estudo das diferenças nas sequências regulatórias, cientistas da Duke University realizaram um estudo das regiões promotoras de certos genes nos genomas humano, chimpanzé e macaco. Essas são as seções de DNA que precedem o gene e ajudam a regular seus níveis de expressão. Eles identificaram 575 promotores de genes humanos que eram muito diferentes daqueles em chimpanzés. 38 A maioria das diferenças estava envolvida em promotores que controlam o desenvolvimento das células nervosas, mas algumas estavam envolvidas em outras funções, como o metabolismo de carboidratos. Como mencionado anteriormente, o aumento do metabolismo coincide com níveis aumentados de atividade cerebral. Como as regiões codificadoras de proteínas reais dos genes (exons), as regiões promotoras geralmente envolvem um pequeno número de nucleotídeos em uma base genômica ampla, mas pequenas diferenças de DNA nessas regiões podem ter um efeito enorme.

Conforme afirmado por Oldham et al .:

“… as comparações da expressão genética entre cérebros de primatas humanos e não humanos identificaram centenas de genes expressos diferencialmente, mas traduzir essas listas em distinções funcionais importantes entre espécies tem se mostrado difícil.” 39

Uma conclusão importante da pesquisa de Oldham é que as comparações de genes de diferentes animais exigem o estudo do conjunto de produtos de um grande número de genes para entender tanto a magnitude quanto as diferenças qualitativas. O que complica as coisas nesses tipos de análises é o fato de que a maioria dos genes no genoma produz múltiplas variantes de transcrição. 40

No entanto, alguns genes que são altamente conservados ao longo da vida, particularmente aqueles que compartilham similaridades em sistemas metabólicos, podem produzir elementos de homologia em seus transcriptomas. Por exemplo, toda a vida usa ATP, ADP e muitas outras estruturas bioquímicas comuns. Consequentemente, espera-se que a fabricação e a regulação dessas biomoléculas compartilhem muita similaridade, e a ATP sintase é quase idêntica em muitos sistemas biológicos. O foco deve, portanto, estar nos conjuntos de transcrições que mostram diferenças interespecíficas importantes em sua regulação e estrutura.

Uma maneira única de olhar para a expressão genética é identificar subconjuntos sobrepostos de genes entre módulos de genes que são expressos. Os genes são frequentemente expressos em módulos ou conjuntos de genes e o subconjunto sobreposto de genes comuns a módulos inter-relacionados são denominados conexões de rede. Um estudo descobriu que 17,4% das conexões de rede genética eram específicas para humanos e não para chimpanzés. 41 Além disso, os humanos têm 689 genes expressos conhecidos não possuídos por chimpanzés, e sem dúvida mais serão descobertos conforme a pesquisa avança.

O uso da tecnologia comercial de chips genéticos, chamada microarrays, para medir os níveis de expressão de milhares de genes diferentes em humanos e chimpanzés encontrou pouca diferença na expressão genética em células sanguíneas e hepáticas entre as duas espécies, mas enormes diferenças na expressão genética cerebral. Os pesquisadores descobriram que a diferença era tão grande que, se humanos e chimpanzés compartilhassem um ancestral comum, a taxa de mudança deve ter sido 5,5 vezes mais rápida em humanos do que em chimpanzés. 42

Ao usar eletroforese em gel bidimensional para separar proteínas cerebrais humanas e de chimpanzés com base em seu tamanho e carga, dois tipos de dados foram coletados: qualitativos, medindo as diferenças nos tipos de proteína, e quantitativos, medindo as diferenças nas quantidades de proteína. 43 Usando essa técnica, eles encontraram grandes diferenças entre humanos e chimpanzés. Uma diferença qualitativa de 7% foi calculada, mas uma diferença quantitativa quatro vezes maior (31%) foi determinada, refletindo os padrões vastamente diferentes de expressão gênica que ocorrem nas células neuronais de humanos versus chimpanzés. Embora muitos genes sejam notavelmente semelhantes nos dois organismos, muitos genes são expressos de forma muito diferente em cada espécie. 44 Curiosamente, à medida que a tecnologia do chip genético melhorou, Geschwind et al. encontraram diferenças comparativas distintas na expressão gênica do fígado, além de muitas diferenças na expressão gênica do cérebro. 41

Outro nível do genoma frequentemente ignorado ao avaliar similaridade é a natureza dos interatomas, como certos conjuntos de genes expressos interagem com outros conjuntos de genes expressos. Um exemplo simplificado seriam as funções de computadores, câmeras digitais e videocassetes (figura 3). Embora todos esses dispositivos eletrônicos sejam muito diferentes, cada um contém muitos componentes semelhantes, incluindo transistores, resistores, capacitores, transformadores, placas de circuito e fios. A diferença essencial não está nos componentes usados, mas sim em como os componentes se relacionam entre si como um todo integrado. Da mesma forma, humanos e chimpanzés compartilham conjuntos semelhantes de genes, mas eles são usados ​​e interagem de maneiras diferentes para formar criaturas completamente diferentes. Alterar uma conexão entre os componentes do sistema (genes) requer que muitas outras mudanças calculadas simultâneas ocorram para que o sistema funcione.

computador
câmera
videocassete

Figura 3. Computadores, câmeras digitais e videocassetes são todos dispositivos eletrônicos muito diferentes, mas cada um contém muitos componentes semelhantes. A diferença essencial está em como os componentes se relacionam entre si como uma unidade integrada funcional. Fotos cortesia de sxc.hu/ante3, sxc.hu/rayanneca8, istock.com/KLH49

A regulação genética, incluindo o tempo e o nível de expressão genética, envolve regulação genética e epigenética. Um importante sistema de regulação genética é o sistema de micro RNA (miRNA). Em geral, os miRNAs têm cerca de 22 pares de bases e ajudam a regular muitos genes. Em um estudo comparando humanos e chimpanzés, 447 novos miRNAs foram identificados em humanos. 45 Além disso, o miRNA auxiliou na identificação de 51 genes únicos que foram encontrados em humanos, mas não em chimpanzés, 371 que estavam em ambos e 25 apenas em chimpanzés. Embora este estudo tenha muitas limitações, conforme detalhado na parte 2, ele indica que as diferenças de miRNA em chimpanzés e humanos são significativas.

Problemas com a interpretação da similaridade do alfabeto do DNA

Se as declarações de pesquisa publicadas sobre dados altamente seletivos escolhidos a dedo forem levadas ao pé da letra, concluir que o DNA humano e o do chimpanzé têm 94% (ou mais) de similaridade ainda é seriamente enganoso. O problema é que tendemos a pensar na sequência de DNA como uma linguagem escrita por humanos, em formato linear padrão semelhante ao alfabeto inglês de 26 letras. Esse raciocínio avalia as diferenças como se alguém alinhasse textos escritos paralelos. Dois livros escritos por humanos que são 98% semelhantes são essencialmente o mesmo livro. Os evolucionistas costumam usar essa analogia, mas ela é completamente inapropriada. O código do alfabeto de quatro letras do DNA que designa vinte aminoácidos diferentes por códons (bases triplas de sequências específicas) considera apenas a pequena fração do genoma que realmente codifica a proteína.

O restante do genoma envolve muitos outros tipos de código de DNA que incluem função regulatória, características de fixação da matriz nuclear, arranjo e empacotamento nuclear e toda uma diversidade de estruturas bidimensionais e tridimensionais. A extrema diversidade de código informacional no genoma também ocorre, não apenas em múltiplas camadas abstratas de extrema complexidade informacional, mas também em formatos bidimensionais e tridimensionais (informações baseadas em topologia) que são interativos com informações de sequência baseadas em linear. Muitos códigos genômicos baseados em linear (características genômicas) também contêm múltiplos níveis de significado e estão muito além da complexidade do alfabeto humano ou de qualquer código de computador orientado a objetos, de alto nível e feito pelo homem. 46

O projeto genoma do chimpanzé resolveu a questão?

As publicações do consórcio de sequenciamento produziram uma cobertura de rascunho shotgun (redundância quíntupla) do genoma do chimpanzé. 47 Este estudo na verdade ofuscou a questão da similaridade do DNA ao obter níveis de similaridade de 98–99% devido a dados selecionados e excluindo indels. Não mais do que 70% do DNA do chimpanzé pôde ser alinhado à montagem do genoma humano (veja o artigo complementar nesta edição 5 ), mesmo depois de fazer generosas concessões para lacunas e mascarar sequências de baixa complexidade nos alinhamentos.

Os autores também sustentam a suposição comum, mas falsa, de que o DNA repetitivo (DNA "lixo") é irrelevante. Ao usar técnicas semelhantes às usadas para fazer comparações entre humanos e chimpanzés, o DNA humano também acaba sendo, aproximadamente, estimado em cerca de 35% idêntico ao DNA do narciso, mas não se segue que sejamos fisicamente 35% narciso. 48 Chimpanzés e humanos compartilham maiores similaridades de DNA do que chimpanzés ou humanos em comparação a um narciso, mas colocar uma medida precisa na similaridade não é uma tarefa trivial, e os números publicados são claramente enganosos devido à sua aparência sedutora de simplicidade, às suposições não declaradas necessárias para produzi-los e à ilusão de precisão que eles transmitem.

E quanto ao tamanho do genoma?

Um exemplo de quão enganosos os números de 94–98% podem ser é o fato de que o genoma do chimpanzé tem sido consistentemente relatado como sendo cerca de 6–10% maior do que o genoma humano, estimando o conteúdo de DNA nuclear (massa em picogramas). Este é um processo pelo qual os núcleos são extraídos das células em um tampão isotônico para evitar a ruptura e, em seguida, passados ​​por um sensor de citômetro celular de forma serial que mede a quantidade de DNA com base na fluorescência. Um padrão conhecido é usado para calibrar a máquina. Um estudo relata que o genoma do chimpanzé contém 3,8 bilhões de pares de bases, em comparação com quase 3,2 bilhões para humanos. 49 O site 'www.genomesize.com' inclui uma variedade de estimativas para um aumento de até 10% no tamanho do genoma do chimpanzé em comparação ao humano.

Em confirmação desses relatórios de citometria, os dados mais recentes de 'montagem do caminho dourado' divulgados pelo grupo ENSEMBL (projeto científico conjunto entre o Instituto Europeu de Bioinformática e o Instituto Wellcome Trust Sanger; www.ensembl.org) colocam o chimpanzé em 8% maior que o humano. A estimativa da montagem do caminho dourado é a quantidade contígua de sequência do genoma do chimpanzé montada que agora representa uma cobertura redundante maior que 6,5 vezes. Portanto, usando apenas essa comparação, existe apenas 92% de similaridade antes que a identidade da sequência seja mesmo verificada. Em seguida, o nível de dados de sequência redundantes deve ser determinado. Se 1.000 cópias de uma repetição altamente similar existem em uma espécie e apenas 10 cópias existem em outra, não se pode reivindicar uma similaridade de 99% na sequência. 50

Paradoxo ou previsão lógica

O paradoxo para o evolucionista é como entender as principais diferenças genéticas claramente observadas em humanos e chimpanzés, apesar de suas várias regiões de similaridade genética. Muitas similaridades morfológicas e fisiológicas grosseiras existem entre humanos e chimpanzés, incluindo seus órgãos internos do corpo. Como criacionistas ou pesquisadores de design inteligente, obviamente esperaríamos que essas similaridades fenotípicas fossem refletidas na genética. No entanto, osso por osso, músculo por músculo, órgão por órgão, os corpos de humanos e macacos geralmente diferem de maneiras muito sutis a muito dramáticas, dependendo da característica que está sendo comparada.

Um livro recente do escritor científico da BBC Jeremy Taylor destacou uma variedade dessas diferenças críticas. 51 Além disso, as diferenças genéticas são claramente ignoradas, minimizadas e ofuscadas pela imprensa popular e, infelizmente, por biólogos treinados também. 52-57 O artigo complementar descreve em detalhes como dados importantes são frequentemente omitidos dos alinhamentos de DNA humano-chimpanzé. 5 Ele também mostra como a maioria dos dados usados ​​para pesquisa de similaridade humano-chimpanzé é pré-selecionada e selecionada para dar suporte ao resultado evolutivo mais favorável.

Publicado na página inicial: 28 de junho de 2013"

Referências

  1. Cohen, J., Diferenças relativas: o mito de 1%, Science 316 :1836, 29 de junho de 2007. Retornar ao texto .
  2. Hoyer BH et al. , Exame da evolução dos hominídeos por homologia de sequência de DNA, J. Human Evolution 1 :645–649, 1972. Retornar ao texto .
  3. Português Sibley, CG e Ahlquist, JE, A filogenia dos primatas hominóides, conforme indicado pela hibridização DNA-DNA, J. Molecular Evolution 20 :2–15, 1984. Retornar ao texto .
  4. Português Sibley, CG, Evidência de hibridização de DNA da filogenia hominoide: uma reanálise dos dados, J. Molecular Evolution 30 :202–236, 1990. Retornar ao texto .
  5. Tomkins, J. e Bergman, J., Negócio de macacos genômicos - estimativas de similaridade de DNA humano-chimpanzé quase idêntica reavaliadas usando dados omitidos , J. Creation 26 (1):94–100, 2012. Retornar ao texto .
  6. Gibbons, A., Quais dos nossos genes nos tornam humanos? Science 281 :1432– 1434, 1998. Retornar ao texto .
  7. Marks, J., O que significa ser 98% chimpanzé: macacos, pessoas e seus genes , Berkeley e Los Angeles, CA, University of California Press, 2002. Retornar ao texto .
  8. Britten, RJ, Divergência entre amostras de sequências de DNA de chimpanzés e humanos é de 5% de contagem de indels, Proceedings of the National Academy of Sciences 99 :13633–13635, 2002. Retornar ao texto .
  9. Consórcio de Sequenciamento e Análise de Chimpanzés, Sequência inicial do genoma do chimpanzé e comparação com o genoma humano, Nature 437 :69–87, 2005. Retornar ao texto .
  10. Tomkins, J., Como os genomas são sequenciados e por que isso importa: implicações para estudos em genômica comparativa de humanos e chimpanzés, Answers Research Journal 4 :81–88, 2011, www.answersingenesis.org/articles/arj/v4/n1/implications-for-comparative-genomics. Retornar ao texto .
  11. Veja Bergman, J., Slaughter of the Dissidents: The Shocking Truth About Killing the Careers of Darwin Doubters , Leafcutter Press, Southworth, WA, 2008. Retornar ao texto .
  12. Cheng, Z., Ventura, M., She, X., Khaitovich, P., Graves, T., Osoegawa, K., Church, D., DeJong, P., Wilson, RK, Pääbo, S., Rocchi, M. e Eichler, EE, Uma comparação de todo o genoma de duplicações segmentares recentes de chimpanzés e humanos, Nature 437 :88–93, 2005. Retornar ao texto .
  13. Newman, TL et al. , Um estudo de todo o genoma sobre a variação estrutural entre humanos e chimpanzés, Genome Res. 15 :1344–1356, 2005. Retornar ao texto .
  14. Marques-Bonet, T. et al. , Uma explosão de duplicações segmentares no genoma do ancestral do grande macaco africano, Nature 457 :877–881, 2009. Retornar ao texto .
  15. Português Hobolth, A. et al. , Relações genômicas e tempos de especiação de humanos, chimpanzés e gorilas inferidos de um modelo de Markov oculto coalescente, PLOS Genetics 3 :0294–0304, 2007. Retornar ao texto .
  16. Hughes, JF et al. , Os cromossomos Y de chimpanzés e humanos são notavelmente divergentes em estrutura e conteúdo genético, Nature 463 :536–539, 2010. Retornar ao texto .
  17. Hobolth, A. et al. , Padrões incompletos de classificação de linhagem entre humanos, chimpanzés e orangotangos sugerem especiação recente de orangotangos e seleção generalizada, Genome Research 5 :349–356, 2011. Retornar ao texto .
  18. Chen, F. e Li, W., Divergências genômicas entre humanos e outros hominoides e o tamanho populacional efetivo do ancestral comum de humanos e chimpanzés, American J. Human Genet. 68 :444–456, 2001. Retornar ao texto .
  19. Yang, ZH, Estimativa de probabilidade e Bayes de tamanhos populacionais ancestrais em hominoides usando dados de múltiplos loci, Genetics 162 :1811–1823, 2002. Retornar ao texto .
  20. Wall, JD, Estimativa de tamanhos de populações ancestrais e tempos de divergência, Genetics 163 :395–404, 2003. Retornar ao texto .
  21. Patterson, N. et al. , Evidência genética para especiação complexa de humanos e chimpanzés. Nature 441 :1103–1108, 2006. Retornar ao texto .
  22. Hobolth, A. et al. , Relações genômicas e tempos de especiação de humanos, chimpanzés e gorilas inferidos de um modelo de Markov oculto coalescente, PLoS Genet 3 :e7. doi: 10.1371/journal.pgen.0030007, 2007. Retornar ao texto .
  23. Ebersberger, I. et al. , Comparação genômica de sequências de DNA entre humanos e chimpanzés, American J. Human Genetics 70 :1490–1497, 2002. Retornar ao texto .
  24. Ebersberger, I. et al. , Mapeando a ancestralidade genética humana, Molecular Biology and Evolution 24 :2266–2276, 2007. Retornar ao texto .
  25. Cheng et al., Uma comparação genômica ampla de duplicações segmentares recentes de chimpanzés e humanos, Nature 437 :88–93 2005. Retornar ao texto .
  26. Para uma revisão recente que discute questões de montagem de DNA associadas a várias metodologias no sequenciamento do genoma, veja Tomkins, J., Evaluating the human–chimp DNA myth—new research data, Acts & Facts 40 (10):6, 2011. Retornar ao texto .
  27. Glazko, G., Veeramachaneni, V., Nei, M. e Makalowski, W., Oitenta por cento das proteínas são diferentes entre humanos e chimpanzés, Gene 346 :215–219, 2005. Retornar ao texto .
  28. Demuth, JP, Bie, TD, Stajich, JE, Cristiani, N. e Hahn, MW, A evolução das famílias de genes de mamíferos, PLoS One 1 :e85, 10 pp., 2006. Retornar ao texto .
  29. Hughes, ref. 16, p. 536. Retornar ao texto .
  30. Wells, J., O Mito do DNA Lixo , Discovery Institute Press, Seattle, WA, 2011. Retornar ao texto .
  31. Português Calarco, J., Xing, Y., Cáceres, M., Calarco, J., Xiao, X., Pan, Q., Lee, C., Preuss, T. e Blencowe, B., Análise global das diferenças de splicing alternativo entre humanos e chimpanzés, Genes & Development 21 :2963–2975, 2007. Retornar ao texto .
  32. Oldham, MC, Horvath, S. e Geschwind, DH, Conservação e evolução de redes de coexpressão genética em cérebros humanos e de chimpanzés, Proc. 103 (47):17973–17978, 2006. Retornar ao texto .
  33. King, MC e Wilson, AC, Evolução em dois níveis em humanos e chimpanzés, Science 188 :107–116, 1975. Retornar ao texto .
  34. Cáceres, M. et al. , Níveis elevados de expressão genética distinguem cérebros de primatas humanos de não humanos, Proc Nat. Acad. Sci. 100 :13030–13035, 2003. Retornar ao texto .
  35. Português Uddin, M, Wildman, DE, Guozhen, L., Xu, W., Johnson, RM, Hof, PR, Kapatos, G., Grossman, LI e Goodman, M., Agrupamento irmão de chimpanzés e humanos conforme revelado pela análise filogenética de todo o genoma de perfis de expressão gênica cerebral, Proc Nat. Sci. 101 :2957–2962, 2004. Retornar ao texto .
  36. Khaitovich, P., Klose, J., Zöllner, S., Heissig, F., Giavalisco, P., Nieselt-Struwe, K., Muchmore, E., Varki, A., Ravid, R., Doxiadis, GM , Bontrop, RE e Pääbo, S., Variação intra e interespecífica em padrões de expressão genética de primatas, Science 296 : 340–343, 2002. Voltar ao texto .
  37. Khaitovich, P., Hellman, I., Enard, W., Nowick, K., Leinweber, M., Henriette, F., Weiss, G., Lachmann, M. e Paabo, S., Padrões paralelos de evolução nos genomas e transcriptomas de humanos e chimpanzés, Science 309 :1850–1854, 2005. Retornar ao texto .
  38. Haygood, R., Fedrigo, O., Hanson, B., Yokoyama, KD e Wray, GA, Regiões promotoras de muitos genes relacionados à nutrição e aos neurônios passaram por seleção positiva durante a evolução humana, Nature Genetics 39 :1140–1144, 2007. Retornar ao texto .
  39. Oldham, MC et al. , Conservação e evolução de redes de coexpressão genética em cérebros humanos e de chimpanzés, Proc. Sci. 103 :17973–17978, 2006. Retornar ao texto .
  40. Barash, Y. et al. , Decifrando o código de splicing, Nature 465 :53–59, 2010. Retornar ao texto .
  41. Geschwind, DH, Genes, Brain and Behavior 5 :64–53, 2006. Retornar ao texto .
  42. Português Cáceres, M., Lachuer, J., Zapala, MA, Redmond, JC, Kudo, L., Geschwind, DH, Lockhart, DJ, Preuss, TM e Barlow, C., Níveis elevados de expressão genética distinguem cérebros de primatas humanos e não humanos, Proc. Sci. 100 :13030–13035, 2003. Retornar ao texto .
  43. Enard, W. et al. , Evolução molecular do FOXP2, um gene envolvido na fala e na linguagem, Nature 418 :869–872, 2002. Retornar ao texto .
  44. Cáceres et al. , ref. 42, p. 13030. Retornar ao texto .
  45. Berezikov, EF et al. , Diversidade de microRNAs no cérebro humano e de chimpanzé, Nature Genetics 38 (12):1375–1377, 2006. Voltar ao texto .
  46. Barash et al. , ref. 40, p. 53. Retornar ao texto .
  47. Ajit, V. e Altheide, TK, Comparando os genomas humano e do chimpanzé: procurando agulhas em um palheiro, Genome Research 15 :1746–1758 2005. The Chimpanzee Sequencing and Analysis Consortium, sequência inicial do genoma do chimpanzé e comparação com o genoma humano, Nature 437 :69–87, 2005. Para comparações, veja International Human Genome Sequencing Consortium, sequenciamento inicial e análise do genoma humano, Nature 409 :861–920, 2001 e International Human Genome Sequencing Consortium, finalizando a sequência eucromática do genoma humano, Nature 431 :931–945, 2004. Retornar ao texto .
  48. Marcas, ref. 7, p. 29. Retornar ao texto .
  49. Pellicciari, C., Formenti, D., Redi, CA e Manfredi Romanini, MG, Variabilidade do conteúdo de DNA em primatas, Journal of Human Evolution 1 :131–141, 1982. Retornar ao texto .
  50. Wildman, DE, Uddin, M., Liu, G., Grossman, LI e Goodman, M., Implicações da seleção natural na formação de 99,4% de identidade de DNA não sinônimo entre humanos e chimpanzés: ampliando o gênero homo, Proc. Na. Acad. Sci. 100 :7181–7188, 2003. Retornar ao texto .
  51. Taylor, J., Not A Chimp: The Hunt to Find the Genes That Make Us Human , Oxford University Press, Nova York, 2009. Retornar ao texto .
  52. Dawkins, R., The Blind Watchmaker , Norton and Company, Nova York, 1986. Retornar ao texto .
  53. Português Fujiyama, A., Watanabe, A., Toyoda, A., Taylor, TD, Itoh, T., Tsai, S.-F., Park, H.-S., Yaspo, M.-L., Lehrach, H., Chen, Z., Fu, G., Saitou, N., Osoegawa, K., de Jong, PJ, Suto, Y., Hattori, M. e Sukaki, Y., Construção e análise de um mapa de clones comparativos entre humanos e chimpanzés, Science 295 :131–134, 2002. Retornar ao texto .
  54. Hsiung LW e Saunders, MA, O chimpanzé e nós, Nature 437 :50–51, 2005. Retornar ao texto .
  55. Gibbs, R., Insights evolutivos e biomédicos do genoma do macaco Rhesus, Science 316 :222–237, 2007. Retornar ao texto .
  56. Venter, JC et al. , A sequência do genoma humano, Science 291 :1304–135, 2001. Retornar ao texto .
  57. Romanini, MG, Conteúdo de DNA nuclear e área de linfócitos de primatas como uma ferramenta citotaxonômica, Journal of Human Evolution 1 :23–40, 1972. Retornar ao texto .



10 - Minhas considerações:

1 - Caso a afirmação do 1% de semelhança estivesse correta, ainda assim, os 35 milhões de bits/pares de bases de diferenças impedem concluir que humanos e chimpanzés (e outros símios) tiveram um ser em comum no passado que se diferenciou e levou às diferenças que temos; se usarmos 3%, será algo em torno de 105 milhões de pares de bases diferentes; 10% - 350 milhões;

2 - Este percentual (1%) tem sido questionado e refutado, seja por 2 a 5% até algo perto de 30% de diferença (de modo estranho, as referências a Richard Buggs não mais levam a afirmações suas, mas como os autores que o utilizaram como referência complementar desenvolveram materiais independentes, simplesmente vou, por enquanto, desconsiderar tal fonte, mas o argumento dos autores e o desenvolvimento que fizeram para chegar a tal percentual permanece);

3 - A ausência no registro fóssil é algo que colabora para invalidar qualquer tentativa, mas considerando que a análise fóssil também parte de pressupostos não verificáveis/demonstráveis, creio que a dúvida deve sempre ser forte em relação a supostas descobertas que venham a "provar/evidenciar" que os seres como humanos se símios vieram de um ancestral comum;

4 - O método Blast não requer que um genoma seja estruturado de forma semelhante ao outro, mostrando-se algo que considero uma verdadeira manipulação e filtragem indevida de dados para que o resultado se torne menos impossível à especulação de ancestralidade comum;

"Um dos métodos mais populares é baseado em um algoritmo chamado Blast24 , que corta o DNA de ambos os genomas em pequenos segmentos e, em seguida, tenta compará-los. Essa parece ser a forma mais “generosa” de confrontar dois genomas e também a que leva a maior semelhança possível, uma vez que não requer que um genoma seja estruturado de forma semelhante ao outro. O que importa no Blast é encontrar um pouco de informação parecida em qualquer lugar do outro genoma..", nos informa Marcos Eberlin em "Fomos Planejados ";

5 - O cromossomo Y se mostra um obstáculo para a teoria de ancestralidade comum, contradizendo a ideia de evolução rápida que se usa para justificar o quanto somos diferentes;

6 - A diferença de 23 e 24 pares de cromossomos não pode ser explicada pela "fusão evolutiva dos cromossomos 2A e 2B";

7 - As diferenças proteicas seriam de 80%;

"Assim, um grau muito elevado de semelhança de sequências pode ser irrelevante se o AA que é diferente desempenha um papel crucial, e um único ou pouquíssimos AAs costumam tornar uma proteína 100% diferente da outra." - Eberlin - Fomos Planejados;

8 - A enorme diferença dos telômeros impede o discurso de similaridade, e também o discurso de diferenças como insignificantes;

"Os telômeros dos chimpanzés e de outros primatas têm cerca de 23 mil bases repetidas. Os humanos são únicos entre os primatas e possuem telômeros bem menores, com cerca de dez mil repetições, o que nos torna, em termos de telômeros – só considerando tamanho –, cerca de 67% diferentes 34." Eberlin - Fomos Planejados.

Tendo estas considerações em mente, entendo que a melhor explicação é a de que não temos ancestralidade comum com chimpanzés/símios (nem com protocélula, répteis, aves, outros mamíferos, etc).

As evidências caminham numa crescente confirmação de que fomos planejados, criados com capacidade de adatação ao meio (variabilidade biológica normal), com limites nesta variabilidade (e quando estes limites não são suficientes para a adaptação, caminha-se para a extinção).

As semelhanças indicam um padrão de planejamento muito bem desenvolvido, e as diferenças, complexidade funcional, complexidade irredutível, improbabilidade de qualquer ponto evolutivo proposto ter ocorrido nos moldes da macroevolução, apelo a singularidades e explicações "ad hoc" cada vez mais distantes de qualquer realidade observável...também indicam o mesmo.


Marcelo R. M. Ramos

Comentários