Semelhança entre humanos e chimpanzés - artigo PubMed - ScienceDirect

 1 - https://pubmed.ncbi.nlm.nih.gov/41730356/ 


.10 de maio de 2026:990:150058.
 
doi: 10.1016/j.gene.2026.150058. 
Publicado eletronicamente em 21 de fevereiro de 2026.

Quão semelhantes são os humanos e os chimpanzés em termos de proteínas expressas, conforme estimado pela proteômica sérica baseada em espectrometria de massa?

Afiliações
Artigo gratuito

Resumo

A questão de quão semelhantes os humanos são aos chimpanzés e outros primatas tem sido central nas investigações sobre nossas origens. Genomicamente, inicialmente demonstrou-se que eles eram 98,5% semelhantes, mas essa semelhança tem diminuído. Fisiologicamente, ambas as espécies são substancialmente diferentes, e os esforços têm se concentrado em determinar as fontes de tais contrastes. 

Arranjos lineares de nucleotídeos ATGC podem parecer semelhantes, mas variações no processamento de genomas tão complexos, interconectados e extensos podem resultar em espécies substancialmente diferentes. Um objetivo fundamental na comparação entre chimpanzés e humanos seria, portanto, mapear a maioria, idealmente todas, as proteínas e funções expressas por eles. 

Um estudo teórico pioneiro, porém limitado, concluiu que humanos e chimpanzés diferem em até 80% em suas proteínas. Para avaliar de forma mais abrangente o nível dessa diferença, realizamos uma análise proteômica 4-D baseada em espectrometria de massas de última geração, utilizando proteínas genuínas do soro sanguíneo – o grupo proteômico humano mais abrangente. 

Das proteínas identificadas, descobrimos que humanos e chimpanzés são 44% diferentes. Se incluirmos proteínas compartilhadas, mas com expressão diferencial, em uma avaliação menos rigorosa, essa dissimilaridade aumenta para 66%. Redes de interação proteína-proteína revelaram ainda conjuntos contrastantes de proteínas fisicamente/funcionalmente conectadas, fornecendo informações sobre a resposta imune e a suscetibilidade a doenças específicas de cada espécie, destacando possíveis tendências para uma resposta imune muito mais reativa em humanos. 

O soro do chimpanzé também apresenta maior abundância de seis proteínas de ligação ao fator de crescimento semelhante à insulina, o que pode indicar diferenças substanciais no desenvolvimento muscular e no metabolismo energético. No geral, nossas descobertas exploratórias sobre proteínas séricas indicam que a proteômica baseada em espectrometria de massas pode, de fato, contribuir para aprimorar nossa compreensão da base molecular das divergências entre humanos e chimpanzés, sinalizando que elas ocorrem essencialmente no nível das proteínas expressas. 

Essa grande divergência proteica, conforme indicado pelas proteínas séricas, em comparação com um conteúdo genético mais semelhante, provavelmente resulta de diferentes níveis e estratégias de expressão gênica, bem como de modificações proteicas pós-transcricionais e pós-traducionais.

Palavras-chave: Evolução do chimpanzé; Genômica, Proteômica; Evolução humana; Soro.

Aviso Legal do PubMed

Declaração de conflito de interesses

Declaração de conflito de interesses: Os autores declaram não possuir quaisquer interesses financeiros ou relações pessoais que possam ter influenciado o trabalho apresentado neste artigo.

Artigos semelhantes

Termos MeSH

Substâncias




Quão semelhantes são os humanos e os chimpanzés em termos de proteínas expressas, conforme estimado pela proteômica sérica baseada em espectrometria de massa?

https://doi.org/10.1016/j.gene.2026.150058Obtenha direitos e conteúdo.
Sob licença Creative Commons
Acesso aberto

Destaques

  • Uma análise 4D de última geração baseada em espectrometria de massa de proteínas do soro — o grupo proteômico mais abrangente.
  • Constatou-se que humanos e chimpanzés apresentam 44% de diferenças em proteínas únicas ou 66% de diferenças em proteínas únicas com expressão diferencial.
  • As redes de interação proteína-proteína revelaram conjuntos contrastantes de proteínas fisicamente/funcionalmente conectadas.
  • O soro de chimpanzés apresenta maior abundância de seis proteínas de ligação ao fator de crescimento semelhante à insulina.
  • Essa grande divergência de 66% nas proteínas provavelmente resulta de diferentes estratégias dos complexos mecanismos de expressão gênica.

Resumo


A questão de quão semelhantes os humanos são aos chimpanzés e outros primatas tem sido central nas investigações sobre nossas origens. Genomicamente, inicialmente demonstrou-se que eles eram 98,5% semelhantes, mas essa semelhança tem diminuído. Fisiologicamente, ambas as espécies são substancialmente diferentes, e os esforços têm se concentrado em determinar as fontes de tais contrastes. 
Arranjos lineares de nucleotídeos ATGC podem parecer semelhantes, mas variações no processamento de genomas tão complexos, interconectados e extensos podem resultar em espécies substancialmente diferentes. Um objetivo fundamental na comparação entre chimpanzés e humanos seria, portanto, mapear a maioria, idealmente todas, as proteínas e funções expressas por eles. 
Um estudo teórico pioneiro, porém limitado, concluiu que humanos e chimpanzés diferem em até 80% em suas proteínas. Para avaliar de forma mais abrangente o nível dessa diferença, realizamos uma análise proteômica 4-D baseada em espectrometria de massas de última geração, utilizando proteínas genuínas do soro — o grupo proteômico humano mais abrangente. 
Das proteínas identificadas, descobrimos que humanos e chimpanzés são 44% diferentes. Se incluirmos proteínas compartilhadas, mas com expressão diferencial, em uma avaliação menos rigorosa, essa dissimilaridade aumenta para 66%. Redes de interação proteína-proteína revelaram ainda conjuntos contrastantes de proteínas fisicamente/funcionalmente conectadas, fornecendo informações sobre a resposta imune e a suscetibilidade a doenças específicas de cada espécie, destacando possíveis tendências para uma resposta imune muito mais reativa em humanos. 
O soro do chimpanzé também apresenta maior abundância de seis proteínas de ligação ao fator de crescimento semelhante à insulina, o que pode indicar diferenças substanciais no desenvolvimento muscular e no metabolismo energético. No geral, nossas descobertas exploratórias sobre proteínas séricas indicam que a proteômica baseada em espectrometria de massas pode, de fato, contribuir para aprimorar nossa compreensão da base molecular das divergências entre humanos e chimpanzés, sinalizando que elas ocorrem essencialmente no nível das proteínas expressas. 
Essa grande divergência proteica, conforme indicado pelas proteínas séricas, em comparação com um conteúdo genético mais semelhante, provavelmente resulta de diferentes níveis e estratégias de expressão gênica, bem como de modificações proteicas pós-transcricionais e pós-traducionais.

Palavras-chave

Genômica, Proteômica
Sérum
Evolução dos chimpanzés
Evolução humana

Abreviações

Sá MCA
Mariana Cavalcante e Almeida Sá
Olabisi-Adeniyi E
Esther Olabisi-Adeniyi
Mansoldo FRP
Felipe Raposo Passos de Mansoldo
Labati
CA Carlos Alberto Labati
Catandi TR
Thais Regiani Cataldi
Lima, Illinois
Iasmim Lopes Lima
Geddes-McAlister J
Jennifer Geddes-McAlister
Eberlin, Minnesota
Marcos Nogueira Eberlin

1. Introdução

A pesquisa sobre a relação evolutiva entre Homo sapiens (humanos) e Pan troglodytes (chimpanzés) tem sido amplamente aplicada para auxiliar em nossa melhor compreensão em áreas como biologia evolutiva, saúde e doenças, genética, antropologia e outros aspectos relacionados à psicologia cognitiva e comparativa ( Latzman et al., 2017 ; Price, 2012 ). 
Como é a molécula de DNA que codifica a vida, as primeiras investigações se concentraram em determinar a variabilidade genética entre humanos e chimpanzés ( Suntsova e Buzdin, 2020 ; Kaessmann e Pääbo, 2002 ; Enard et al., 2002 ). 
A variação genética entre humanos e chimpanzés foi inicialmente estimada como pequena, em torno de 1,5%, mas apenas as sequências codificadoras de proteínas foram comparadas, sem considerar o DNA não codificador (Nature, 2005). 
Pesquisas subsequentes mostraram que 1,23% das variações do genoma eram devidas a alterações de nucleotídeo único e aproximadamente 3% do genoma consistiam em deleções e inserções maiores, mas as principais divergências genômicas entre chimpanzés e humanos eram representadas no nível cromossômico, como por inversões, translocações e fusões cromossômicas ( Yunis et al., 1980 ).
Mais recentemente, um estudo inovador publicado na Nature relatou o “sequenciamento completo de genomas de primatas”, incluindo os de humanos, chimpanzés, bonobos, gorilas, orangotangos de Bornéu, orangotangos de Sumatra e siamangs ( Yoo et al., 2025 ). Pela primeira vez, sequências completas foram comparadas, utilizando técnicas e algoritmos de ponta, possibilitando finalmente a tão esperada comparação de regiões genômicas de difícil sequenciamento. 
Uma comparação abrangente pôde ser realizada, uma vez que longos segmentos de DNA puderam ser lidos e montados em uma sequência que se estendia de uma extremidade de cada cromossomo à outra, sem lacunas. 
Os dados apresentados no texto principal e no extenso material suplementar destacaram regiões únicas – lacunas que se traduzem em nucleotídeos ou segmentos de nucleotídeos que existem apenas em nosso genoma ou em outros – além de variantes de nucleotídeo único (SNVs, nucleotídeos que existem, mas são diferentes) – de humanos em relação a outros primatas, variando de aproximadamente 15% a 30%, e perto de 15% para humanos e chimpanzés. 
Essa diferença de 15%, resultante de 1,6% de variação de nucleotídeo único mais 13,3% de divergências de lacunas, é uma ordem de magnitude maior do que os 1,5% inicialmente estimados.
É importante ressaltar que, apesar da impressão geral de um alto grau de similaridade genética entre humanos e chimpanzés, conforme avaliado por alinhamentos lineares dos nucleotídeos ATGC, ainda elevado mesmo em 85%, muitas diferenças importantes em características macroscópicas, como planos corporais, comportamento social, expressão fenotípica, habilidades cognitivas e traços morfológicos, ainda são observadas ( Collier-Baker e Suddendorf, 2006 ; Hostetter et al., 2001 ; Kramer e Ward, 2012 ; Povenelli e Davis, 1994; Tomonaga, 1998 ). 
Essas profundas diferenças levantam a questão fundamental: onde residem os mecanismos mais cruciais de especialização? Por exemplo, o cérebro humano é três vezes maior que o dos chimpanzés, exibindo redes neuronais altamente distintas, enquanto os cromossomos Y, "altamente conservados", de humanos e chimpanzés apresentam 61% de divergência ( Hughes et al., 2010 ). 
Notavelmente, a maioria das alterações estruturais dos genes ocorre no nível dos controles e mecanismos de expressão (Suntsova e Buzdin, 2002), o que deve influenciar grandemente a expressão proteica, tanto direta quanto indiretamente.
Portanto, as proteínas expressas devem fornecer os constituintes mais poderosos para comparar espécies, uma vez que são os produtos finais da expressão gênica, sendo as principais responsáveis ​​pelas características fenotípicas. 
As proteínas também desempenham papéis críticos nas estruturas e funções celulares, impulsionando quase todos os processos biológicos celulares ( Shen, 2019 ), além de exibirem habilidades biológicas "inteligentes" que têm sido associadas à memória e ao aprendizado ( Tripathi, Uversky e Giuliani, 2025 ). 
É importante ressaltar que, embora a variabilidade gênica e proteica esteja fortemente correlacionada, as sequências lineares ATGC não conseguem explicar a diversidade de mecanismos que controlam a expressão gênica, bem como as modificações pós-transcricionais e pós-traducionais das proteínas. 
Esses processos complexos podem influenciar drasticamente a expressão proteica, por meio da desorganização de fragmentos genéticos, contribuindo para uma maior diversificação da expressão proteica e heterogeneidade fenotípica, que são imprevisíveis apenas pela análise de alinhamentos de sequências ( King e Wilson, 1975 ).
Curiosamente, um estudo teórico pioneiro baseado em proteínas codificadas por genes, focado em proteínas ortólogas previstas e em todas as proteínas de primatas disponíveis na época (2003), e considerando uma única alteração de aminoácido (ou eventualmente mais) como critério de singularidade proteica, descobriu que até 80% – 102 de 127 – das proteínas ortólogas humanas e de chimpanzés diferem no nível de sequência de DNA de aminoácidos ( Glazko et al., 2005 ). 
Um estudo mais recente e abrangente, também baseado em proteínas com sequência prevista e adicionando a diversidade da população humana à análise, usando dados do gnomAD e comparações com 11 genomas de primatas, encontrou diferenças proteômicas reduzidas entre humanos e chimpanzés, mas identificou até 6.210 substituições de aminoácidos específicas de humanos entre 4.475 proteínas, predominantemente localizadas em regiões intrinsecamente desordenadas e com composição enviesada ( Mier, Andrade-Navarro e Morett, 2025 ). 
Essas regiões podem ser essenciais para a diversidade, uma vez que são comumente associadas a funções regulatórias e de interação, em vez de funções estruturais ou catalíticas. Os autores propuseram que tais alterações podem estar na base de características biológicas exclusivamente humanas, provavelmente por meio de efeitos regulatórios.
A questão que permanece, portanto, é o quanto essas substituições genéticas afetam a expressão real de proteínas específicas de cada espécie, com funções únicas. Essa questão torna-se ainda mais complexa quando observamos que a expressão gênica é um evento altamente intrincado, fortemente influenciado pelo embaralhamento de dados promovido pelos diversos mecanismos de expressão gênica, incluindo sobreposição, splicing alternativo e epigenética. Essas peculiaridades da expressão gênica apontam para a necessidade de avaliação das proteínas efetivamente expressas.
Estudos anteriores sobre proteínas expressas na saliva, cérebro, fluido seminal, dentes e plasma de humanos e chimpanzés mostraram uma ampla gama de diferenças, reveladas por sequências peptídicas únicas e níveis de expressão ( Froment et al., 2021 ; Gagneux et al., 2001 ; Schweigert et al., 2007 ; Thamadilok et al., 2020 ). 
Essas descobertas fornecem informações sobre dieta, genética do hospedeiro/simbionte, doenças, processamento cognitivo, desenvolvimento cerebral, sistema de acasalamento e estado hormonal e fisiológico de ambas as espécies. 
Por exemplo, o conteúdo proteico do fluido seminal humano foi comparado, por meio de proteômica baseada em espectrometria de massas, ao de outros primatas, incluindo chimpanzés, e os humanos apresentaram o maior número de proteínas únicas ( Claw et al., 2018 ). Embora a singularidade e a abundância de proteínas tenham sido medidas, as métricas de similaridade das proteínas do fluido seminal entre as espécies não foram calculadas.
Mas, ao considerar a similaridade biomolecular, o proteoma do plasma/soro se destaca como o grupo de proteomas humanos mais abrangente devido aos seus vários subconjuntos de proteomas integrados ( Anderson e Anderson, 2002 ). 
Como contém todos os componentes proteicos solúveis, o plasma engloba proteínas secretadas por tecidos sólidos, imunoglobulinas, ligantes de receptores locais e de longa distância, secreções proteicas anormais e proteínas estranhas (como as provenientes de agentes infecciosos). 
A maioria das proteínas plasmáticas também existe dentro de complexos multiproteicos e funciona por meio de intrincadas redes de integração de alto nível.<sup> 25 </sup> Merece destaque o estudo seminal de Conrads e colaboradores sobre o proteoma sérico, que concluiu que “ a maioria das proteínas de menor abundância identificadas no soro está presente como espécies secretadas ou liberadas pelas células como resultado de sinalização, necrose, apoptose e hemólise. 
Essas descobertas mostram que o conteúdo proteico do soro reflete bastante o perfil geral do organismo humano e que uma estratégia convencional de fracionamento multidimensional combinada com MS/MS é totalmente capaz de caracterizar uma fração significativa do proteoma sérico ”. ( Chan et al, 2004 ).
Estudos proteômicos baseados em sangue, focados em proteínas expressas, já apontaram para diferenças qualitativas e quantitativas substanciais entre humanos e chimpanzés. Por exemplo, alterações na estrutura e nos níveis de abundância da transtirretina (TTR) indicaram as primeiras descobertas de divergências endócrinas, destacando diferenças entre humanos e chimpanzés nos hormônios da tireoide e no metabolismo de retinoides ( Schweigert et al., 2007 ). 
Um estudo de espectrometria de massa (EM) de alto rendimento e alta resolução espacial, realizado em regiões e camadas individuais do neocórtex e do cerebelo, bem como do núcleo caudado em humanos e chimpanzés, revelou características cerebrais únicas de primatas e específicas de humanos ( Liu et al., 2025 ). 
Uma descoberta importante foi que os cérebros humanos e de chimpanzés são semelhantes na distribuição de proteínas relacionadas à regulação da transcrição e da atividade enzimática, mas diferem na expressão de proteínas que sustentam o metabolismo aeróbico, devido às especializações cognitivas humanas ( Bauernfeind et al., 2015 ).
Apesar dessas investigações anteriores, as proteínas expressas no plasma/soro de humanos e chimpanzés não foram investigadas de forma abrangente, particularmente com a tecnologia e o poder computacional mais avançados da proteômica atualmente disponíveis, ou seja, por meio de cromatografia líquida de alta eficiência acoplada à espectrometria de massas em tandem de alta precisão (HPLC-MS/MS). 
Por exemplo, notáveis ​​similaridades na expressão de proteínas plasmáticas ( Schweigert et al., 2007 ) foram encontradas entre as duas espécies, mas por meio de eletroforese bidimensional. Essa técnica cromatográfica possui faixa dinâmica limitada, geralmente identificando apenas as proteínas mais abundantes, que podem ser comuns a todos os mamíferos ( Cho, 2007 ).
Neste estudo, para investigar a fundo a questão crucial das semelhanças e diferenças entre as expressões proteicas de humanos e chimpanzés, realizamos uma análise proteômica qualitativa em amostras de soro agrupadas de humanos e chimpanzés, utilizando a técnica de ponta de HPLC-MS/MS de alta precisão. 
Para focar nas proteínas menos abundantes, mas provavelmente mais seletivas, analisamos amostras delipidizadas e com depleção de albumina/IgG. As amostras agrupadas foram selecionadas para representar a diversidade populacional e fornecer uma visão abrangente da dinâmica do proteoma plasmático para cada sistema biológico. 
Identificamos diferenças específicas e únicas nessas expressões proteicas séricas, relacionadas às diferenças fenotípicas, o que nos aproximou da resposta à questão fundamental de quão semelhantes humanos e chimpanzés realmente são.

2. Materiais e métodos

2.1 . Amostras


Amostras agrupadas de soro delipidizado e liofilizado de vários indivíduos (16) foram adquiridas de fornecedores comerciais e analisadas em triplicatas técnicas. O soro agrupado de chimpanzé (n = 1, lote nº 5080) foi obtido da Exalpha Biologicals, Inc. (Shirley, MA, EUA) e o soro agrupado humano (n = 1, lote nº 46321) foi adquirido da Rockland Immunochemicals, Inc. (Filadélfia, PA, EUA). Antes do uso, as amostras foram reconstituídas com água Milli-Q (18,2 MΩ.cm, Millipore, Bedford, EUA).

2.2 . Pré-processamento de amostras e quantificação de proteínas


Para obter o soro deplecionado, utilizou-se o kit comercial Albumin IgG Depletion Spintrap™ (nº de catálogo 28-9480-20, Cytiva, Marlborough, MA, EUA), seguindo os protocolos do fabricante. Após a depleção, a proteína total foi quantificada pelo kit 2-D Quanti (nº de catálogo 80648356, Cytiva, Marlborough, MA, EUA), de acordo com as recomendações do fabricante. Em seguida, realizou-se eletroforese unidimensional para confirmar a quantificação e verificar a integridade das proteínas. Todos os experimentos foram realizados em triplicata.

2.3 . Digestão tríptica


Aproximadamente 10 μg de proteínas agrupadas de cada espécie foram desnaturadas em 0,2% de RapiGest SF (nº de catálogo 186001861, Waters™ Corporation, Milford, MA, EUA) a 80 °C por 15 min, reduzidas pela adição de 2,5 µL de 100 mM de ditiotreitol (DTT, nº de catálogo 161–0611, Bio-Rad®) a 60 °C por 30 min; alquiladas com 2,5 µL de 300 mM de iodoacetamida (IAA, nº de catálogo RPN 6302V, GE Healthcare, Chicago, IL, EUA) à temperatura ambiente por 30 min no escuro.
Para a digestão de proteínas, adicionou-se tripsina (nº de catálogo V511A, Promega, Madison, WI, EUA) a uma proporção final de enzima:proteína de 1:100 (m/m) por 16 h a 37 °C. Após a digestão, adicionaram-se 2 µL de uma solução de ácido trifluoroacético a 5% às amostras, que foram incubadas a 37 °C por 90 min para hidrólise com Rapigest. Em seguida, os peptídeos trípticos foram centrifugados a 16.000 × g por 10 min a 4 °C, e o sobrenadante foi transferido para um novo tubo e concentrado a 4 °C em um concentrador a vácuo Speed ​​Vacuum (CentriVap, Labconco). 
Os peptídeos foram então ressuspensos e dessalinizados utilizando uma ponteira Zip Tip C18 (nº de catálogo ZTC18S960, Millipore, Billerica, MA, EUA) de acordo com as instruções do fabricante. O volume final de 50 µL foi obtido pela adição de uma solução aquosa contendo 0,1% de ácido fórmico para obter uma concentração final de 200 ng/µL de peptídeos.

2.4 . LC-MS/MS


A análise LC-MS/MS foi realizada em um sistema NanoElute (Bruker Daltonics, Bremen, Alemanha) acoplado online a um espectrômetro de massas híbrido timsTOF Pro (Bruker Daltonics, Bremen, Alemanha), equipado com uma fonte de nanoeletrospray cativa operada a 1500 V. Os peptídeos foram separados em uma coluna Aurora de 25 cm × 75 µm DI, 1,9 µm de fase reversa (IonOpticks, Fitzroy, Austrália) a uma vazão de 300 nL/min a 50 °C. 
A fase móvel A consistia em 0,1% de ácido fórmico (AF) em água MilliQ e a fase móvel B consistia em 0,1% de AF em acetonitrila (ACN). A coluna foi equilibrada utilizando quatro volumes do solvente A. Um gradiente crescente de 2% para 17% de B foi utilizado ao longo de 60 min, depois para 25% de B ao longo de 30 min e, em seguida, para 37% de B ao longo de 10 min. Finalmente, 95% de B foi atingido em 10 min e mantido constante por 10 min.
O espectrômetro de massas foi operado no modo PASEF dependente de dados, com uma varredura TIMS-MS e 10 varreduras PASEF MS/MS por ciclo de aquisição. Uma faixa de mobilidade iônica de 1/K0 = 1,6 a 0,6 Vs.cm⁻² foi analisada utilizando-se tempos de acumulação e rampa de íons iguais, de 100 ms cada, no analisador TIMS duplo. Íons precursores adequados para análise MS/MS foram isolados em uma janela de 2 Th para m/z < 700 e 3 Th para m/z > 700, alternando-se rapidamente a posição do quadrupolo em sincronia com a eluição dos precursores do dispositivo TIMS. 
A energia de colisão foi reduzida gradualmente em função do aumento da mobilidade iônica, partindo de 20 eV para 1/K0 = 0,6 Vs.cm⁻² e 59 eV para 1/K0 = 1,6 Vs.cm⁻². A dimensão de mobilidade iônica foi calibrada linearmente usando três íons da mistura de ajuste Agilent ESI LC/MS (m/z, 1/K0: 622,0289, 0,9848 Vs. cm-2; 922,0097, 1,1895 Vs. cm-2; e 1221,9906, 1,3820 Vs. cm-2). A análise foi realizada em triplicata técnica.

2.5 . Processamento de dados


Os arquivos brutos foram analisados ​​utilizando o software MaxQuant (versão 1.3.0.5) ( Cox e Mann, 2008 ). As listas de picos foram geradas e comparadas com o banco de dados interno UniProt, composto por 20.427 sequências de Homo sapiens (9.606) revisadas (Swiss-Prot) e 137.499 sequências de Pan troglodytes (9.598) revisadas (Swiss-Prot) e não revisadas (TrEMBL) (baixadas em agosto de 2023). 
Os seguintes parâmetros de busca foram utilizados: massa monoisotópica; tolerância MS/MS de ± 20 ppm; número máximo de dois sítios de clivagem perdidos permitidos para digestões de tripsina de proteínas; cargas peptídicas de 2+, 3+ e 4+. A modificação fixa foi definida como a carbamidometilação da cisteína, enquanto as modificações variáveis ​​foram especificadas como a oxidação da metionina e a acetilação do N-terminal da proteína. 
O padrão do banco de dados de isca foi definido como a versão invertida do banco de dados alvo. Todos os dados relatados foram baseados em 99% de confiança para a identificação de proteínas e peptídeos, conforme determinado por uma taxa de falsos positivos (FDR) ≤ 1%. Para a identificação de proteínas, era necessário um ou mais peptídeos únicos.
A matriz de dados dos grupos de proteínas foi importada para o Perseus (v 2.0.11) ( Tyanova et al., 2016 ). As proteínas identificadas apenas por sítio, sentido reverso e potenciais contaminantes foram excluídas. As abundâncias das proteínas foram transformadas em log2 e os grupos de proteínas com valores válidos em pelo menos uma réplica técnica em pelo menos uma das análises do pool de soro foram mantidos para análises posteriores. 
Os grupos de proteínas detectados exclusivamente no soro de humanos ou chimpanzés (proteínas exclusivas) foram definidos como apresentando diferenças qualitativas. Proteínas com valores de FDR = 0,05 e log2 da razão de mudança (log2FC) > 1,4 entre os dois grupos foram consideradas diferencialmente expressas (DEPs) com base no teste t de Student.

2.6 . Interação proteína-proteína e análise funcional


Para avaliar a anotação funcional e explorar a conexão entre proteínas que apresentaram abundância diferencial entre as espécies, realizamos uma análise de rede de interação proteína-proteína (IPP) utilizando o STRING (v 12.0) ( https://string-db.org/ ). As sequências de proteínas foram utilizadas como entrada, e *H. sapiens* ou *P. troglodytes* foram escolhidos como organismos. Exportamos a rede para o Cytoscape (versão 3.10.1) e realizamos uma anotação funcional de enriquecimento em toda a rede para análise de ontologia gênica (GO), de acordo com os termos de processo biológico (PB), componente celular (CC) e função molecular (FM). Os termos foram filtrados pela plataforma Revigo para eliminar redundâncias ( Supek et al., 2011 ). Todos os gráficos foram gerados no R (versão 4.4.1) utilizando o pacote ggplot2 ( Wickham, 2016 ).
O plug-in de Detecção de Complexos Moleculares (MCODE) também foi utilizado para selecionar os principais complexos moleculares (Módulos) na rede de interação proteína-proteína (PPI) ( Bader e Hogue, 2003 ). Os critérios de corte foram definidos da seguinte forma: “corte de grau = 2”, “corte de pontuação do nó = 0,2”, “k-core = 2” e “profundidade máxima = 100”. O enriquecimento funcional dos clusters de processos biológicos (BP), funções moleculares (MF), Enciclopédia de Genes e Genomas de Kyoto (KEGG), vias Reactome e STRING foi realizado para cada módulo. Termos redundantes foram removidos (corte de 0,5) e os termos principais foram selecionados com base nos valores de FDR.

2.7 . Comparação cromatográfica de peptídeos


Para comparar os cromatogramas de pico base (BPC) obtidos de amostras de soro humano e de chimpanzé, foi aplicado um pré-tratamento para minimizar o ruído, removendo pontos com intensidades inferiores a 5%. Em seguida, para calcular a correlação, os BPCs foram comparados utilizando a função compareChromatograms do pacote MSnbase do R (https://pubs.acs.org/doi/10.1021/acs.jproteome.0c00313), com um binSize de 0,1 e tolerância de 1. Para fins ilustrativos, o cromatograma médio foi calculado utilizando uma média móvel com uma janela de 10 segundos.

3. Resultados e discussões


3.1 . Perfis cromatográficos de peptídeos


Como o objetivo principal deste estudo é acessar o nível de similaridade de proteínas expressas (por proteínas únicas e, em um sentido menos estrito, por abundâncias de proteínas contrastantes), e como usamos uma coluna de cromatografia eficiente capaz de discriminar peptídeos específicos de proteínas (das proteínas digeridas) por tamanho, polaridades e/ou pontos isoelétricos, ao longo de um gradiente relativamente longo de 2 h, sobrepusemos os dois cromatogramas para definir um nível aproximado de similaridade entre as duas matrizes de peptídeos ( Fig. 1 ).

  1. Baixar: Baixar imagem em alta resolução (383 KB)
  2. Baixar: Baixar imagem em tamanho real

Figura 1. Cromatogramas médios de HPLC de peptídeos séricos digeridos por tripsina de a) humanos e b) chimpanzés, e o cromatograma sobreposto da média móvel com uma janela de 10s.

Se considerarmos razoavelmente que diferentes peptídeos (com diferentes tamanhos, polaridades e/ou pontos isoelétricos, resultando em diferentes tempos de retenção) devem estar diretamente correlacionados a diferentes proteínas, o nível de similaridade revelado pela Figura 1 é de fato baixo. 
Observe que muitos peptídeos distintos foram detectados para ambas as espécies, particularmente para humanos (linha vermelha). Para quantificar aproximadamente a similaridade entre os peptídeos, utilizamos a função compareChromatograms (ver seção Material e Métodos). 
Ao definir um limiar de discrepância de abundância/aparência de 10% como critério de dissimilaridade, os dois cromatogramas podem ser considerados até 86% dissimilares, enquanto os cromatogramas das três réplicas para humanos e chimpanzés apresentaram, em média, 97% de similaridade. 
Obviamente, essa dissimilaridade cromatográfica de 86% provém apenas de uma comparação aproximada e um tanto subjetiva de proteínas séricas expressas (a partir de peptídeos únicos não coeluídos ou muito mais/menos abundantes), que deveria ser estimada com muito mais precisão por uma avaliação proteômica de espectrometria de massas baseada em sequências de peptídeos e atribuições de proteínas expressas, como segue.

4. Análise Proteômica


Como resumido na Figura 2 , a análise proteômica sem marcação, baseada nas sequências moleculares de aminoácidos (AA) dos peptídeos reveladas pela fragmentação MS/MS dependente da sequência, e considerando estritamente apenas proteínas identificadas em pelo menos duas ou todas as três réplicas, resultou em 5.087 peptídeos identificados (1.930 para humanos e 2.060 para chimpanzés) que correspondem a um total de 1.024 grupos de proteínas com uma taxa de falsos positivos (FDR) de 1% tanto no nível de peptídeos quanto no de proteínas. 

A correlação foi determinada por um alto nível de cobertura de sequência ( Figura S1 ) e pelo número de peptídeos únicos diretamente correlacionados a uma única proteína, variando de 1 a 11 ou mais ( Figura S2 ). Após a aplicação desses critérios de filtragem, 769 grupos de proteínas foram identificados no soro humano, em comparação com 818 grupos de proteínas no proteoma do soro de chimpanzé ( Tabela S1 ).

  1. Baixar: Baixar imagem em alta resolução (154 KB)
  2. Baixar: Baixar imagem em tamanho real

Figura 2. Diagrama de Venn de todas as proteínas identificadas em soros de chimpanzés e humanos. Um total de 818 proteínas (de chimpanzés) e 769 (humanas) foram identificadas a partir dos 5.087 peptídeos identificados nas três réplicas técnicas, com uma taxa de falsos positivos (FDR) < 1% em nível de peptídeo e proteína.

Como ilustrado na Figura 2 , de todas as proteínas identificadas, 563 (55,0%) foram comuns aos soros humano e de chimpanzé, 206 (20,1%) proteínas foram detectadas exclusivamente no soro humano e 255 (24,9%) proteínas foram detectadas apenas no soro de chimpanzé. Em relação às proteínas séricas exclusivas, humanos e chimpanzés apresentam aproximadamente 66% de similaridade (ou 44% de diferença).
Os histogramas na Fig. S1 mostram a distribuição de proteínas em log2 para cada amostra, enquanto a Fig. S4 mostra que os coeficientes de correlação de Pearson das amostras exibiram alta repetibilidade (coeficiente de correlação de Pearson > 0,95) entre as três réplicas técnicas. 

As distribuições bastante semelhantes de proteínas para as réplicas, tanto para humanos quanto para chimpanzés, e os conjuntos únicos de proteínas expressas que as posicionam estatisticamente em grupos bem definidos e distintos, também foram claramente demonstrados pela análise de PCA ( Fig. 3 ).

  1. Baixar: Baixar imagem em alta resolução (89 KB)
  2. Baixar: Baixar imagem em tamanho real

Figura 3. Análise de componentes principais das proteínas séricas identificadas de Homo sapiens e Pan troglodytes . Os três pontos para cada espécie representam as três réplicas individuais com números variáveis ​​de proteínas identificadas, que variaram em menos de 10%. Observe nesta figura, bem como na Figura S4, a alta reprodutibilidade das 3 réplicas, com pontos muito próximos, particularmente no PC1 (59% de cobertura), mas também no PC2 (12,3%).

Portanto, como já indicado na Figura 1 pelos perfis cromatográficos, a Figura 2 confirmou a formação de peptídeos séricos sequenciados molecularmente de forma bastante singular, que se traduzem consequentemente em proteínas séricas únicas para humanos e chimpanzés, com um nível de dissimilaridade de 44%. 
A distribuição da cobertura de sequência das proteínas identificadas demonstra consistência na identificação proteica, visto que aproximadamente 91% (humanos) e 86% (chimpanzés) das proteínas identificadas apresentaram cobertura de sequência igual ou superior a 10% ( Figura S1 ).

5. Diferenças composicionais e funcionais entre o proteoma sérico de chimpanzés e humanos


Além das 461 (44%) proteínas que diferem qualitativamente entre os dois proteomas séricos (detectadas exclusivamente), também avaliamos proteínas compartilhadas que foram diferencialmente expressas (DEP) entre o soro de chimpanzé e o soro humano.

A Figura 4 mostra que essa avaliação de expressão gênica aumentada/diminuída recuperou 118 (21%) proteínas. Entre essas proteínas DEP, e usando o soro de chimpanzé como referência, 73 proteínas apresentaram expressão aumentada, enquanto 45 proteínas apresentaram expressão diminuída ( Tabela S2 ). 

No geral, ao somar as proteínas que diferiram exclusivamente (detecção exclusiva) e qualitativamente (DEP), 328 proteínas séricas puderam ser associadas ao proteoma de chimpanzé e 251 ao proteoma humano. 

Se utilizarmos um critério menos rigoroso para avaliação de similaridade, somando a dissimilaridade de 44% nas proteínas expressas exclusivamente à dissimilaridade de 22% nas proteínas diferencialmente expressas, a dissimilaridade entre humanos e chimpanzés atinge 66%.

  1. Baixar: Baixar imagem em alta resolução (157 KB)
  2. Baixar: Baixar imagem em tamanho real

Figura 4. Gráfico de vulcão das proteínas diferencialmente expressas (DEPs) entre o soro de chimpanzé e o soro humano, mostrando que, entre as proteínas compartilhadas com abundâncias diferenciais para os soros de chimpanzé (CH) e humano (HM), um total de 118 proteínas apresentaram expressão reduzida ou aumentada (21%). Teste t de Student com valor p < 0,05; valor q de FDR = 5%; S = 1.

Notavelmente, um número relativamente alto de imunoglobulinas e seus componentes também foram detectados e caracterizados em ambos os proteomas séricos; entre eles, 172 imunoglobulinas foram detectadas exclusivamente no soro humano e 60 no soro de chimpanzé ( Tabela S1 ). 
Essa baixa similaridade pode ser devida à distribuição geográfica, visto que os humanos possuem uma ampla e diversificada distribuição geográfica, incluindo centros rurais e urbanos, enquanto a distribuição dos chimpanzés é mais restrita, atendendo a necessidades distintas ( Dupain, 2023 ).

5.1 . Análise funcional e de rede de interação proteína-proteína


Para investigar as relações entre as proteínas com alta abundância nos soros com depleção de albumina/IgG de cada espécie, construímos redes de interação proteína-proteína (IPP) utilizando a plataforma STRING. A Figura 5 mostra que redes bastante distintas foram obtidas para humanos e chimpanzés. Com um enriquecimento de valor p < 1,0⁻¹⁶ para ambos, as redes para chimpanzés e humanos exibem, respectivamente, 179 x 81 nós e 837 x 561 arestas.

  1. Baixar: Baixar imagem em alta resolução (460 KB)
  2. Baixar: Baixar imagem em tamanho real

Figura 5. Redes de interação proteína-proteína (PPI) de proteínas com alta abundância tanto no soro de chimpanzé quanto no soro humano.

Para melhor compreender as diferenças funcionais entre as duas espécies, também realizamos uma análise de Gene Ontology em cada rede de interação proteína-proteína (PPI) ( Fig. 6 ), exibindo os 10 termos mais representados para cada categoria: Processo Biológico (PB), Função Molecular (FM) e Componente Celular (CC). 

Os grupos de proteínas com maior abundância no soro de chimpanzé apresentaram 196 termos GO significativos (FDR = 5%) em todas as três categorias: PB, FM e CC. Em contraste, os grupos de proteínas com maior abundância no soro humano foram enriquecidos em 124 termos GO (FDR = 5%). 

Observe que o soro de chimpanzé e o soro humano compartilham processos biológicos semelhantes entre os 10 principais termos de PB: 'Regulação biológica', 'resposta a estímulo', 'regulação positiva do processo biológico', 'regulação da resposta a estímulo' e 'resposta ao estresse'. 

Em contraste, os termos de processos biológicos (PB) 'regulação de processos biológicos', 'processos de organismos multicelulares', 'regulação negativa de processos biológicos', 'resposta celular a estímulos' e 'processos de desenvolvimento' são mais representados no soro de chimpanzés. Já processos como 'resposta de defesa', 'processos do sistema imunológico', 'localização', 'transporte' e 'resposta a estímulos externos' são mais representativos no soro humano.

  1. Baixar: Baixar imagem em alta resolução (443 KB)
  2. Baixar: Baixar imagem em tamanho real

Figura 6. Análise de Ontologia Gênica (GO) de grupos de proteínas com maior abundância nos soros de chimpanzés e humanos. BP: Processo biológico; CC: Componente celular; MF: Função molecular.


Para as funções moleculares (MF) na Figura 6 , observe que termos como 'ligação a proteínas', 'ligação a receptores de sinalização', 'atividade de peptidase' e 'ligação a glicosaminoglicanos' são comuns a ambos os conjuntos de dados. 
No entanto, funções moleculares como 'ligação a proteínas idênticas', 'ligação a complexos contendo proteínas', 'atividade de regulador de peptidase' e 'ligação a moléculas de adesão celular' são sobrerrepresentadas no soro de chimpanzé, enquanto funções como 'ligação a antígenos', 'atividade de inibidor de endopeptidase', 'atividade de endopeptidase do tipo serina', 'ligação a receptores de imunoglobulinas' e 'ligação a esteroides' são mais representadas no soro humano.
Em relação aos Componentes Celulares (CC), os grupos de proteínas com alta abundância tanto no soro de chimpanzé quanto no soro humano são principalmente da 'região extracelular' e do 'espaço extracelular'. Outros CCs comuns a ambas as espécies são 'vesícula', 'periferia celular', 'exossomo extracelular', 'membrana plasmática' e 'sistema de endomembranas'. 
Considerando os 10 principais termos CC, 'entidade anatômica celular', 'matriz extracelular' e 'grânulo secretor' são mais representados entre as proteínas do soro de chimpanzé, enquanto 'complexo contendo proteína', 'micropartícula sanguínea' e 'retículo endoplasmático' são componentes celulares mais representados no soro humano.
Diversos termos GO destacados na Figura 6 estão primariamente ligados às principais proteínas plasmáticas/séricas relacionadas às funções circulatórias, mas não se limitam à coagulação, defesa do organismo e transporte de moléculas. Similaridades funcionais eram esperadas, visto que a maioria desses processos é altamente conservada entre mamíferos, especialmente primatas. 
Curiosamente, o soro humano agrupado apresentou maior representatividade de processos biológicos envolvidos na defesa do hospedeiro. Anteriormente, foi relatado ( Soto et al., 2010 ) que humanos manifestam um sistema imunológico adaptativo relativamente hiper-reativo quando comparado a chimpanzés, o que pode estar relacionado à maior suscetibilidade a doenças em humanos.
Muitas das proteínas não anotadas foram identificadas como frações de imunoglobulinas. A comparação das imunoglobulinas (IG) entre chimpanzés e humanos revela uma proporção significativamente maior de proteínas relacionadas a imunoglobulinas em humanos (184 proteínas, 73%) em comparação com chimpanzés (163 proteínas, 50%). 
Essa discrepância substancial provavelmente resulta das diferentes pressões ambientais e de patógenos que as duas espécies enfrentam. Os humanos, por terem populações maiores e uma distribuição geográfica mais ampla, encontram uma variedade maior de patógenos, o que pode ter exigido ferramentas imunológicas mais robustas, incluindo a produção de mais imunoglobulinas para combater infecções frequentes. Já os chimpanzés são expostos a diferentes níveis de diversidade de patógenos, o que pode levar a uma menor necessidade de imunoglobulinas.
Estudos anteriores indicam, de fato, diferenças substanciais nas respostas imunes entre as duas espécies. Os chimpanzés, por exemplo, tendem a apresentar reações inflamatórias menos agressivas em comparação aos humanos ( Abi-Rached et al., 2010 ). Os humanos exibem uma resposta imune mais generalizada e robusta, incluindo maior produção de imunoglobulinas para combater diversos patógenos. 
No entanto, essa característica pode resultar em maior suscetibilidade dos humanos a doenças autoimunes, uma contrapartida menos comum em chimpanzés ( Barreiro et al., 2010 ). Os distintos padrões de ativação imune entre humanos e chimpanzés sugerem que, embora produzam mais imunoglobulinas, os humanos também podem enfrentar maiores riscos de inflamação crônica ou doenças autoimunes. 
As respostas imunes inatas a ameaças bacterianas e virais também diferem entre as duas espécies, com os humanos exibindo uma reação imune mais ampla e intensa do que os chimpanzés, o que poderia contribuir ainda mais para os níveis elevados de imunoglobulinas em humanos.

5.2 . Detecção de complexos moleculares


Avaliamos ainda as proteínas centrais na rede de interação proteína-proteína (PPI) de cada espécie, com o algoritmo MCODE identificando seis componentes de rede densamente conectados no soro do chimpanzé ( Fig. S6 ) e quatro no soro humano ( Fig. S7 ). Como a Fig. S6 e a Tabela S3 mostram para o soro do chimpanzé, o MCODE 1 (M1_CH) compreende 33 proteínas associadas à regulação do receptor de células B (BCR) mediada por CD22 e às cascatas de imunoglobulina do tipo V, hemostasia e complemento e coagulação. 
O MCODE 2 (M2_CH) compreende a proteína de ligação ao fator de crescimento semelhante à insulina 6 (IGFBP6), a proteína de ligação ao fator de crescimento semelhante à insulina 5 (IGFBP5), a proteína de ligação ao fator de crescimento semelhante à insulina 4 (IGFBP4), a proteína de ligação ao fator de crescimento semelhante à insulina 3 (IGFBP3), a proteína de ligação ao fator de crescimento semelhante à insulina 6 (IGFBP6), a subunidade lábil ao ácido do complexo da proteína de ligação ao fator de crescimento semelhante à insulina (IGFALS) e o fator de crescimento semelhante à insulina II (IGF2). 
Essas proteínas foram enriquecidas principalmente em ligação ao fator de crescimento semelhante à insulina II, e Papalisina-1/2, regulação negativa da migração de células musculares lisas e regulação dos processos de desenvolvimento do tecido muscular.
As proteínas do MCODE 3 (M3_CH) foram enriquecidas principalmente em ativação do complemento, regulação positiva da opsonização e ativação do complemento pela via clássica. As proteínas do MCODE 4 (M4_CH) também estavam relacionadas às cascatas do complemento e da coagulação e fazem parte de um cluster misto, incluindo fibrinólise, inibidor de proteinase I25C, fetuína e sítio conservado do STRING cluster. 
As proteínas do MCODE 5 (M5_CH) também foram significativamente enriquecidas em regulação negativa da morte celular programada, processos biológicos envolvidos na interação simbiótica e via de sinalização MAPK. Para o MCODE 6 (M6_CH), as proteínas foram enriquecidas principalmente nas vias de degradação da matriz extracelular e proteoglicanos no câncer e em um cluster misto, incluindo a proteína FAM222, o domínio B da somatomedina e o cluster STRING de cordados.
Conforme demonstrado na Figura S7 e na Tabela S3 , o PPI sérico humano, MCODE1 (M1_H), composto por 19 proteínas, foi representado principalmente por cascatas do complemento e da coagulação, fosforilação pós-translacional de proteínas e vias de remodelamento de lipoproteínas plasmáticas. O MCODE2 (M2_H) compreendeu oito proteínas, principalmente enriquecidas em cascatas do complemento, ativação do complemento, vias clássicas e criação de ativadores de C4 e C2 (cluster STRING). 
As proteínas que compõem o MCODE3 (M3_H) foram enriquecidas principalmente em 3 clusters STRING: Cascatas do complemento e da coagulação, Complexo proteína-lipídio, Glicoproteína ácida alfa-1, Enteropatia perdedora de proteínas e Partícula de lipoproteína de alta densidade. Para o MCODE4 (M4_H), todas as 3 proteínas foram enriquecidas na função molecular de ligação ao receptor de imunoglobulina.
Note-se que as cascatas do complemento e da coagulação são processos-chave identificados em múltiplos complexos moleculares (M1_CH, M4_CH, M1_H e M2_H) tanto em chimpanzés quanto em humanos. Essas vias envolvem uma série de reações enzimáticas que levam à ativação de várias proteínas, culminando na eliminação de patógenos e na formação de coágulos sanguíneos. 
A ativação dessas cascatas é desencadeada por numerosas proteínas sanguíneas clássicas altamente abundantes, essenciais para a manutenção da homeostase e para a resposta a potenciais ameaças ( Heurich e McCluskey 2023 ). Como as amostras de soro sofreram coagulação, certas proteínas podem ter sido consumidas, alterando potencialmente suas concentrações. 
Portanto, estudos adicionais utilizando amostras de plasma devem ser realizados para que possamos compreender de forma mais abrangente as proteínas envolvidas nessas vias em ambas as espécies.
Notavelmente, o complexo M1_CH revelou 16 proteínas associadas à regulação do BCR mediada por CD22 no soro de chimpanzés. O CD22 é essencial para o ajuste fino das reações das células B a antígenos e sinais da imunidade inata ( Clark e Giltiay, 2018 ). 
Essa proteína, localizada na superfície das células B, funciona como um inibidor da ativação do receptor de células B (BCR), auxiliando no controle da atividade excessiva das células B e protegendo contra respostas imunes inadequadas ou doenças autoimunes ( Poe et al., 2004 ). Essas descobertas lançam luz sobre a suscetibilidade a doenças e as respostas imunes específicas de cada espécie, revelando possíveis tendências e motivando novas pesquisas sobre doenças zoonóticas e imunologia comparativa.
A maior abundância de seis proteínas de ligação ao fator de crescimento semelhante à insulina (IGFBPs) no soro de chimpanzés, destacada no módulo M2_CH ( Fig. S6 ), também representa uma das principais descobertas do nosso estudo. Essas proteínas estão intimamente ligadas à ligação do fator de crescimento semelhante à insulina II (IGF-II) e da papalisina-1/2, desempenhando papéis cruciais na regulação do desenvolvimento do tecido muscular. 
De fato, o músculo esquelético é um tecido metabólico altamente responsivo à insulina, e o IGF-II atua no desenvolvimento e na manutenção da massa muscular esquelética, estimulando a diferenciação muscular e a captação de glicose no músculo esquelético maduro ( Wilson e Rotwein, 2006 ; Zierath et al., 1992 ).
As linhagens de chimpanzés ( P. troglodytes ) e humanos ( H. sapiens ) exibem, de fato, diferenças musculoesqueléticas significativas em nível anatômico, refletindo adaptações a nichos ecológicos e padrões de movimento distintos. No entanto, a força muscular dinâmica e a capacidade de produção de energia também divergem substancialmente. 
Por exemplo, os humanos possuem mais fibras musculares de contração lenta, o que aumenta a resistência, enquanto os chimpanzés possuem mais fibras de contração rápida para movimentos rápidos e potentes ( O'Neill et al., 2017 ). Além de sua função no desenvolvimento muscular, o IGF-II regula o crescimento e desenvolvimento fetal, o desenvolvimento ósseo pós-natal, a autorrenovação de células-tronco e a regulação metabólica ( Blyth et al., 2020 ; LeRoith et al., 2021 ), sugerindo que seus efeitos podem ser multifacetados. 
De modo geral, a maior abundância dessas proteínas no soro de chimpanzés ( Fig. S6 ) em comparação com o soro humano ( Fig. S7 ) pode estar relacionada ao desenvolvimento muscular distinto, ao metabolismo energético ou a outros aspectos do desenvolvimento, uma tendência que justifica investigações adicionais. Curiosamente, os processos relacionados a lipoproteínas estavam enriquecidos no soro humano ( Fig. S7 ). 
Embora fatores dietéticos e a constituição genética possam afetar significativamente os níveis dessas proteínas, e apesar da delipidação realizada tanto no soro humano quanto no de chimpanzés limitar nossas conclusões, as diferenças nos processos relacionados a lipoproteínas entre as espécies parecem revelar possíveis tendências para fatores de risco cardiovascular específicos de cada espécie ( Noureen et al., 2017 ).
Note-se que a expressão de proteínas séricas também pode ser influenciada por fatores internos e externos, como idade, sexo, dieta, fatores ambientais e estado de saúde ( Zhi et al., 2011 ). Nosso estudo focou na análise de amostras agrupadas para obter uma média da diversificação populacional, mas também para reduzir a variação biológica individual inerente. Apesar das limitações do uso de amostras agrupadas, o agrupamento pode tornar as diferenças e semelhanças entre os grupos mais evidentes. 
Essa abordagem é especialmente apropriada para o estudo de populações, em vez de indivíduos (Dias, Truebano e Skibinski, 2009). Portanto, nossos resultados são promissores e justificam investigações adicionais em nível populacional.
De fato, o crescente poder da proteômica baseada em espectrometria de massas — que agora pode identificar milhares de proteínas em questão de horas ou até mesmo minutos — está aproximando cada vez mais a área do objetivo de longa data de uma cobertura proteômica completa ( Guo, Steen e Mann, 2025 ). 
Esse progresso foi impulsionado por uma série de inovações tecnológicas em instrumentação, à medida que os espectrômetros de massa continuam a expandir os limites de sensibilidade, resolução e velocidade de aquisição. Paralelamente, os avanços em estratégias de aquisição independentes de dados, juntamente com sofisticados fluxos de trabalho de bioinformática e interpretação de dados baseada em inteligência artificial, aprimoraram significativamente a profundidade e a reprodutibilidade do proteoma. 
Aplicações emergentes, como proteômica espacial, proteômica de célula única e proteômica estrutural, juntamente com grandes melhorias nos fluxos de trabalho de preparação de amostras — incluindo preparação de amostras em fase sólida em um único recipiente e dispositivos microfluídicos que minimizam a perda de amostra e permitem análises de materiais com massa limitada — também estão tornando a cobertura proteômica quase completa cada vez mais alcançável. 
Em conjunto, esses avanços estão transformando a proteômica, de uma disciplina predominantemente de pesquisa básica, em uma tecnologia pronta para implementação clínica de rotina, com profundas implicações para diagnósticos mais precisos e medicina verdadeiramente personalizada.

6. Conclusão

Ao realizar uma análise abrangente das proteínas expressas em amostras agrupadas de soro humano e de chimpanzé — o grupo de proteínas mais abrangente — utilizando ferramentas proteômicas de última geração, e considerando a soma das proteínas identificadas exclusivamente, descobrimos que humanos e chimpanzés apresentam 44% de dissimilaridade. Se, utilizando um critério menos rigoroso, incluirmos proteínas diferencialmente expressas (PDE), essa dissimilaridade aumenta para 66%. 
Essa alta dissimilaridade na expressão proteica, apesar da similaridade genética atual, de apenas 15%, contribui para explicar as características fenotípicas bastante distintas de cada espécie, que parecem, portanto, surgir principalmente de alterações provocadas por ajustes distintos nos intrincados mecanismos de recombinação genética, resultando em conjuntos de proteínas expressas bastante distintos.
A abundância cerca de 13% maior de proteínas relacionadas a imunoglobulinas detectadas no soro humano também sugere que os humanos são mais bem adaptados do que os chimpanzés ao aumento da diversidade de patógenos e aos desafios imunológicos, permitindo uma distribuição geográfica mais ampla. 
Nossos achados também identificaram divergências funcionais substanciais nas vias de resposta imune, no metabolismo energético e no desenvolvimento muscular, oferecendo possíveis tendências para os mecanismos moleculares subjacentes às características fisiológicas e imunológicas específicas de cada espécie entre humanos e chimpanzés. 
Observamos ainda divergências funcionais nas vias de resposta imune, no metabolismo energético e no desenvolvimento muscular entre chimpanzés e humanos, o que novamente aponta para possíveis tendências nos mecanismos moleculares subjacentes às características fisiológicas e imunológicas específicas de cada espécie.
Em geral, nossa análise exploratória de proteínas séricas — um grupo restrito, porém provavelmente um dos mais abrangentes — somada a avaliações proteômicas anteriores de outras amostras menos abrangentes ou utilizando protocolos proteômicos menos abrangentes, como saliva, sêmen, cérebro e proteínas dentárias, indica que a proteômica baseada em espectrometria de massas pode contribuir significativamente para uma compreensão mais profunda da base molecular subjacente às divergências entre humanos e chimpanzés. 
Essas divergências parecem se manifestar principalmente no nível das proteínas expressas, e não no nível do conteúdo genômico. A substancial divergência proteômica observada aqui em proteínas séricas, apesar do grau comparativamente alto de similaridade genética, provavelmente surge de diferenças nos níveis de expressão gênica e nas estratégias regulatórias, incluindo splicing alternativo, sobreposição de genes, regulação epigenética e modificações pós-transcricionais e pós-traducionais. 
Prevemos que os avanços exponenciais em velocidade, profundidade, abrangência e simplicidade analítica da proteômica baseada em espectrometria de massas permitirão em breve avaliações muito mais abrangentes e refinadas das similaridades proteômicas entre humanos e chimpanzés. Tais avanços devem incluir, por exemplo, análises proteômicas de células individuais de regiões biologicamente críticas, como populações específicas de células cerebrais, que fornecerão comparações direcionadas para complementar nossa estimativa abrangente de 66% de dissimilaridade em relação às proteínas séricas. Estamos empenhados em alcançar esse objetivo.

Declaração de contribuição de autoria CRediT


Mariana Cavalcante e Almeida Sá: Redação – rascunho original, Validação, Metodologia, Análise formal. Esther Olabisi-Adeniyi: Visualização, Validação. Felipe Raposo Passos de Mansoldo: Software, Metodologia. Thais Regiani Cataldi: Redação – rascunho original, Validação, Software, Análise formal. Carlos Alberto Labati: Supervisão. Iasmim Lopes Lima: Redação – rascunho original, Administração do projeto, Metodologia, Investigação, Análise formal. Jennifer Geddes-McAlister: Redação – revisão e edição, Supervisão, Obtenção de financiamento, Conceitualização. Marcos Nogueira Eberlin: .

Declaração de conflito de interesses


Os autores declaram não possuir quaisquer interesses financeiros ou relações pessoais que possam ter influenciado o trabalho apresentado neste artigo.

Reconhecimento:

Agradecemos às fundações de pesquisa MACKPESQUISA e CAPES pelo apoio financeiro.

Comentários