Google DeepMind cria ferramenta de IA para avaliar potencial de dano de mutações no DNA
O programa faz previsões sobre as chamadas mutações "missense", onde uma única letra é escrita incorretamente no código do DNA
Cientistas do Google DeepMind desenvolveram um programa de inteligência artificial capaz de prever se milhões de mutações genéticas são inofensivas ou propensas a causar doenças, visando acelerar pesquisas e o diagnóstico de distúrbios raros.
O programa faz previsões sobre as chamadas mutações "missense", onde uma única letra é escrita incorretamente no código do DNA. Tais mutações muitas vezes são inofensivas, mas podem interromper o funcionamento das proteínas e causar doenças, desde fibrose cística e anemia falciforme até câncer e problemas no desenvolvimento cerebral.
Os pesquisadores utilizaram o AlphaMissense para avaliar todas as 71 milhões de mutações de uma única letra que poderiam afetar as proteínas humanas. Quando ajustaram a precisão do programa para 90%, ele previu que 57% das mutações "missense" provavelmente eram inofensivas e 32% provavelmente eram prejudiciais. O programa ficou incerto sobre o impacto do restante.
Com base nas descobertas, os cientistas disponibilizaram um catálogo online gratuito das previsões para auxiliar geneticistas e clínicos que estão estudando como as mutações impulsionam doenças ou diagnosticando pacientes com distúrbios raros.
Uma pessoa típica possui cerca de 9.000 mutações "missense" em todo o seu genoma. De mais de 4 milhões observadas em humanos, apenas 2% foram classificadas como benignas ou patogênicas. Médicos já possuem programas de computador para prever quais mutações podem impulsionar doenças, mas, como as previsões são imprecisas, elas só podem fornecer evidências de apoio para fazer um diagnóstico.
Escrevendo na revista Science, o Dr. Jun Cheng e outros descrevem como o AlphaMissense se sai melhor do que os atuais programas de "predição de efeito de variante" e deve ajudar especialistas a identificar mais rapidamente quais mutações estão impulsionando doenças. O programa também pode sinalizar mutações que ainda não foram associadas a distúrbios específicos e orientar médicos para melhores tratamentos.
A IA é uma adaptação do programa AlphaFold do DeepMind, que prevê a estrutura 3D das proteínas humanas a partir de sua composição química.
O AlphaMissense foi alimentado com dados de DNA de humanos e primatas estreitamente relacionados para aprender quais mutações "missense" são comuns e, portanto, provavelmente benignas, e quais são raras e potencialmente prejudiciais. Ao mesmo tempo, o programa se familiarizou com a "linguagem" das proteínas, estudando milhões de sequências de proteínas e aprendendo como uma proteína "saudável" se parece.
Quando a IA treinada recebe uma mutação, ela gera uma pontuação para refletir o quão arriscada parece ser a alteração genética, embora não possa dizer como a mutação causa quaisquer problemas.
"Isso é muito semelhante à linguagem humana", disse Cheng. "Se substituirmos uma palavra em uma frase em inglês, uma pessoa familiarizada com o inglês pode imediatamente perceber se a substituição da palavra mudará o significado da frase ou não."
O Prof. Joe Marsh, biólogo computacional da Universidade de Edimburgo, que não esteve envolvido no trabalho, disse que o AlphaMissense tem "grande potencial".
"Existe este problema com preditores computacionais onde todos dizem que seu novo método é o melhor", disse ele. "Você realmente não pode confiar nas pessoas, mas [os pesquisadores do DeepMind] parecem ter feito um bom trabalho."
Se os especialistas clínicos decidirem que o AlphaMissense é confiável, suas previsões podem ter mais peso nos futuros diagnósticos de doenças, disse ele.
O Prof. Ben Lehner, líder sênior do grupo em genética humana no Wellcome Sanger Institute, disse que as previsões da IA precisam ser verificadas por outros cientistas, mas parecem boas em identificar quais mudanças no DNA causam doença e quais não.
"Uma preocupação sobre o modelo DeepMind é que ele é extremamente complicado", disse Lehner. "Um modelo como esse pode acabar sendo mais complicado do que a biologia que está tentando prever. É humilhante perceber que talvez nunca possamos entender como esses modelos realmente funcionam. Isso é um problema? Pode não ser para algumas aplicações, mas os médicos se sentirão confortáveis tomando decisões sobre pacientes que eles não entendem e não podem explicar?"
"O modelo DeepMind faz um bom trabalho ao prever o que está quebrado", acrescentou. "Saber o que está quebrado é um bom primeiro passo. Mas você também precisa saber como algo está quebrado se quiser consertá-lo. Muitos de nós estão muito ocupados gerando os enormes dados necessários para treinar a próxima geração de modelos de IA que nos dirão não apenas quais mudanças no DNA são ruins, mas também exatamente qual é o problema e como podemos corrigir as coisas."