Ilustração de células reprogramadas

As células mudam de forma e função quando reprogramadas em resposta à alteração exógena da expressão de alguns genes-chave identificados pela abordagem computacional. Crédito: Ellie Mejía/Northwestern University

A IA analisa dados acessíveis para identificar modificações genéticas que alteram a atividade celular.

Os avanços na tecnologia de sequenciamento genético e no poder da computação aumentaram significativamente a disponibilidade de dados bioinformáticos e as capacidades de processamento. Esta convergência oferece uma oportunidade ideal para a inteligência artificial (IA) desenvolver métodos para controlar o comportamento celular.

Num novo estudo, os investigadores da Northwestern University colheram frutos deste nexo ao desenvolver uma abordagem de aprendizagem por transferência alimentada por IA que reaproveita dados disponíveis publicamente para prever combinações de perturbações genéticas que podem transformar o tipo de célula ou restaurar a saúde de células doentes.

O estudo foi publicado recentemente no Anais da Academia Nacional de Ciências.

Desde a conclusão do projecto genoma humano, há 20 anos, os cientistas sabem que a ADN compreende mais de 20.000 genes. No entanto, permanece um mistério a forma como estes genes trabalham juntos para orquestrar as centenas de diferentes tipos de células do nosso corpo.

Surpreendentemente, essencialmente através de tentativa e erro guiados, os investigadores demonstraram que é possível “reprogramar” o tipo de célula manipulando apenas um punhado de genes. O projeto genoma humano também facilitou avanços nas tecnologias de sequenciamento, tornando mais barata não só a leitura do código genético, mas também a medição da expressão gênica, que quantifica os precursores das proteínas que realizam funções celulares. Este aumento na acessibilidade levou ao acúmulo de uma enorme quantidade de dados bioinformáticos publicamente disponíveis, aumentando a possibilidade de sintetizar esses dados para projetar racionalmente manipulações genéticas que possam provocar comportamentos celulares desejados.

A capacidade de controlar o comportamento celular e, portanto, as transições entre os tipos de células, pode ser aplicada ao crescimento de tecidos lesionados ou à transformação de células cancerígenas de volta em células normais.

Tecidos lesionados resultantes de acidentes vasculares cerebrais, artrite e esclerose múltipla afetam 2,9 milhões de pessoas a cada ano nos Estados Unidos, custando até US$ 400 milhões por ano. Entretanto, os cancros são responsáveis ​​por cerca de 10 milhões de mortes anualmente em todo o mundo, com custos económicos na ordem dos biliões de dólares. Como o atual padrão de tratamento não regenera tecidos e/ou tem eficácia limitada, existe uma necessidade crítica de desenvolver tratamentos mais eficazes que sejam amplamente aplicáveis, o que, por sua vez, requer a identificação de intervenções moleculares que possam ser inferidas a partir de dados de alto rendimento.

No novo estudo, os pesquisadores treinam sua IA para aprender como a expressão genética dá origem ao comportamento celular usando dados de expressão genética disponíveis publicamente. O modelo preditivo gerado por esse processo de aprendizagem é transferido para aplicações específicas de reprogramação celular. Em cada aplicação, a abordagem encontra a combinação de manipulações genéticas que tem maior probabilidade de induzir a transição desejada do tipo celular.

Exploração sem precedentes da dinâmica de todo o genoma

“Nosso trabalho se destaca das abordagens anteriores para projetar estratégias racionalmente para manipular o comportamento celular”, disse Thomas Wytock, autor principal do artigo e membro do Center for Network Dynamics da Universidade do Noroeste. “Essas abordagens se enquadram principalmente em duas categorias: uma em que os genes são organizados em redes de acordo com suas interações ou propriedades comuns; e outro em que a expressão de genes de células saudáveis ​​e doentes é comparada para identificar os genes que apresentam as maiores diferenças”.

Na primeira categoria, existe um compromisso entre realismo e escala. Alguns modelos de rede compreendem muitos genes, mas apenas dizem se um relacionamento está presente ou ausente. Outros modelos são quantitativos e validados experimentalmente, mas envolvem necessariamente um pequeno número de genes e relacionamentos. O novo trabalho da Northwestern mantém os pontos fortes de ambos os tipos de modelos: inclui todos os genes da célula e é quantitativo na representação das suas expressões. Isto é conseguido reduzindo a expressão de quase 20.000 genes individuais para não mais do que 10 combinações lineares de tais genes, que são médias ponderadas referidas como genes próprios.

“Os autogenes basicamente mostram como os genes operam em conjunto, tornando possível simplificar a dinâmica de uma grande rede dinâmica para apenas algumas partes móveis”, disse Adilson Motter, professor de física Charles E. e Emma H. ​​Morrison no Weinberg College. de Artes e Ciências, diretor do Centro de Dinâmica de Rede da Northwestern University e autor sênior do estudo. “Cada autogene pode ser pensado como uma via generalizada que é aproximadamente independente das outras. Assim, os autogenes captam as correlações e independências relevantes na rede reguladora genética.”

As abordagens da segunda categoria podem encontrar genes individuais associados a uma mudança no comportamento celular, mas não especificam como os genes trabalham juntos para permitir essa mudança. A nova abordagem supera este desafio ao reconhecer que os genes mudam as suas expressões em conjunto. A contabilização quantitativa desta propriedade em termos de genes próprios torna possível combinar aditivamente suas respostas a diferentes perturbações genéticas, escalonando-as adequadamente. As respostas combinadas podem então ser inseridas no modelo de IA para determinar quais perturbações provocam o comportamento celular desejado.

Evitando explosão combinatória

Equipados com este modelo de IA, os pesquisadores selecionaram dados disponíveis publicamente para identificar como a expressão genética muda quando um único gene é perturbado pelo aumento ou diminuição exógena de sua expressão. Eles então desenvolveram um algoritmo para resolver o problema inverso, que consiste em prever combinações de genes com maior probabilidade de induzir uma transição de reprogramação desejada, de modo a fazer com que as células doentes se comportem como células saudáveis. A abordagem que resulta da integração dos dados e do algoritmo evita a explosão combinatória que resultaria do teste de todas as combinações para identificar as eficazes. Isto é significativo porque os experimentos podem testar apenas um número limitado de casos, e o algoritmo fornece uma maneira de identificar os casos mais promissores a serem testados.

“A abordagem brilha em sua capacidade de examinar inúmeras combinações computacionalmente”, disse Wytock. “Por exemplo, as combinações de pares de 200 perturbações produzem 20.000 casos, os triplos produzem mais de 1,3 milhão de casos, e esse número continua crescendo exponencialmente. Como o algoritmo emprega otimização, a abordagem pode comparar previsões em um número potencialmente infinito de combinações por meio da magia do cálculo.”

Outro desafio contornado pela abordagem é que as perturbações genéticas podem se combinar de maneira não aditiva. Por exemplo, considere o impacto das perturbações genéticas na taxa de crescimento celular e imagine que as perturbações reduzam pela metade a taxa de crescimento quando aplicadas isoladamente. O efeito de duas dessas perturbações combina-se de forma não aditiva se reduzirem o crescimento para significativamente mais ou significativamente menos do que metade da metade (ou um quarto). Embora exista um grande número de pesquisas que caracterizam interações não aditivas entre genes, a nova abordagem é eficaz mesmo sem ter que levar em conta tais desvios da aditividade.

“Este é um caso em que o todo é bem aproximado pela soma das partes”, disse Motter.

“Esta propriedade das intervenções necessárias para induzir transições entre tipos de células é contra-intuitiva porque os próprios tipos de células emergem de interações coletivas entre genes.”

Como a abordagem aborda os principais desafios para controlar o comportamento celular, ela pode ser aplicada a muitas condições biomédicas diferentes, incluindo aquelas que se beneficiarão de dados futuros.

Um modelo flexível para dados futuros

O fato de que as respostas às perturbações genéticas se combinam aditivamente facilita a generalização entre os tipos de células. Por exemplo, se um gene for interrompido numa célula da pele, o impacto resultante na expressão seria em grande parte o mesmo numa célula do fígado.

Assim, a abordagem alimentada por IA pode ser pensada como uma plataforma na qual podem ser inseridos dados relativos a uma doença específica num paciente específico. A abordagem pode ser aplicada sempre que a cura da doença puder ser concebida como um problema de reprogramação, como no caso de cancros, diabetes e doenças autoimunes, que resultam de disfunção celular.

A versatilidade da abordagem permite que a expressão genética em um único estudo seja rapidamente contextualizada em todos os dados disponíveis no Arquivo de Leitura de Sequenciamento do Centro Nacional de Informações sobre Biotecnologia, que é o maior repositório publicamente disponível para dados de expressão genética. Este arquivo cresceu 100 vezes, de 10 terabytes para 1.000 terabytes entre 2012 e 2022 e continua a crescer exponencialmente à medida que os custos de sequenciamento diminuem. Este trabalho fornece uma ferramenta crítica para traduzir esta riqueza de dados em previsões específicas de como os genes trabalham juntos para controlar o comportamento de células normais e doentes.

Referência: “Projeto de reprogramação celular por transferência de aprendizagem de redes transcricionais funcionais” por Thomas P. Wytock e Adilson E. Motter, 4 de março de 2024, Anais da Academia Nacional de Ciências.
DOI: 10.1073/pnas.2312942121

O estudo foi apoiado pelo Gabinete de Pesquisa do Exército, Instituto Nacional de SaúdeNational Science Foundation e Malnati Brain Tumor Institute da Northwestern University.



Share. Facebook Twitter Pinterest LinkedIn Tumblr Email

Formado em Educação Física, apaixonado por tecnologia, decidi criar o site news space em 2022 para divulgar meu trabalho, tenho como objetivo fornecer informações relevantes e descomplicadas sobre diversos assuntos, incluindo jogos, tecnologia, esportes, educação e muito mais.