O modelo KATMAP, desenvolvido por pesquisadores do Departamento de Biologia, consegue prever o splicing celular alternativo, que permite às células criar uma diversidade infinita a partir dos mesmos conjuntos de projetos genéticos.

O KATMAP ajudará os cientistas a compreender melhor a regulação genética e as mutações de splicing. Essa informação é crucial para o desenvolvimento de tratamentos terapêuticos para doenças. O KATMAP (que não tem relação direta com gatos, mas significa "Knockdown Activity and Target Models from Additive regression Predictions", ou seja, Modelos de Atividade e Alvo de Bloqueio a partir de Previsões de Regressão Aditiva) também pode ser usado para prever se os ácidos nucleicos sintéticos, uma opção de tratamento promissora para uma variedade de distúrbios, afetam o splicing. Créditos: Imagem: Michael P. McGurk
Embora as células cardíacas e as células da pele contenham instruções idênticas para a criação de proteínas codificadas em seu DNA, elas conseguem ocupar nichos tão distintos porque a maquinaria molecular pode recortar e unir diferentes segmentos dessas instruções para criar combinações infinitamente únicas.
A engenhosidade de usar os mesmos genes de maneiras diferentes é possibilitada por um processo chamado splicing e é controlada por fatores de splicing; quais fatores de splicing uma célula utiliza determina quais conjuntos de instruções essa célula produz, o que, por sua vez, dá origem a proteínas que permitem que as células desempenhem diferentes funções.
Em um artigo de acesso aberto publicado hoje na Nature Biotechnology , pesquisadores do Departamento de Biologia do MIT descreveram uma estrutura para analisar a complexa relação entre sequências e regulação do splicing, a fim de investigar as atividades regulatórias dos fatores de splicing. O objetivo é criar modelos que possam ser aplicados para interpretar e prever a regulação do splicing em diferentes tipos de células e até mesmo em diferentes espécies. Denominado Knockdown Activity and Target Models from Additive regression Predictions (Modelos de Atividade de Bloqueio e Alvos a partir de Previsões de Regressão Aditiva), o KATMAP utiliza dados experimentais da interrupção da expressão de um fator de splicing e informações sobre com quais sequências o fator interage para prever seus alvos prováveis.
Além dos benefícios de uma melhor compreensão da regulação gênica, as mutações de splicing — seja no gene que sofre splicing ou no próprio fator de splicing — podem dar origem a doenças como o câncer, alterando a expressão gênica e levando à criação ou acúmulo de proteínas defeituosas ou mutadas. Essa informação é crucial para o desenvolvimento de tratamentos terapêuticos para essas doenças. Os pesquisadores também demonstraram que o KATMAP pode ser usado para prever se os ácidos nucleicos sintéticos, uma opção de tratamento promissora para distúrbios como atrofia muscular e epilepsia, afetam o splicing.
Emenda perturbadora
Nas células eucarióticas, incluindo as nossas, o splicing ocorre após a transcrição do DNA para produzir uma cópia de RNA de um gene, que contém regiões codificadoras e não codificadoras de RNA. As regiões intrônicas não codificadoras são removidas e os segmentos codificantes dos éxons são unidos por splicing para formar um modelo quase final, que pode então ser traduzido em uma proteína.
Segundo o primeiro autor, Michael P. McGurk, pós-doutorando no laboratório do professor Christopher Burge , do MIT , as abordagens anteriores podiam fornecer uma visão geral da regulação, mas não necessariamente previam a regulação dos fatores de splicing em exons específicos de genes específicos.
O KATMAP utiliza dados de sequenciamento de RNA gerados a partir de experimentos de perturbação, que alteram o nível de expressão de um fator regulatório, seja por superexpressão ou por redução de seus níveis. As consequências da superexpressão ou da redução são que os genes regulados pelo fator de splicing devem apresentar diferentes níveis de splicing após a perturbação, o que ajuda o modelo a identificar os alvos do fator de splicing.
As células, no entanto, são sistemas complexos e interconectados, onde uma pequena alteração pode causar uma cascata de efeitos. O KATMAP também é capaz de distinguir entre alvos diretos e impactos indiretos a jusante, incorporando informações conhecidas sobre a sequência com a qual o fator de splicing provavelmente interage, denominada sítio de ligação ou motivo de ligação.
“Em nossas análises, identificamos os alvos previstos como exons que possuem sítios de ligação para esse fator específico nas regiões onde este modelo acredita que eles precisam estar para impactar a regulação”, diz McGurk, enquanto os não-alvos podem ser afetados pela perturbação, mas não possuem os sítios de ligação apropriados nas proximidades.
Isso é especialmente útil para fatores de splicing que não são tão bem estudados.
“Um dos nossos objetivos com o KATMAP era tentar tornar o modelo suficientemente geral para que ele pudesse aprender o que precisa assumir para fatores específicos, como o quão semelhante o sítio de ligação precisa ser ao motivo conhecido ou como a atividade regulatória muda com a distância dos sítios de ligação aos sítios de splicing”, diz McGurk.
Começando pelo básico
Embora os modelos preditivos possam ser muito eficazes na apresentação de possíveis hipóteses, muitos são considerados "caixas-pretas", ou seja, a lógica que leva às suas conclusões não é clara. O KATMAP, por outro lado, é um modelo interpretável que permite aos pesquisadores gerar rapidamente hipóteses e interpretar padrões de splicing em termos de fatores regulatórios, além de compreender como as previsões foram feitas.
“Não quero apenas prever as coisas, quero explicá-las e compreendê-las”, diz McGurk. “Configuramos o modelo para aprender com informações existentes sobre splicing e ligação, o que nos fornece parâmetros biologicamente interpretáveis.”
Os pesquisadores tiveram que fazer algumas simplificações para desenvolver o modelo. O KATMAP considera apenas um fator de splicing por vez, embora seja possível que os fatores de splicing atuem em conjunto. A sequência alvo do RNA também pode estar dobrada de tal forma que o fator não consiga acessar um sítio de ligação previsto; portanto, o sítio está presente, mas não é utilizado.
“Quando você tenta construir uma imagem completa de fenômenos complexos, geralmente é melhor começar pelo mais simples”, diz McGurk. “Um modelo que considera apenas um fator de splicing por vez é um bom ponto de partida.”
David McWaters, outro pós-doutorando do Laboratório Burge e coautor do artigo, conduziu experimentos importantes para testar e validar esse aspecto do modelo KATMAP.
Direções futuras
O laboratório de Burge está colaborando com pesquisadores do Instituto de Câncer Dana-Farber para aplicar o KATMAP à questão de como os fatores de splicing são alterados em contextos de doenças, bem como com outros pesquisadores do MIT como parte de uma bolsa MIT HEALS para modelar as alterações dos fatores de splicing em respostas ao estresse. McGurk também espera expandir o modelo para incorporar a regulação cooperativa de fatores de splicing que atuam em conjunto.
“Ainda estamos numa fase muito exploratória, mas eu gostaria de poder aplicar esses modelos para tentar entender a regulação do splicing em doenças ou no desenvolvimento. Em termos de variação dos fatores de splicing, eles estão relacionados, e precisamos entender ambos”, diz McGurk.
Burge, professor titular da Cátedra Uncas (1923) e Helen Whitaker e autor sênior do artigo, continuará trabalhando na generalização dessa abordagem para construir modelos interpretáveis para outros aspectos da regulação gênica.
“Agora temos uma ferramenta capaz de aprender o padrão de atividade de um fator de splicing a partir de tipos de dados que podem ser facilmente gerados para qualquer fator de interesse”, diz Burge, que também é membro externo do Instituto Koch para Pesquisa Integrativa do Câncer e membro associado do Broad Institute do MIT e Harvard. “À medida que desenvolvemos mais desses modelos, seremos mais capazes de inferir quais fatores de splicing apresentam atividade alterada em um estado de doença a partir de dados transcriptômicos, para ajudar a entender quais fatores de splicing estão impulsionando a patologia.”