Pesquisadores desenvolvem ferramenta para identificar com rapidez e precisão elementos genéticos móveis, como plasmídeos e vírus
Os elementos genéticos móveis (MGEs) são entidades genéticas que procuram replicar-se e espalhar-se de célula para célula. Duas das formas mais comuns de MGEs são vírus e plasmídeos. Eles podem ser encontrados em praticamente todos os ecossistemas...

geNomad é uma ferramenta que identifica e classifica MGEs com base no conteúdo genético e nas sequências genéticas. Crédito: Kent Leech para Berkeley Lab
Os elementos genéticos móveis (MGEs) são entidades genéticas que procuram replicar-se e espalhar-se de célula para célula. Duas das formas mais comuns de MGEs são vírus e plasmídeos. Eles podem ser encontrados em praticamente todos os ecossistemas da Terra.
Uma ferramenta de software descrita na Nature Biotechnology chamada geNomad identifica e classifica MGEs com base em seu conteúdo genético e suas sequências genéticas.
O software foi criado por pesquisadores sob a direção do líder do Grupo de Ciência de Dados de Microbioma, Nikos Kyrpides, no Instituto Conjunto do Genoma do Departamento de Energia dos EUA, um DOE Office of Science User Facility no Laboratório Nacional Lawrence Berkeley. geNomad agora está acessível através da plataforma EDGE da National Microbiome Data Collaborative.
Para obter mais informações sobre os ecossistemas da Terra, os investigadores devem examinar as interações que acontecem entre pequenos organismos (micróbios) localizados no solo e na água.
MGEs, como vírus e plasmídeos, impulsionam os processos e a evolução microbiana . Isso ocorre porque os MGEs podem afetar a capacidade de um micróbio de reciclar nutrientes ou produzir novos produtos químicos. Eles também podem afetar os ecossistemas, matando outras células.
Com o tempo, os MGEs podem ajudar os micróbios a obter uma vantagem competitiva dentro de um ecossistema. Eles influenciam a composição dos ciclos biogeoquímicos ao seu redor. Ao compreender mais sobre a genômica dos MGEs e sua evolução no nível celular , os cientistas podem compreender melhor os processos que abrangem todo o ecossistema.
geNomad é uma estrutura de anotação e classificação que combina e se baseia em duas técnicas padrão para identificação de vírus e plasmídeos. Até agora, a maioria das outras ferramentas concentrava-se na identificação apenas de plasmídeos ou vírus específicos. geNomad combina um amplo escopo, visando todos os grupos conhecidos de vírus e plasmídeos. Ele também é otimizado para velocidade, ou seja, pode identificar milhões de novos vírus e plasmídeos rapidamente, mesmo em conjuntos de dados massivos.
geNomad emprega duas abordagens distintas para identificar vírus e plasmídeos; um é baseado em genes marcadores e o segundo é uma abordagem de rede neural.
A ferramenta foi empregada para construir a versão 4 do IMG Virus Resource (IMG/VR) do Joint Genome Institute , agora com mais de 15 milhões de genomas virais. Também foi fundamental para o desenvolvimento da primeira versão do IMG Plasmid Resource (IMG/PR) , que atualmente conta com mais de 700 mil plasmídeos de genomas, metagenomas e metatranscriptomas.
Para reduzir as barreiras ao acesso e utilização do geNomad, o JGI fez parceria com o NMDC para integrar esta ferramenta na plataforma NMDC EDGE. A interface fácil de usar do NMDC EDGE permite que usuários iniciantes e experientes importem seus dados e acessem a ferramenta geNomad para conduzir suas pesquisas.
Projetado para reduzir os efeitos de vieses de representação taxonômica durante a seleção de marcadores, o geNomad identifica plasmídeos e vírus de grupos sub-representados com mais precisão.
Além disso, por poder processar grandes conjuntos de dados, o geNomad está preparado para se tornar uma ferramenta essencial para pesquisar a diversidade viral global. O geNomad já foi baixado milhares de vezes, recebendo excelente feedback da comunidade de pesquisa em geral. Ele pode ser baixado através do NERSC .
Mais informações: Antonio Pedro Camargo et al, Identificação de elementos genéticos móveis com geNomad, Nature Biotechnology (2023). DOI: 10.1038/s41587-023-01953-y
Informações da revista: Nature Biotechnology