O primeiro modelo de inteligência artificial desse tipo consegue prever mais de 100 problemas de saúde com base em uma única noite de sono.

“Registramos uma quantidade incrível de sinais quando estudamos o sono”, disse Emmanuel Mignot. Ele e James Zou analisaram dados do sono e descobriram que esses sinais podiam prever doenças. | Getty Images
Uma noite mal dormida prenuncia um dia seguinte com os olhos cansados, mas também pode indicar doenças que se manifestarão anos depois. Um novo modelo de inteligência artificial desenvolvido por pesquisadores da Stanford Medicine e seus colegas utiliza registros fisiológicos de uma única noite de sono para prever o risco de uma pessoa desenvolver mais de 100 problemas de saúde.
Conhecido como SleepFM, o modelo foi treinado com quase 600.000 horas de dados de sono coletados de 65.000 participantes. Os dados de sono provêm da polissonografia, uma avaliação abrangente do sono que utiliza diversos sensores para registrar a atividade cerebral, a atividade cardíaca, os sinais respiratórios, os movimentos das pernas, os movimentos oculares e muito mais.
A polissonografia é o padrão ouro em estudos do sono que monitoram pacientes durante a noite em laboratório. Os pesquisadores perceberam também que se trata de uma mina de ouro inexplorada de dados fisiológicos.
“Registramos uma quantidade incrível de sinais quando estudamos o sono”, disse Emmanuel Mignot , MD, PhD, professor titular da Cátedra Craig Reynolds em Medicina do Sono e coautor sênior do novo estudo , publicado em 6 de janeiro na revista Nature Medicine . “É um tipo de fisiologia geral que estudamos durante oito horas em um indivíduo completamente imobilizado. É uma fonte de dados muito rica.”
Apenas uma fração desses dados é utilizada nas pesquisas atuais sobre sono e na medicina do sono. Com os avanços da inteligência artificial, agora é possível dar sentido a uma quantidade muito maior deles. O novo estudo é o primeiro a usar IA para analisar dados de sono em larga escala como esses.
“Do ponto de vista da IA, o sono é relativamente pouco estudado. Há muitos outros trabalhos de IA focados em patologia ou cardiologia, mas relativamente poucos sobre o sono, apesar de ele ser uma parte tão importante da vida”, disse James Zou , PhD, professor associado de ciência de dados biomédicos e coautor sênior do estudo.
Aprendendo a linguagem do sono
Para aproveitar o vasto acervo de dados sobre sono, os pesquisadores construíram um modelo fundamental, um tipo de modelo de IA capaz de se auto-treinar com grandes quantidades de dados e aplicar o que aprendeu a uma ampla gama de tarefas. Grandes modelos de linguagem como o ChatGPT são exemplos de modelos fundamentais treinados com enormes quantidades de texto.
Os 585.000 horas de dados de polissonografia usados no treinamento do SleepFM vieram de pacientes que tiveram seu sono avaliado em diversas clínicas do sono. Os dados do sono são divididos em incrementos de cinco segundos, análogos às palavras que grandes modelos de linguagem usam para treinamento.
“O SleepFM está essencialmente aprendendo a linguagem do sono”, disse Zou.
O modelo foi capaz de incorporar múltiplos fluxos de dados – eletroencefalografia, eletrocardiografia, eletromiografia, leitura de pulso e fluxo de ar respiratório, por exemplo – e compreender como eles se relacionam entre si.
"Há muitos outros trabalhos de IA focados em patologia ou cardiologia, mas relativamente poucos se dedicam ao sono, apesar de o sono ser uma parte tão importante da vida."
James Zou
Professor Associado de Ciência de Dados Biomédicos
Para alcançar esse objetivo, os pesquisadores desenvolveram uma nova técnica de treinamento, chamada aprendizado contrastivo leave-one-out, que essencialmente oculta uma modalidade de dados e desafia o modelo a reconstruir a parte faltante com base nos outros sinais.
“Um dos avanços técnicos que fizemos neste trabalho foi descobrir como harmonizar todas essas diferentes modalidades de dados para que elas possam se unir e aprender a mesma linguagem”, disse Zou.
Previsão de doenças
Após a fase de treinamento, os pesquisadores puderam ajustar o modelo para diferentes tarefas.
Primeiramente, eles testaram o modelo em tarefas padrão de análise do sono, como a classificação de diferentes estágios do sono e o diagnóstico da gravidade da apneia do sono. O SleepFM teve um desempenho igual ou superior aos modelos mais avançados utilizados atualmente.
Em seguida, os pesquisadores se dedicaram a um objetivo mais ambicioso: prever o surgimento de doenças futuras a partir de dados do sono. Para identificar quais condições poderiam ser previstas, eles precisavam combinar os dados de polissonografia do treinamento com os resultados de saúde a longo prazo dos mesmos participantes. Felizmente, eles tinham acesso a mais de meio século de registros de saúde de uma clínica do sono.
O Centro de Medicina do Sono de Stanford foi fundado em 1970 pelo falecido Dr. William Dement , amplamente considerado o pai da medicina do sono. A maior coorte de pacientes utilizada para treinar o SleepFM – cerca de 35.000 pacientes com idades entre 2 e 96 anos – teve seus dados de polissonografia registrados na clínica entre 1999 e 2024. Os pesquisadores cruzaram os dados de polissonografia desses pacientes com seus registros eletrônicos de saúde, o que proporcionou até 25 anos de acompanhamento para alguns pacientes.
(Os registros de polissonografia da clínica remontam a um período ainda mais antigo, mas apenas em papel, disse Mignot, que dirigiu o centro do sono de 2010 a 2019.)
O SleepFM analisou mais de 1.000 categorias de doenças em registros de saúde e encontrou 130 que poderiam ser previstas com razoável precisão a partir dos dados de sono do paciente. As previsões do modelo foram particularmente robustas para cânceres, complicações na gravidez, doenças circulatórias e transtornos mentais, atingindo um índice C superior a 0,8.
O índice C, ou índice de concordância, é uma medida comum do desempenho preditivo de um modelo, especificamente, sua capacidade de prever qual de dois indivíduos em um grupo vivenciará um evento primeiro.
“Para todos os pares possíveis de indivíduos, o modelo fornece uma classificação de quem tem maior probabilidade de sofrer um evento – um ataque cardíaco, por exemplo – mais cedo. Um índice C de 0,8 significa que, em 80% dos casos, a previsão do modelo está de acordo com o que realmente aconteceu”, disse Zou.
O SleepFM se destacou na previsão da doença de Parkinson (índice C de 0,89), demência (0,85), doença cardíaca hipertensiva (0,84), ataque cardíaco (0,81), câncer de próstata (0,89), câncer de mama (0,87) e morte (0,84).
“Ficamos agradavelmente surpresos ao constatar que, para um conjunto bastante diversificado de condições, o modelo é capaz de fazer previsões informativas”, disse Zou.
Ele acrescentou que modelos com menor precisão, com índices C em torno de 0,7, como aqueles que preveem a resposta de um paciente a diferentes tratamentos contra o câncer, têm se mostrado úteis em contextos clínicos.
Interpretando o modelo
A equipe está trabalhando em maneiras de aprimorar ainda mais as previsões do SleepFM, talvez adicionando dados de dispositivos vestíveis, e para entender exatamente o que o modelo está interpretando.
“Isso não nos é explicado em inglês”, disse Zou. “Mas desenvolvemos diferentes técnicas de interpretação para descobrir o que o modelo está analisando ao fazer uma previsão específica de uma doença.”
Os pesquisadores observam que, embora os sinais cardíacos tenham um papel mais importante nas previsões de doenças cardíacas e os sinais cerebrais tenham um papel mais importante nas previsões de saúde mental, foi a combinação de todas as modalidades de dados que alcançou as previsões mais precisas.
“A informação mais relevante que obtivemos para prever doenças veio da comparação entre os diferentes canais”, disse Mignot. Componentes do corpo que estavam dessincronizados – um cérebro que parece adormecido, mas um coração que parece desperto, por exemplo – pareciam indicar problemas.
_______
Mignot e Zou são membros do Instituto de Neurociências Wu Tsai .
Rahul Thapa, estudante de doutorado em ciência de dados biomédicos, e Magnus Ruud Kjaer, estudante de doutorado na Universidade Técnica da Dinamarca, são os coautores principais do estudo.
Pesquisadores da Universidade Técnica da Dinamarca, do Hospital Universitário de Copenhague – Rigshospitalet, da BioSerenity, da Universidade de Copenhague e da Escola de Medicina de Harvard contribuíram para o trabalho.
O estudo recebeu financiamento dos Institutos Nacionais de Saúde (subvenção R01HL161253), do programa Knight-Hennessy Scholars e do Chan-Zuckerberg Biohub.
Esta matéria foi originalmente publicada pela Stanford Medicine.