Talento

Melhorando a saúde, um sistema de aprendizado de máquina por vez
Marzyeh Ghassemi trabalha para garantir que os modelos de assistência médica sejam treinados para serem robustos e justos.
Por Michaela Jarvis - 27/11/2024


Marzyeh Ghassemi e seu grupo de pesquisa Healthy Machine Learning no Laboratório de Sistemas de Informação e Decisão do MIT trabalham em um estudo profundo sobre como o aprendizado de máquina pode se tornar mais robusto e posteriormente aplicado para melhorar a segurança e a equidade na saúde. Créditos: Foto: Qudus Shittu


Cativada quando criança por videogames e quebra-cabeças, Marzyeh Ghassemi também era fascinada desde cedo por saúde. Felizmente, ela encontrou um caminho onde podia combinar os dois interesses. 

“Embora eu tivesse considerado uma carreira na área da saúde, a atração da ciência da computação e engenharia era mais forte”, diz Ghassemi, professor associado do Departamento de Engenharia Elétrica e Ciência da Computação do MIT e do Instituto de Engenharia Médica e Ciência (IMES) e pesquisador principal do Laboratório de Sistemas de Informação e Decisão (LIDS). “Quando descobri que a ciência da computação de forma ampla, e a IA/ML especificamente, poderiam ser aplicadas à área da saúde, foi uma convergência de interesses.”

Hoje, Ghassemi e seu grupo de pesquisa Healthy ML no LIDS trabalham em um estudo profundo de como o aprendizado de máquina (ML) pode se tornar mais robusto e posteriormente aplicado para melhorar a segurança e a equidade na saúde.

Crescendo no Texas e Novo México em uma família iraniano-americana voltada para a engenharia, Ghassemi tinha modelos a seguir em uma carreira STEM. Embora ela amasse videogames baseados em quebra-cabeças — "Resolver quebra-cabeças para desbloquear outros níveis ou progredir mais era um desafio muito atraente" — sua mãe também a envolveu em matemática mais avançada desde cedo, incitando-a a ver a matemática como mais do que aritmética.

“Adicionar ou multiplicar são habilidades básicas enfatizadas por um bom motivo, mas o foco pode obscurecer a ideia de que grande parte da matemática e da ciência de nível superior são mais sobre lógica e quebra-cabeças”, diz Ghassemi. “Por causa do incentivo da minha mãe, eu sabia que havia coisas divertidas pela frente.”


Ghassemi diz que, além de sua mãe, muitos outros apoiaram seu desenvolvimento intelectual. Quando ela obteve seu diploma de graduação na New Mexico State University, o diretor do Honors College e um ex-bolsista Marshall — Jason Ackelson, agora um consultor sênior do Departamento de Segurança Interna dos EUA — a ajudou a se candidatar a uma bolsa Marshall que a levou para a Universidade de Oxford, onde ela obteve um mestrado em 2011 e se interessou pela primeira vez pelo novo e rápido campo de aprendizado de máquina. Durante seu trabalho de doutorado no MIT, Ghassemi diz que recebeu apoio "de professores e colegas", acrescentando: "Esse ambiente de abertura e aceitação é algo que tento replicar para meus alunos".

Enquanto trabalhava em seu doutorado, Ghassemi também encontrou sua primeira pista de que vieses em dados de saúde podem se esconder em modelos de aprendizado de máquina.

Ela havia treinado modelos para prever resultados usando dados de saúde, “e a mentalidade na época era usar todos os dados disponíveis. Em redes neurais para imagens, vimos que os recursos certos seriam aprendidos para um bom desempenho, eliminando a necessidade de engenharia manual de recursos específicos.”

Durante uma reunião com Leo Celi, principal cientista pesquisador do Laboratório de Fisiologia Computacional e IMES do MIT e membro do comitê de tese de Ghassemi, Celi perguntou se Ghassemi havia verificado o desempenho dos modelos em pacientes de diferentes gêneros, tipos de seguro e raças autorrelatadas.

Ghassemi verificou, e havia lacunas. “Agora temos quase uma década de trabalho mostrando que essas lacunas de modelo são difíceis de abordar — elas decorrem de vieses existentes em dados de saúde e práticas técnicas padrão. A menos que você pense cuidadosamente sobre eles, os modelos reproduzirão e estenderão ingenuamente os vieses”, diz ela.

Ghassemi vem explorando essas questões desde então.

Seu avanço favorito no trabalho que ela fez surgiu em várias partes. Primeiro, ela e seu grupo de pesquisa mostraram que modelos de aprendizagem poderiam reconhecer a raça de um paciente a partir de imagens médicas como raios X de tórax, o que os radiologistas não conseguem fazer. O grupo então descobriu que modelos otimizados para ter um bom desempenho "em média" não tiveram um desempenho tão bom para mulheres e minorias. No verão passado, seu grupo combinou essas descobertas para mostrar que quanto mais um modelo aprendia a prever a raça ou o gênero de um paciente a partir de uma imagem médica, pior seria sua lacuna de desempenho para subgrupos nesses dados demográficos. Ghassemi e sua equipe descobriram que o problema poderia ser mitigado se um modelo fosse treinado para levar em conta as diferenças demográficas, em vez de ser focado no desempenho médio geral — mas esse processo tem que ser realizado em todos os locais onde um modelo é implantado.

“Estamos enfatizando que modelos treinados para otimizar o desempenho (equilibrando o desempenho geral com a menor lacuna de justiça) em um ambiente hospitalar não são ideais em outros ambientes. Isso tem um impacto importante em como os modelos são desenvolvidos para uso humano”, diz Ghassemi. “Um hospital pode ter os recursos para treinar um modelo e, então, ser capaz de demonstrar que ele tem um bom desempenho, possivelmente até mesmo com restrições específicas de justiça. No entanto, nossa pesquisa mostra que essas garantias de desempenho não se mantêm em novos ambientes. Um modelo que é bem equilibrado em um local pode não funcionar efetivamente em um ambiente diferente. Isso afeta a utilidade dos modelos na prática, e é essencial que trabalhemos para abordar esse problema para aqueles que desenvolvem e implantam modelos.”

O trabalho de Ghassemi é informado por sua identidade.

“Sou uma mulher visivelmente muçulmana e mãe — ambas ajudaram a moldar como vejo o mundo, o que informa meus interesses de pesquisa”, diz ela. “Trabalho na robustez dos modelos de aprendizado de máquina e como a falta de robustez pode se combinar com vieses existentes. Esse interesse não é uma coincidência.”

Em relação ao seu processo de pensamento, Ghassemi diz que a inspiração frequentemente surge quando ela está ao ar livre — andando de bicicleta no Novo México como estudante de graduação, remando em Oxford, correndo como estudante de doutorado no MIT e, atualmente, caminhando pela Cambridge Esplanade. Ela também diz que achou útil, ao abordar um problema complicado, pensar sobre as partes do problema maior e tentar entender como suas suposições sobre cada parte podem estar incorretas.

“Na minha experiência, o fator mais limitante para novas soluções é o que você acha que sabe”, ela diz. “Às vezes é difícil superar seu próprio conhecimento (parcial) sobre algo até que você se aprofunde em um modelo, sistema, etc., e perceba que não entendeu uma subparte corretamente ou completamente.”

Por mais apaixonada que Ghassemi seja pelo seu trabalho, ela intencionalmente mantém o controle da vida em um contexto maior.

“Quando você ama sua pesquisa, pode ser difícil impedir que isso se torne sua identidade — é algo que eu acho que muitos acadêmicos precisam estar cientes”, ela diz. “Eu tento ter certeza de que tenho interesses (e conhecimento) além da minha própria expertise técnica.

“Uma das melhores maneiras de ajudar a priorizar um equilíbrio é com boas pessoas. Se você tem família, amigos ou colegas que o encorajam a ser uma pessoa completa, segure-os!”

Tendo ganhado muitos prêmios e muito reconhecimento pelo trabalho que envolve duas paixões antigas — ciência da computação e saúde — Ghassemi professa uma fé em ver a vida como uma jornada.

“Há uma citação do poeta persa Rumi que é traduzida como, 'Você é o que você está procurando'”, ela diz. “Em cada estágio da sua vida, você tem que reinvestir em encontrar quem você é, e empurrar isso em direção a quem você quer ser.”

 

.
.

Leia mais a seguir