Tecnologia Científica

Usando Texto Cla­nico para Combater o Vianãs de Seleção na Pesquisa Manãdica
Os pesquisadores de Stanford identificam fatores de confusão clinicamente significativos da pesquisa observacional retrospectiva em textos de registros médicos.
Por Katharine Miller - 01/04/2021


Go Nakamura - Reuters

Os pacientes com diagnóstico de câncer muitas vezes devem escolher entre várias opções de tratamento, como cirurgia, quimioterapia ou radioterapia. E eles esperam que seus médicos recomendem a opção que oferece a maior probabilidade de sobrevivaªncia - ou a melhor qualidade de vida.

Para fornecer esse conselho, os médicos recorrem a pesquisas que comparam o sucesso de vários tratamentos. Algumas dessas pesquisas são baseadas em ensaios clínicos randomizados, que são o padrãoouro para as chamadas pesquisas de eficácia comparativa. Mas, como os ensaios clínicos randomizados não foram realizados para todos os tratamentos possa­veis, os médicos podem, em vez disso, confiar em estudos que examinam retrospectivamente o sucesso relativo de diferentes tratamentos no mundo real.

O problema éo seguinte: os resultados desses estudos retrospectivos costumam ser confundidos pelas maneiras não aleata³rias pelas quais os médicos realmente decidem quais pacientes devem receber um determinado tratamento.

“Precisamos realmente estar atentos ao vianãs de seleção”, diz Ross Shachter , professor associado de ciência da administração e engenharia de Stanford e afiliado do Instituto de Inteligaªncia Artificial Centrada no Homem de Stanford . Por exemplo, ele diz: “Pacientes mais velhos podem morrer naturalmente em uma taxa mais elevada e, se forem desviados para um tratamento diferente na prática , parece que o tratamento que estãorecebendo épior porque eles estãocomea§ando com pacientes mais doentes”.

Além da idade do paciente, as fontes potenciais de confusão incluem condições pré-existentes e comorbidades - fatores que podem fazer com que os médicos recomendem tratamentos diferentes e que também podem produzir resultados piores.

Para identificar fontes especa­ficas de confusão em estudos de pesquisa observacional retrospectiva - e, finalmente, para apoiar a tomada de decisão cla­nica - Jiaming Zeng , um candidato a PhD em Ciência e Engenharia de Gestão, se juntou a Shachter, a professora Susan Athey da Stanford Graduate School of Business e Stanford Medical O professor da escola Daniel Rubin e o professor associado cla­nico Michael Gensheimer . 

Zeng e seus colaboradores usaram manãtodos de aprendizado de ma¡quina relativamente simples para identificar fontes clinicamente significativas de vianãs de seleção de tratamento na porção de texto não estruturado dos registros médicos eletra´nicos dos pacientes.

“Os termos descobrimos no texto não estruturado dos registros médicos podem nos ajudar a entender melhor como as decisaµes de tratamento são feitas atualmente e decisaµes comuns que apresentam vianãs de seleção sem a nossa consciência”, diz Zeng, principal autor da equipe de papel . “Isso pode, por sua vez, ajudar a informar as decisaµes médicas”. 

Os médicos querem saber sobre as fontes potenciais de vianãs de seleção em estudos retrospectivos antes de confiar nelas ao aconselhar seus pacientes. E o trabalho de Zeng lhes da¡ essa explicação. “a‰ uma forma de ganhar a confianção deles”, diz ela. 

O problema confuso

Em um ensaio cla­nico randomizado (RCT), os pesquisadores selecionam um grupo adequadamente circunscrito de pacientes e os designam aleatoriamente para vários tratamentos. Eles então acompanham esses pacientes ao longo do tempo e avaliam as taxas de sobrevida relativa dos grupos de tratamento e a qualidade de vida pa³s-tratamento. Mas, a  medida que os tratamentos contra o câncer proliferam, pode ser difa­cil conduzir um RCT caro para todas as opções de tratamento possa­veis. 

A principal alternativa a um RCT éum estudo comparativo retrospectivo de eficácia que analisa os resultados de pacientes que foram tratados no mundo real. Para esses estudos, os especialistas se esforçam para selecionar um conjunto circunscrito de pacientes que já passaram por um determinado tratamento. E eles tentam arduamente contabilizar os fatores que podem confundir o resultado, como sexo, raça, etnia, gravidade da doença ou condições pré-existentes do paciente. “A ideia éque, se vocêpuder controlar todos os fatores de confusão em potencial em um estudo retrospectivo de base populacional, obtera¡ um resultado de inferaªncia causal que deve corresponder ao ensaio cla­nico randomizado”, observa Zeng.

Mas os fatores de confusão - fatores não aleata³rios que estãoassociados ao tratamento e aos resultados - continuam a afetar os resultados dos estudos retrospectivos. Na verdade, os pesquisadores observaram grandes discrepa¢ncias entre os resultados do estudo observacional e os resultados do ECR. Por exemplo, um estudo retrospectivo de 2015 de tratamentos para câncer de pra³stata sugeriu que a cirurgia era melhor do que a radiação para a sobrevida geral dos pacientes, mas um RCT subsequente mostrou que a sobrevida era realmente a mesma para pacientes tratados com radiação ou cirurgia. Uma hipa³tese da fonte potencial de vianãs éque a cirurgia foi oferecida a pacientes mais jovens ou mais sauda¡veis ​​porque tinham maior probabilidade de se recuperar dela, enquanto os pacientes mais velhos ou menos sauda¡veis ​​tinham maior probabilidade de receber radiação. A recuperação bem-sucedida dos pacientes mais sauda¡veis ​​fez a cirurgia parecer a melhor opção, quando, na verdade, os dois tratamentos geram resultados de sobrevivaªncia semelhantes. Como resultado desta pesquisa , os médicos que preferiram a cirurgia a  radiação tiveram que mudar sua prática .

Buscando fatores de confusão em texto não estruturado

Embora os criadores de pesquisas retrospectivas tentem explicar a confusão por meio da confianção na parte estruturada do registro médico eletra´nico, eles não tem muito sucesso. “Por isso, tivemos a ideia de usar as informações textuais do prontua¡rio eletra´nico”, diz Zeng. “Os registros textuais são confusos, mas hámuito mais informações la¡â€, diz ela.

O objetivo foi identificar palavras no texto não estruturado do prontua¡rio eletra´nico que preditem tanto o tratamento quanto o resultado. “Esse étodo o problema com o vianãs de seleção - tentar controlar as varia¡veis ​​que afetam ambos”, diz Shachter.

Zeng se concentrou em uma população de pacientes do Centro de Saúde de Stanford que haviam sido tratados tanto para câncer de pra³stata quanto para câncer de pulma£o de células não pequenas (NSC) na última década. Ela escolheu esses ca¢nceres porque já existia um RCT que poderia servir como referaªncia para cada um: Um RCT de câncer de pra³stata descobriu que a cirurgia, a radiação e o monitoramento ativo produziram resultados semelhantes de sobrevida e qualidade de vida; e um RCT de câncer de pulma£o NSC encontrou uma sobrevida ligeiramente melhor para aqueles tratados com radiação do que com cirurgia. 

Zeng extraiu termos biomédicos das anotações cla­nicas não estruturadas de pacientes com câncer de pulma£o e pra³stata e, em seguida, usou uma técnica simples de processamento de linguagem natural chamada “saco de palavras” para gerar uma matriz de contagens de frequência de palavras. Ela então aplicou um manãtodo para reduzir o número de varia¡veis ​​relevantes e selecionar aquelas que estavam intimamente ligadas ao tratamento e ao resultado dos pacientes. Por causa da abordagem que ela usou, o resultado era interpreta¡vel: cada varia¡vel poderia ser combinada com uma palavra.

Para o câncer de pra³stata, a abordagem do saco de palavras de Zeng descobriu que os termos “bexiga” e “urotelial” estavam associados a piores resultados ciraºrgicos. Em consulta com o coautor Gensheimer, Zeng descobriu que os pacientes com câncer de bexiga ou urotelial tem maior probabilidade de serem submetidos a  cirurgia porque esses ca¢nceres não respondem bem a  radiação. “a‰ assim que esses termos se relacionam com as decisaµes de tratamento ”, diz Zeng. Além disso, ela aprendeu, esses pacientes provavelmente são mais velhos e tem outras comorbidades - que écomo esses termos afetam os resultados .

Para o câncer de pulma£o, o conjunto de palavras de Zeng identificou os termos "ALK" e "left.low" como estando associados ao tratamento com radiação e a  baixa sobrevida. Acontece que ALK éum tipo de mutação do câncer de pulma£o que pode afetar as decisaµes de tratamento e sobrevivaªncia. E Zeng encontrou documentos observando que pacientes com câncer no lobo inferior esquerdo do pulma£o tendem a ter taxas de sobrevivaªncia mais baixas. “Isso mostra mais uma vez que os termos que descobrimos são interpreta¡veis ​​e podem fornecer informações cla­nicas interessantes”, diz Zeng.

Mas Zeng não parou por aa­. Ela queria saber se a inclusão dos fatores de confusão potenciais adicionais que ela descobriu no texto cla­nico em um estudo retrospectivo forneceria estimativas mais precisas de quais tratamentos geram taxas de sobrevivaªncia mais altas. “A ideia éfazer um ajuste para a fonte de confusão”, diz ela.

Quando Zeng fez o que era essencialmente um estudo retrospectivo cla¡ssico baseado na população de tratamentos de câncer de pra³stata sem incluir seu texto não estruturado, ela descobriu que os pacientes tratados com radiação ou monitoramento se saa­ram um pouco melhor do que aqueles tratados com cirurgia - um resultado diferente dos achados do RCT. Mas quando ela acrescentou as varia¡veis ​​identificadas por meio de seu manãtodo, como a frequência das palavras “bexiga” e “urotelial”, as taxas de sobrevida relativa dos tratamentos se aproximaram do equila­brio - o resultado previsto pelo RCT. 

Essa mudança não foi tão clara para o estudo de câncer de pulma£o de Zeng. “O movimento em direção ao equila­brio não étão grande neste caso, mas os termos que descobrimos ainda forneceram percepções cla­nicas interessantes.”

Em um trabalho futuro, Zeng diz que seria interessante usar técnicas de processamento de linguagem natural mais avana§adas que olhassem não apenas para a contagem de palavras, mas para o contexto em que as palavras são usadas. Mas qualquer que seja a técnica experimentada, diz ela, deve ser interpreta¡vel em vez de caixa preta. “O que foi interessante em nosso trabalho foram os termos que retiramos e como eles foram capazes de nos dar uma visão cla­nica significativa.” 

Um pipeline de desconstrução

A pesquisa de Zeng estabelece uma nova infraestrutura para pesquisas retrospectivas futuras, diz Shachter. “As pessoas podem seguir esse caminho para se livrar de algumas das fontes de vianãs de seleção na interpretação de dados observacionais.” A abordagem pode ajudar a prever o sucesso de tratamentos para outras doenças e outras populações; e pode atéser útil nas ciências sociais, onde os pesquisadores geralmente contam com dados retrospectivos.

Claro, alguns fatores de confusão podem ser desconhecidos e inobserva¡veis. “O vianãs de seleção érealmente difa­cil”, diz Shachter. “E não podemos resolvaª-lo, mas podemos elimina¡-lo.”

 

.
.

Leia mais a seguir