Estudo: Mesmo depois de aprender a ideia certa, humanos e animais ainda parecem testar outras abordagens
Uma nova pesquisa acrescenta evidências de que aprender uma estratégia bem-sucedida para abordar uma tarefa não impede uma exploração mais aprofundada...

Pesquisadores que estudam como humanos e animais fazem previsões sobre o tempo encontraram um resultado surpreendente. Depois de aprender a abordagem ideal para a tarefa, eles ainda deixam seu comportamento ser influenciado por resultados recentes. O estudo sugere que, mesmo com um "caminho" claro a seguir para realizar uma tarefa de forma ideal, pessoas e animais ainda às vezes escolherão explorar, mesmo que isso possa significar desempenho reduzido. Créditos: Imagem: AdobeStock
Talvez seja um truque de vida ou uma responsabilidade, ou um pouco dos dois. Um resultado surpreendente em um novo estudo do MIT pode sugerir que pessoas e animais compartilham uma propensão inerente a continuar atualizando sua abordagem para uma tarefa, mesmo quando já aprenderam como devem abordá-la, e mesmo que os desvios às vezes levem a erros desnecessários.
O comportamento de “explorar” quando se poderia estar apenas “explorando” pode fazer sentido por pelo menos dois motivos, diz Mriganka Sur, autora sênior do estudo publicado em 18 de fevereiro na Current Biology . Só porque as regras de uma tarefa parecem definidas em um momento não significa que elas permanecerão assim neste mundo incerto, então alterar o comportamento da condição ideal de vez em quando pode ajudar a revelar os ajustes necessários. Além disso, tentar coisas novas quando você já sabe do que gosta é uma maneira de descobrir se pode haver algo ainda melhor lá fora do que a coisa boa que você tem acontecendo agora.
“Se o objetivo é maximizar a recompensa, você nunca deve se desviar depois de encontrar a solução perfeita, mas continue explorando”, diz Sur, o professor Paul e Lilah Newton no Picower Institute for Learning and Memory e no Department of Brain and Cognitive Sciences do MIT. “Por quê? É como comida. Todos nós gostamos de certos alimentos, mas continuamos tentando alimentos diferentes porque você nunca sabe, pode haver algo que você possa descobrir.”
Previsão de tempo
O ex-técnico de pesquisa Tudor Dragoi, agora estudante de pós-graduação na Universidade de Boston, liderou o estudo no qual ele e outros membros do Sur Lab exploraram como humanos e saguis, um pequeno primata, fazem previsões sobre o momento dos eventos.
Três humanos e dois saguis receberam uma tarefa simples. Eles veriam uma imagem em uma tela por um certo tempo — o tempo variava de um teste para o outro dentro de um intervalo limitado — e eles simplesmente tinham que apertar um botão (os saguis cutucavam um tablet enquanto os humanos clicavam em um mouse) quando a imagem desaparecesse. O sucesso foi definido como reagir o mais rápido possível ao desaparecimento da imagem sem apertar o botão muito cedo. Os saguis recebiam uma recompensa de suco em testes bem-sucedidos.
Embora os saguis precisassem de mais tempo de treinamento do que os humanos, todos os sujeitos se acomodaram no mesmo padrão razoável de comportamento em relação à tarefa. Quanto mais tempo a imagem ficava na tela, mais rápido era o tempo de reação para seu desaparecimento. Esse comportamento segue o "modelo de risco" de previsão em que, se a imagem só pode durar por um certo tempo, quanto mais tempo ela fica lá, mais provável deve ser que desapareça muito em breve. Os sujeitos aprenderam isso e, no geral, com mais experiência, seus tempos de reação se tornaram mais rápidos.
Mas conforme o experimento continuou, a equipe de Sur e Dragoi notou que algo surpreendente também estava acontecendo. A modelagem matemática dos dados de tempo de reação revelou que tanto os humanos quanto os saguis estavam deixando os resultados do teste imediatamente anterior influenciarem o que eles fizeram no próximo teste, mesmo que eles já tivessem aprendido o que fazer. Se a imagem estivesse na tela apenas brevemente em um teste, na próxima rodada os sujeitos diminuiriam um pouco o tempo de reação (presumivelmente esperando uma duração de imagem mais curta novamente), enquanto que se a imagem permanecesse, eles aumentariam o tempo de reação (presumivelmente porque eles imaginaram que teriam uma espera mais longa).
Esses resultados se somam aos de um estudo semelhante publicado pelo laboratório de Sur em 2023, no qual eles descobriram que, mesmo depois que os ratos aprenderam as regras de uma tarefa cognitiva diferente, eles se desviaram arbitrariamente da estratégia vencedora de vez em quando. Naquele estudo, como neste, aprender a estratégia bem-sucedida não impediu os sujeitos de continuar a testar alternativas, mesmo que isso significasse sacrificar a recompensa.
“A persistência de mudanças comportamentais mesmo após o aprendizado da tarefa pode refletir a exploração como uma estratégia para buscar e definir um modelo interno ideal do ambiente”, escreveram os cientistas no novo estudo.
Relevância para o autismo
A similaridade dos comportamentos humanos e dos saguis também é uma descoberta importante, diz Sur. Isso porque diferenças em fazer previsões sobre o ambiente de alguém são postuladas como uma característica saliente dos transtornos do espectro autista. Como os saguis são pequenos, são inerentemente sociais e são mais complexos cognitivamente do que os camundongos, o trabalho começou em alguns laboratórios para estabelecer modelos de autismo em saguis, mas um componente-chave foi estabelecer que eles modelam bem os comportamentos relacionados ao autismo. Ao demonstrar que os saguis modelam o comportamento humano neurotípico em relação às previsões, o estudo, portanto, acrescenta peso à ideia emergente de que os saguis podem de fato fornecer modelos informativos para estudos de autismo.
Além de Dragoi e Sur, outros autores do artigo são Hiroki Sugihara, Nhat Le, Elie Adam, Jitendra Sharma, Guoping Feng e Robert Desimone.
A Iniciativa de Pesquisa sobre Autismo da Fundação Simons apoiou a pesquisa por meio do Centro Simons para o Cérebro Social do MIT.