Tecnologia Científica

Aperfeia§oando a percepção do tom
A modelagem computacional mostra que tanto nossos ouvidos quanto nosso ambiente influenciam como ouvimos.
Por ennifer Michalowski - 18/12/2021


Créditos: Imagem: Rebekka Dunlap

Uma nova pesquisa de neurocientistas do MIT sugere que as paisagens sonoras naturais moldaram nossa audição, otimizando-a para os tipos de sons que encontramos com mais frequência.

Em um estudo relatado em 14 de dezembro na revista Nature Communications , pesquisadores liderados pelo pesquisador associado do McGovern Institute for Brain Research Josh McDermott usaram modelagem computacional para explorar fatores que influenciam como os humanos ouvem o tom. A percepção do tom de seu modelo se assemelhava muito a  dos humanos - mas apenas quando era treinado com música, vozes ou outros sons naturalistas.

A habilidade humana de reconhecer o tom - essencialmente, a taxa com que um som se repete - da¡ melodia a  música e nuance a  linguagem falada. Embora este seja indiscutivelmente o aspecto mais estudado da audição humana, os pesquisadores ainda estãodebatendo quais fatores determinam as propriedades da percepção do tom e por que ela émais aguda para alguns tipos de sons do que para outros. McDermott, que também éprofessor associado do Departamento de Canãrebro e Ciências Cognitivas do MIT e investigador do Centro de Canãrebros, Mentes e Ma¡quinas (CBMM) do MIT, estãoparticularmente interessado em entender como nosso sistema nervoso percebe o pitch devido aos implantes cocleares , que enviam sinais elanãtricos sobre o som para o cérebro em pessoas com surdez profunda, não reproduzem muito bem esse aspecto da audição humana.

“Os implantes cocleares podem fazer um a³timo trabalho ajudando as pessoas a entender a fala, especialmente se estiverem em um ambiente silencioso. Mas eles realmente não reproduzem a percepção do pitch muito bem ”, diz Mark Saddler, um estudante de graduação e pesquisador CBMM que coliderou o projeto e um bolsista inaugural de graduação do Centro de Neurociaªncia Computacional Integrativa K. Lisa Yang . “Uma das razões pelas quais éimportante entender a base detalhada da percepção do pitch em pessoas com audição normal étentar obter melhores insights sobre como reproduzira­amos isso artificialmente em uma pra³tese.”

Audição artificial

A percepção do tom comea§a na ca³clea, a estrutura em forma de caracol no ouvido interno onde as vibrações dos sons são transformadas em sinais elanãtricos e transmitidos ao cérebro por meio do nervo auditivo. A estrutura e a função da ca³clea ajudam a determinar como e o que ouvimos. E embora não tenha sido possí­vel testar essa ideia experimentalmente, a equipe de McDermott suspeitou que nossa “dieta auditiva” também pudesse moldar nossa audição.

Para explorar como nossos ouvidos e nosso ambiente influenciam a percepção do tom, McDermott, Saddler e o assistente de pesquisa Ray Gonzalez construa­ram um modelo de computador chamado rede neural profunda. As redes neurais são um tipo de modelo de aprendizado de ma¡quina amplamente utilizado no reconhecimento automa¡tico de voz e em outras aplicações de inteligaªncia artificial. Embora a estrutura de uma rede neural artificial se assemelhe grosseiramente a  conectividade dos neura´nios no cérebro, os modelos usados ​​em aplicativos de engenharia não ouvem da mesma forma que os humanos - então a equipe desenvolveu um novo modelo para reproduzir a percepção do tom humano. A abordagem deles combinou uma rede neural artificial com um modelo existente do ouvido de mama­fero, unindo o poder do aprendizado de ma¡quina com os insights da biologia.

Os pesquisadores treinaram a rede neural para estimar o tom, pedindo-lhe para identificar a taxa de repetição de sons em um conjunto de treinamento. Isso deu a eles a flexibilidade de alterar os parametros sob os quais a percepção do tom se desenvolveu. Eles podiam manipular os tipos de som que apresentavam ao modelo, bem como as propriedades do ouvido que processava esses sons antes de transmiti-los a  rede neural.

Quando o modelo foi treinado com sons que são importantes para os humanos, como fala e música, ele aprendeu a estimar o tom da mesma forma que os humanos. “Na³s reproduzimos muito bem muitas caracteri­sticas da percepção humana ... sugerindo que ela estãousando pistas semelhantes dos sons e da representação coclear para fazer a tarefa”, diz Saddler.

Mas quando o modelo foi treinado usando mais sons artificiais ou na ausaªncia de qualquer rua­do de fundo, seu comportamento foi muito diferente. Por exemplo, Saddler diz: “Se vocêotimizar para este mundo idealizado onde nunca háfontes concorrentes de rua­do, vocêpode aprender uma estratanãgia de pitch que parece ser muito diferente da dos humanos, o que sugere que talvez o sistema de pitch humano fosse realmente otimizado para lidar com casos em que a s vezes o rua­do estãoobscurecendo partes do som. ”

A equipe também descobriu que o tempo dos sinais nervosos iniciados na ca³clea écrítico para a percepção do tom. Em uma ca³clea sauda¡vel, explica McDermott, as células nervosas disparam exatamente no tempo com as vibrações sonoras que chegam ao ouvido interno. Quando os pesquisadores distorceram essa relação em seu modelo, para que o tempo dos sinais nervosos fosse menos correlacionado a s vibrações produzidas pelos sons recebidos, a percepção do tom se desviou da audição humana normal. 

McDermott diz que seráimportante levar isso em consideração enquanto os pesquisadores trabalham para desenvolver melhores implantes cocleares. “Isso sugere que, para que os implantes cocleares produzam a percepção do pitch normal, deve haver uma maneira de reproduzir as informações de tempo refinadas no nervo auditivo”, diz ele. “No momento, eles não fazem isso e existem desafios técnicos para fazer isso acontecer - mas os resultados da modelagem sugerem muito claramente que éisso que vocêtem que fazer.”

 

.
.

Leia mais a seguir