Humanidades

De quem é a história? AI revela quem chama atenção nos livros didáticos do ensino médio
O processamento de linguagem natural revela enormes diferenças em como os livros de história do Texas tratam homens, mulheres e pessoas de cor.
Por Edmund L. Andrews - 18/11/2020


Usando o processamento de linguagem natural, os estudiosos foram capazes de determinar que os livros de história do ensino médio do Texas se concentram principalmente em homens brancos. REUTERS / JIM YOUNG

Aproveitando o poder do aprendizado de máquina, os pesquisadores da Universidade de Stanford mediram quanto mais atenção alguns livros de história do ensino médio prestam aos homens brancos do que aos negros, minorias étnicas e mulheres.

Em um novo estudo de livros de história americana usados ​​no Texas, os pesquisadores encontraram disparidades notáveis.

Os alunos hispânicos representam 52% das matrículas nas escolas do Texas, por exemplo, mas os hispânicos quase não receberam nenhuma menção em nenhum dos livros didáticos - menos de um quarto de um por cento das pessoas mencionadas pelo nome.

Em contraste, todos, exceto cinco dos 50 indivíduos mais mencionados, eram homens brancos. Apenas uma mulher fez essa lista - Eleanor Roosevelt - e apenas quatro pessoas de cor. O ex-presidente Barack Obama ficou em 29º, Martin Luther King em 30º, seguido por Dred Scott e Frederick Douglass. Andrew Jackson, um proprietário de escravos que contribuiu poderosamente para o genocídio dos nativos americanos , recebeu mais menções do que qualquer outro.

Esses são apenas os números da linha superior. Usando as ferramentas de processamento de linguagem natural, ou PNL, os pesquisadores também quantificaram as diferenças em como vários grupos foram caracterizados.

Os homens brancos eram mais propensos a serem associados a palavras que denotam poder, enquanto as mulheres eram mais propensos a se associar a casamento e famílias. Os afro-americanos eram mais provavelmente associados a palavras de impotência e perseguição, ao invés de ação política ou governo.

“Isso tem o potencial de melhorar os livros didáticos para que os alunos se sintam mais representados e tenham uma visão mais crítica da história”, diz ela. “Se nosso artigo puder ser um passo para que isso aconteça, eu ficaria muito, muito feliz.”


“Mesmo para as pessoas que cresceram com esses livros didáticos, esses padrões são surpreendentes”, disse Dorottya Demszky , uma candidata ao doutorado em linguística que co-iniciou o projeto. “Esperamos que esse tipo de quantificação possa se tornar uma ferramenta para o desenvolvimento de livros didáticos mais representativos.”

Expondo os padrões, mais rápido

Com certeza, não é segredo que os livros didáticos são moldados pelas prioridades e preconceitos das pessoas no poder. Até meados do século 20, muitas escolas do sul ensinavam que a Guerra Civil era principalmente sobre os direitos dos estados, e não sobre a escravidão. Na verdade, os educadores têm vasculhado os livros didáticos por décadas para medir preconceitos e distorções.

Os modelos de PNL, dizem os pesquisadores, podem ser novas ferramentas úteis nesse esforço. Como os modelos de IA lêem cada palavra e analisam cada frase, eles podem fornecer medidas mais holísticas, matizadas e confiáveis ​​de possível sub e super-representação de grupos diferentes.

Os pesquisadores de Stanford analisaram 18 livros didáticos de história americana que os distritos escolares do Texas usaram de 2015 a 2017, aplicando uma série de técnicas de processamento de linguagem natural. Isso incluiu modelos de rede neural que quantificam associações implícitas sutis, bem como bancos de dados linguísticos que ajudam a inferir as conotações que surgem de combinações de palavras específicas.

Demszky, que trabalha com Dan Jurafsky , professor de linguística e ciência da computação em Stanford e membro do Instituto de Stanford para Inteligência Artificial Centrada no Homem , se juntou a Lucy Li, uma estudante de PhD em processamento de linguagem natural na UC Berkeley, e Patricia Bromley , professora associada de educação em Stanford.

“Houve uma mudança real no processamento da linguagem natural em direção a modelos mais socialmente conscientes”, diz Jurafsky. “Isso pode ajudar a descobrir as maneiras implícitas como as pessoas são descritas no texto e se saem melhor em capturar o elemento humano e social que é tão importante na linguagem. "

A descoberta mais dramática no projeto de história do Texas foi a ausência virtual de hispânicos, que quase não receberam atenção fora da Guerra Mexicano-Americana. As mulheres se saíam melhor, mas também eram discutidas com muito menos frequência do que os homens.

Quando os pesquisadores analisaram as palavras associadas a diferentes grupos, eles descobriram que os negros estavam muito mais conectados do que outros grupos a palavras de impotência como "escravo", "escapou", "possuído" e "barrado". Isso está em desacordo, dizem os pesquisadores, com novas pesquisas históricas que enfatizam o poder e a agência dos negros na luta por sua liberdade. As mulheres, por sua vez, foram conectadas com verbos como "casar" e "ajudar" e substantivos como "esposa" e "mãe". “Família”, “casa” e “tarefas domésticas” estavam entre as outras palavras principais associadas às mulheres. Os homens brancos, por outro lado, estavam mais intimamente associados a palavras como "líder", "autoridade", "realização" e "poderoso".

Os pesquisadores encontraram disparidades semelhantes quando analisaram os tópicos associados a diferentes grupos. As mulheres foram associadas a dois temas - família e movimentos sociais. Os homens também eram associados à família, mas também aos militares e à tomada de decisões.

Talvez não surpreendentemente, os pesquisadores descobriram que a tendência política dos distritos escolares afetou os tipos de livros usados. Os livros didáticos em condados dominados por eleitores democratas prestavam um pouco mais atenção ao papel das mulheres do que os manuais usados ​​nos condados republicanos. Nenhum dos livros didáticos, entretanto, prestou atenção real aos hispânicos.

Os pesquisadores alertam que o estudo não tira conclusões sobre por que alguns livros dão mais atenção aos homens brancos do que às mulheres e minorias, nem sobre quais são os níveis apropriados. Embora velhos preconceitos façam parte da explicação, outra possibilidade é que muitos livros-texto se concentrem em eventos e líderes políticos formais, em vez de na vida das pessoas.

A principal conclusão, diz Demszky, é que o aprendizado de máquina e o processamento de linguagem natural oferecem novas oportunidades para entender o que os livros didáticos realmente ensinam e para torná-los mais amplamente relevantes.

“Isso tem o potencial de melhorar os livros didáticos para que os alunos se sintam mais representados e tenham uma visão mais crítica da história”, diz ela. “Se nosso artigo puder ser um passo para que isso aconteça, eu ficaria muito, muito feliz.”

 

.
.

Leia mais a seguir