Pesquisadores descobrem que elementos de design de visualizações de dados influenciam as suposições dos espectadores sobre a fonte das informações e sua confiabilidade.

“Mostramos nesses artigos que as visualizações fazem mais do que apenas comunicar os dados que estão representando — elas também comunicam outros sinais sociais”, diz Arvind Satyanarayan. Crédito: MIT News; iStock
O grau em que alguém confia nas informações representadas em um gráfico pode depender de suas suposições sobre quem fez a visualização dos dados, de acordo com dois estudos realizados por pesquisadores do MIT.
Por exemplo, se alguém inferir que um gráfico sobre um tópico controverso como violência armada foi produzido por uma organização que ele acredita estar em oposição às suas crenças ou visões políticas, ele pode desacreditar a informação ou descartar completamente a visualização.
Os pesquisadores descobriram que mesmo as visualizações mais claras muitas vezes comunicam mais do que os dados que retratam explicitamente e podem provocar julgamentos fortes dos espectadores sobre os contextos sociais, identidades e características daqueles que fizeram o gráfico.
Os leitores fazem essas avaliações sobre o contexto social de uma visualização principalmente com base em seus recursos de design, como a paleta de cores ou a forma como as informações são organizadas, e não nos dados subjacentes. Muitas vezes, essas inferências não são intencionais por parte dos designers.
Estudos qualitativos e quantitativos revelaram que essas inferências sociais não estão restritas a certos subgrupos, nem são causadas por alfabetização limitada em dados.
Os pesquisadores consolidam suas descobertas em uma estrutura que cientistas e comunicadores podem usar para refletir criticamente sobre como as escolhas de design podem afetar essas premissas sociais. Em última análise, eles esperam que este trabalho leve a melhores estratégias para a comunicação científica.
"Se você estiver navegando pelas redes sociais e vir um gráfico, e imediatamente o descartar como algo que um influenciador produziu apenas para chamar a atenção, isso molda toda a sua experiência com o gráfico antes mesmo de você analisar os dados. Mostramos nestes artigos que as visualizações fazem mais do que apenas comunicar os dados que representam — elas também comunicam outros sinais sociais", afirma Arvind Satyanarayan, professor associado do Departamento de Engenharia Elétrica e Ciência da Computação (EECS) do MIT, membro do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) e coautor sênior desta pesquisa.
Ele é acompanhado no artigo pelas coautoras Amy Rae Fox, ex-pós-doutoranda do CSAIL, e Michelle Morgenstern, atual pós-doutoranda no programa de antropologia do MIT; e pelo coautor sênior Graham M. Jones, professor de antropologia. Dois artigos relacionados a esta pesquisa serão apresentados na Conferência de Visualização do IEEE.
Gráficos como artefatos sociais
Durante o auge da pandemia de Covid-19, as mídias sociais estavam inundadas de gráficos de organizações como a Organização Mundial da Saúde e os Centros de Controle e Prevenção de Doenças, que foram projetados para transmitir informações sobre a propagação de doenças.
Os pesquisadores do MIT estudaram como essas visualizações estavam sendo usadas para discutir a pandemia. Eles descobriram que alguns cientistas cidadãos estavam usando os dados subjacentes para criar suas próprias visualizações, desafiando as descobertas da ciência convencional.
"Esta foi uma descoberta inesperada, pois, anteriormente, os cientistas cidadãos geralmente estavam alinhados com os cientistas tradicionais. Levamos alguns anos para descobrir como estudar esse fenômeno mais profundamente", diz Satyanarayan.
A maioria das pesquisas sobre visualização de dados estuda como os gráficos comunicam dados. Em vez disso, os pesquisadores queriam explorar as visualizações de uma perspectiva social e linguística para avaliar as informações que elas transmitem além dos dados.
Antropólogos linguísticos descobriram que, embora a linguagem permita que as pessoas comuniquem ideias, ela também contém um significado social que vai além das palavras que as pessoas usam. Por exemplo, um sotaque ou dialeto pode indicar que alguém faz parte de uma comunidade específica.
Ao “apontar” para certos significados, identidades e características sociais, a linguagem desempenha o que é conhecido como função socioindexante.
“Queríamos ver se as coisas na linguagem visual da comunicação de dados poderiam apontar para certas instituições, ou os tipos de pessoas nessas instituições, que carregam um significado que poderia não ser intencional pelos criadores da visualização”, diz Jones.
Para isso, os pesquisadores conduziram um estudo qualitativo inicial com usuários da plataforma de mídia social Tumblr. Durante entrevistas individuais, os pesquisadores mostraram aos usuários uma variedade de visualizações reais de fontes online, bem como visualizações modificadas, nas quais removeram informações textuais, como títulos e rótulos de eixos.
Remover as informações textuais foi particularmente importante, pois elas imitam a maneira como as pessoas geralmente interagem com visualizações online.
"Nosso engajamento com as mídias sociais dura apenas alguns segundos. As pessoas não se dão ao trabalho de ler o título de um gráfico ou analisar os dados com atenção", diz Satyanarayan.
As entrevistas revelaram que os usuários fizeram inferências detalhadas sobre as pessoas ou organizações que criaram as visualizações com base no que chamaram de "vibrações", elementos de design, como cores ou o uso de determinados gráficos. Essas inferências, por sua vez, impactaram sua confiança nos dados.
Por exemplo, depois de ver um gráfico com as bandeiras da Geórgia e do Texas e um gráfico com duas linhas em vermelho e preto, mas sem texto, um usuário disse: "Isso parece algo que um republicano do Texas (legislador) colocaria no Twitter ou em seu site, ou como parte de uma apresentação de campanha".
Uma abordagem quantitativa
Com base nesse trabalho inicial, os pesquisadores usaram a mesma metodologia em três estudos quantitativos envolvendo pesquisas enviadas a grupos maiores de pessoas de diversas origens.
Eles descobriram o mesmo fenômeno: as pessoas fazem inferências sobre o contexto social de uma visualização com base em seu design, o que pode levar a mal-entendidos e desconfiança nos dados que ela representa.
Por exemplo, os usuários sentiram que algumas visualizações estavam tão organizadas que acreditaram que eram anúncios e, portanto, não eram confiáveis. Em outro exemplo, um usuário descartou um gráfico de um designer vencedor do Prêmio Pulitzer por achar que o estilo gráfico desenhado à mão indicava que ele havia sido criado por "alguma influenciadora do Instagram que está apenas tentando chamar atenção".
“Se essa for a primeira reação de alguém a um gráfico, isso impactará enormemente o grau de confiança dessa pessoa nele”, diz Satyanarayan.
Além disso, quando os pesquisadores reintroduziram o texto nas visualizações das quais ele havia sido removido, os usuários ainda fizeram essas inferências sociais.
Normalmente, na visualização de dados, a solução para esse problema seria criar gráficos mais claros ou educar as pessoas sobre alfabetização de dados. Mas esta pesquisa aponta para um tipo completamente diferente de alfabetização de dados, diz Jones.
“Não é errado que as pessoas façam essas inferências. É preciso muito conhecimento cultural sobre a origem das visualizações, como são feitas e como circulam. Fazer essas inferências é uma característica, não um defeito, da maneira como usamos os sinais”, afirma.
A partir desses resultados, eles criaram uma estrutura de classificação para organizar as inferências sociais feitas pelos usuários e os elementos de design que contribuíram para elas. Eles esperam que a tipologia sirva como uma ferramenta que os designers possam usar para desenvolver visualizações mais eficazes, bem como um ponto de partida para estudos adicionais.
No futuro, os pesquisadores pretendem continuar explorando o papel das visualizações de dados como artefatos sociais, talvez aprofundando-se em cada característica de design identificada na tipologia. Eles também pretendem expandir o escopo do estudo para incluir visualizações em artigos de pesquisa e periódicos científicos.
“Parte do valor deste trabalho reside na contribuição metodológica para tornar um conjunto de fenômenos passível de estudo experimental. Mas este trabalho também é importante porque demonstra uma polinização cruzada interdisciplinar poderosa e única no MIT”, afirma Jones.
Este trabalho foi apoiado, em parte, por bolsas MIT METEOR e PFPFEE, uma bolsa Amar G. Bose, uma bolsa Alfred P. Sloan e a National Science Foundation.