Humanidades

Trabalhando na interseção da ciência de dados e políticas públicas
O novo livro de Ken Steif, 'Public Policy Analytics: Code & Context for Data Science in Government', disponível online e impresso, fornece orientação de como usar dados e algoritmos para resolver problemas complexos de prestação de serviços.
Por Erica K. Brockmeier - 14/03/2021


Como o mundo marca um ano desde que o COVID-19 revirou a vida cotidiana, os governos em todo o mundo frequentemente afirmam que são “guiados por dados” ou estão “seguindo a ciência” à medida que fecham ou abrem diferentes setores da economia. Na prática, porém, muitas dessas decisões, desde como as escolas reabriram às políticas de quarentena de viagens , pareceram muito diferentes, destacando os desafios de usar e interpretar dados para tomar decisões que afetam cidades ou regiões inteiras.

Em seu novo livro, "Public Policy Analytics: Code & Context for Data Science in Government", Ken Steif , professor associado de prática no Departamento de Planejamento Municipal e Regional e diretor do programa de Mestrado em Análise Espacial Urbana da Penn (MUSA) , lança luz sobre este tópico complexo. Projetado para formuladores de políticas sem formação técnica, bem como para cientistas de dados iniciantes que desejam aprender como construir ferramentas baseadas em dados, o livro é um guia inédito para tópicos técnicos e destaca os desafios de usar dados para abordar de forma mais ampla questões de equidade e burocracia.

Penn Today falou com Steif sobre o livro, os desafios de incorporar a ciência de dados na tomada de decisões do governo e como a pandemia impactou o campo da análise de políticas públicas.

Qual foi o ímpeto para escrever este livro?

Por 10 anos, tenho ensinado aos alunos do Master of Urban Spatial Analytics da Penn como desenvolver ferramentas de tomada de decisão baseadas em dados para o governo. Antes de vir para a MUSA, muitos de nossos alunos são desencorajados por seus professores de colégio e faculdade de fazer aulas de STEM. Instruídos a se limitarem às ciências humanas, esses alunos desenvolvem ansiedade em relação à codificação e às estatísticas.

O ímpeto para este livro e para o meu ensino é dissipar essas ansiedades, capacitando os alunos a escrever códigos e aprender análises, alavancando seu interesse na solução de problemas complexos de políticas públicas. O livro ajuda, fornecendo um conjunto de exemplos de código e casos de uso que eles podem usar para copiar e colar seu caminho para soluções significativas em domínios que vão desde habitação, justiça criminal, saúde e serviços humanos, meio ambiente, transporte e muito mais. Trabalhei muito para fornecer a meus alunos esse recurso; só parece razoável compartilhá-lo de forma mais ampla.

Existem desafios específicos para o uso da ciência de dados no governo e na formulação de políticas em comparação com outros campos, como pesquisa científica ou análise de negócios?

A ciência de dados trata da tomada de decisões com base em dados. Trata-se de prestação de serviços. Nos negócios, se um novo algoritmo aumenta a receita, ele se torna o novo padrão para a tomada de decisões. No governo, existem interesses econômicos, mas a maioria dos resultados financeiros é muito mais matizada, como justiça, equidade, política e burocracia.

Um engenheiro pode otimizar para obter receita, mas é preciso um cientista social para otimizar esses outros resultados financeiros. Dessa forma, argumento que a ciência de dados é semelhante ao planejamento. Para que um algoritmo forneça efetivamente um recurso governamental, ele deve ser desenvolvido com grande empatia. Como um serviço governamental tradicionalmente é prestado? Essa estratégia foi eficaz? Alguns grupos receberam mais acesso do que outros? Temos sido transparentes sobre essas questões?

Este livro também inclui conjuntos de dados de acesso aberto e códigos que acompanham cada capítulo. Qual é a importância de ter uma estrutura conceitual, bem como exemplos práticos e exercícios?

Nos últimos 15 anos, um dos movimentos de maior transformação no governo foram os dados abertos - a liberação de dados administrativos do governo gratuitos e de código aberto em um formato legível por máquina.

Quando alavancados por tecnólogos cívicos comprometidos, os dados abertos ajudaram a dimensionar a inovação governamental em um ritmo sem precedentes. Espero que este livro preencha uma lacuna relacionada - o que chamo de 'análise aberta'. Todos os governos coletam os mesmos dados administrativos e compartilham os mesmos casos de uso de prestação de serviços, como prevenção de moradores de rua, tratamento de drogas, bem-estar infantil, saúde pública, etc. Este conjunto comum de casos de uso significa que uma agência pode desenvolver análises e materiais de apoio, compartilhar o código e permitir que outros governos repliquem a solução em sua própria comunidade. Espero que fornecer código e contexto neste livro ajude a iniciar o movimento analítico aberto.

O novo livro de Steif é um guia inédito para tópicos técnicos em análise e também
destaca os desafios de usar dados para abordar questões mais amplas de equidade
e burocracia na tomada de decisões do governo.

Uma das ideias que você discute no livro é a justiça algorítmica. Você poderia explicar esse conceito e sua importância no contexto da análise de políticas públicas?

Desigualdade estrutural e racismo são a base da governança e do planejamento americanos. Raça e classe ditam quem tem acesso aos recursos; eles definem onde uma pessoa mora, onde as crianças vão à escola, acesso a cuidados de saúde, mobilidade social e muito mais.

Se a alocação de recursos tem sido historicamente impulsionada pela desigualdade, por que deveríamos supor que um novo algoritmo sofisticado será diferente? Este tema está presente em todo o livro. Aqueles que estão lendo para obter contexto obtêm várias anedotas detalhadas sobre como a desigualdade está embutida nos dados governamentais. Aqueles que estão lendo para aprender o código obtêm novos métodos para abrir a caixa preta algorítmica, testando se uma solução exaspera ainda mais o impacto disparatado entre raça e classe.

No final, desenvolvo uma estrutura chamada 'governança algorítmica', ajudando os formuladores de políticas e as partes interessadas da comunidade a entender como compensar a utilidade algorítmica com a justiça.

De sua perspectiva, quais são os maiores desafios na integração de ferramentas da ciência de dados com práticas de planejamento tradicionais?

Os alunos de planejamento aprendem muito sobre políticas, mas muito pouco sobre design de programas e prestação de serviços. Assim que uma legislatura aprovar um item de linha de $ 50 milhões para promover uma política, cabe a uma agência governamental desenvolver um programa que possa intervir com a população afetada, alocando esses $ 50 milhões em incrementos de $ 500, $ 1.000 ou $ 5.000.

Como mostro no livro, a ciência de dados combinada com os vastos dados administrativos do governo é boa para identificar populações em risco. Mas fazer isso não tem sentido, a menos que um programa bem projetado esteja em vigor para fornecer serviços. Portanto, o maior desafio não é ensinar aos planejadores como codificar ciência de dados, mas como considerar algoritmos de forma mais ampla no contexto da entrega de serviço. O livro fornece uma estrutura para isso, comparando uma abordagem algorítmica para a entrega de serviços com a abordagem 'business as usual'.

O COVID-19 mudou a maneira como os governos pensam sobre a ciência de dados? Se sim, como?

Com certeza - falando em 'prestação de serviços', a ciência de dados pode ajudar os governos a alocar recursos limitados. A pandemia COVID-19 é marcada inteiramente por recursos limitados: de testes, PPE e vacinas a papel higiênico, equipamentos de exercícios domésticos e piscinas infláveis ​​(o último foi um problema sério para meu filho de 7 anos no verão passado) .

O governo falhou no planejamento para a distribuição de testes, EPIs e vacinas. Aprendemos que não basta o governo investir em uma vacina; deve também planejar como distribuir vacinas equitativamente às populações de maior risco. Isso é exatamente o que ensinamos no Programa MUSA da Penn, e fiquei desapontado com a forma como os governos em todos os níveis falharam em garantir que o fornecimento limitado de vacinas se alinhasse à demanda.

Vemos esse descompasso entre oferta e demanda aparecer repetidamente no governo, desde a resposta a desastres até a provisão de serviços humanos e de saúde. Eu realmente acredito que os dados podem desbloquear um novo valor aqui, mas, novamente, se o governo não estiver interessado em pensar criticamente sobre a entrega de serviços e a logística, então os dados são apenas um espetáculo à parte.

O que você espera que as pessoas ganhem lendo este livro?

Não há livro equivalente atualmente no mercado. Se você é um aspirante a cientista de dados sociais, este livro ensinará como codificar análise espacial, visualização de dados e aprendizado de máquina em R, uma linguagem de programação estatística . Isso o ajudará a construir soluções para resolver alguns dos problemas mais complexos da atualidade.

Se você é um formulador de políticas que deseja adotar dados e algoritmos no governo, este livro fornece uma estrutura para desenvolver ferramentas poderosas de planejamento algorítmico, ao mesmo tempo que garante que elas não irão privar de direitos certas classes e bairros protegidos.

“Public Policy Analytics: Code & Context for Data Science in Government” está atualmente disponível para pré-encomenda na CRC Press e também online . Conjuntos de dados de acesso aberto e código também podem ser encontrados no GitHub .

 

.
.

Leia mais a seguir