Tecnologia Científica

Ferramenta de segurança garante privacidade em imagens de vigilância
'Privid' pode ajudar as autoridades a coletar dados seguros de saúde pública ou permitir que os departamentos de transporte monitorem a densidade e o fluxo de pedestres, sem aprender informações pessoais sobre as pessoas.
Por Rachel Gordon - 02/04/2022


O sistema de análise de vídeo que preserva a privacidade da Privid suporta consultas de agregação, que processam grandes quantidades de dados de vídeo. Créditos: Imagem: José-Luis Olivares

As câmeras de vigilância têm um problema de identidade, alimentado por uma tensão inerente entre utilidade e privacidade. Como esses pequenos dispositivos poderosos surgiram aparentemente em todos os lugares, o uso de ferramentas de aprendizado de máquina automatizou a análise de conteúdo de vídeo em grande escala - mas com o aumento da vigilância em massa, atualmente não há regras legalmente aplicáveis ​​para limitar as invasões de privacidade . 

As câmeras de segurança podem fazer muito – elas se tornaram mais inteligentes e extremamente mais competentes do que seus fantasmas de imagens granuladas do passado, a “ferramenta heróica” na mídia criminal. (“Veja aquela pequena mancha azul borrada no canto direito daquele canto densamente povoado – nós o pegamos!”) Agora, a vigilância por vídeo pode ajudar as autoridades de saúde a medir a fração de pessoas usando máscaras, permitir que os departamentos de transporte monitorem a densidade e o fluxo de veículos, bicicletas e pedestres, e fornecer às empresas uma melhor compreensão dos comportamentos de compra. Mas por que a privacidade permaneceu uma reflexão tardia fraca? 

O status quo é adaptar o vídeo com rostos borrados ou caixas pretas. Isso não apenas evita que os analistas façam algumas perguntas genuínas (por exemplo, as pessoas estão usando máscaras?), mas também nem sempre funciona; o sistema pode perder alguns rostos e deixá-los desfocados para o mundo ver. Insatisfeitos com esse status quo, pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial (CSAIL) do MIT, em colaboração com outras instituições, criaram um sistema para melhor garantir a privacidade em imagens de vídeo de câmeras de vigilância. Chamado de “ Privid ”, o sistema permite que os analistas enviem consultas de dados de vídeo e adiciona um pouco de ruído (dados extras) ao resultado final para garantir que um indivíduo não possa ser identificado. O sistema se baseia em uma definição formal de privacidade – “ privacidade diferencial” — que permite o acesso a estatísticas agregadas sobre dados privados sem revelar informações de identificação pessoal.

Normalmente, os analistas teriam acesso ao vídeo inteiro para fazer o que quisessem com ele, mas Privid garante que o vídeo não seja um buffet grátis. Analistas honestos podem ter acesso às informações de que precisam, mas esse acesso é restritivo o suficiente para que analistas mal-intencionados não possam fazer muito com ele. Para habilitar isso, em vez de executar o código em todo o vídeo de uma só vez, o Privid divide o vídeo em pequenos pedaços e executa o código de processamento em cada parte. Em vez de obter resultados de cada peça, os segmentos são agregados e esse ruído adicional é adicionado. (Também há informações sobre o limite de erro que você obterá em seu resultado - talvez uma margem de erro de 2%, devido aos dados extras com ruído adicionados). 

Por exemplo, o código pode gerar o número de pessoas observadas em cada trecho de vídeo e a agregação pode ser a “soma”, para contar o número total de pessoas usando coberturas faciais ou a “média” para estimar a densidade das multidões. 

A Privid permite que os analistas usem suas próprias redes neurais profundas que são comuns para análise de vídeo hoje. Isso dá aos analistas a flexibilidade de fazer perguntas que os designers da Privid não previram. Em uma variedade de vídeos e consultas, o Privid teve precisão de 79 a 99 por cento de um sistema não privado.

“Estamos em um estágio agora em que as câmeras são praticamente onipresentes. Se houver uma câmera em cada esquina, em cada lugar que você vá, e se alguém pudesse realmente processar todos esses vídeos em conjunto, você pode imaginar essa entidade construindo uma linha do tempo muito precisa de quando e para onde uma pessoa foi”, diz MIT CSAIL O estudante de doutorado Frank Cangialosi, autor principal de um artigo sobre Privid. “As pessoas já estão preocupadas com a privacidade da localização com GPS – os dados de vídeo agregados podem capturar não apenas seu histórico de localização, mas também humor, comportamentos e muito mais em cada local.” 

Privid introduz uma nova noção de “privacidade baseada em duração”, que desvincula a definição de privacidade de sua aplicação – com ofuscação, se seu objetivo de privacidade é proteger todas as pessoas, o mecanismo de aplicação precisa fazer algum trabalho para encontrar as pessoas a serem protegidas , que pode ou não fazer perfeitamente. Com esse mecanismo, você não precisa especificar tudo completamente e não está ocultando mais informações do que o necessário. 

Digamos que temos um vídeo com vista para uma rua. Dois analistas, Alice e Bob, afirmam que desejam contar o número de pessoas que passam por hora, então enviam um módulo de processamento de vídeo e pedem uma agregação de soma.

O primeiro analista é o departamento de planejamento da cidade, que espera usar essas informações para entender os padrões de passos e planejar as calçadas da cidade. O modelo deles conta as pessoas e gera essa contagem para cada trecho de vídeo.

O outro analista é malicioso. Eles esperam identificar toda vez que “Charlie” passar pela câmera. Seu modelo apenas procura o rosto de Charlie e gera um número grande se Charlie estiver presente (ou seja, o “sinal” que eles estão tentando extrair), ou zero caso contrário. A esperança deles é que a soma seja diferente de zero se Charlie estivesse presente. 

Da perspectiva de Privid, essas duas consultas parecem idênticas. É difícil determinar com segurança o que seus modelos podem estar fazendo internamente ou para que o analista espera usar os dados. É aí que entra o ruído. Privid executa ambas as consultas e adiciona a mesma quantidade de ruído para cada uma. No primeiro caso, como Alice estava contando todas as pessoas, esse ruído terá apenas um pequeno impacto no resultado, mas provavelmente não afetará a utilidade. 

No segundo caso, como Bob estava procurando por um sinal específico (Charlie estava visível apenas por alguns trechos), o ruído é suficiente para impedi-los de saber se Charlie estava lá ou não. Se eles virem um resultado diferente de zero, pode ser porque Charlie estava realmente lá, ou porque o modelo produz “zero”, mas o ruído o tornou diferente de zero. Privid não precisava saber nada sobre quando ou onde Charlie apareceu, o sistema só precisava saber um limite superior aproximado de quanto tempo Charlie poderia aparecer, o que é mais fácil de especificar do que descobrir os locais exatos, nos quais os métodos anteriores dependem . 

O desafio é determinar quanto ruído adicionar - Privid deseja adicionar apenas o suficiente para ocultar todos, mas não tanto que seja inútil para os analistas. Adicionar ruído aos dados e insistir em consultas ao longo de janelas de tempo significa que seu resultado não será tão preciso quanto poderia ser, mas os resultados ainda são úteis, proporcionando melhor privacidade. 

Cangialosi escreveu o artigo com o estudante de doutorado de Princeton Neil Agarwal, o estudante de doutorado do MIT CSAIL Venkat Arun, professor assistente da Universidade de Chicago Junchen Jiang, professor assistente da Universidade Rutgers e ex-pós-doutorado do MIT CSAIL Srinivas Narayana, professor associado da Universidade Rutgers Anand Sarwate, e professor assistente na Universidade de Princeton e Ravi Netravali SM '15, PhD '18. Cangialosi apresentará o artigo no USENIX Symposium on Networked Systems Design and Implementation Conference em abril em Renton, Washington. 

Este trabalho foi parcialmente financiado por uma bolsa Sloan Research Fellowship e bolsas da National Science Foundation.

 

.
.

Leia mais a seguir