Talento

Vivienne Sze sobre o cruzamento da divisão hardware-software para inteligência artificial eficiente
Sua pesquisa se concentra em redes neurais profundas mais eficientes para processar vídeo e em hardware mais eficiente para executar aplicativos.
Por Kim Martineau - 30/04/2021


A professora associada Vivienne Sze está trazendo aplicativos de inteligência artificial para smartphones e pequenos robôs ao coprojetar hardware e software com eficiência energética. Créditos: Imagem: Lillie Paquette / Escola de Engenharia do MIT

Não muito tempo atrás, assistir a um filme em um smartphone parecia impossível. Vivienne Sze era estudante de graduação no MIT na época, em meados dos anos 2000, e foi atraída pelo desafio de compactar vídeo para manter a qualidade da imagem alta sem esgotar a bateria do telefone. A solução que ela encontrou exigia o coprojeto de circuitos de eficiência energética com algoritmos de eficiência energética.

Sze faria parte da equipe que ganhou o Prêmio Emmy de Engenharia por desenvolver os padrões de compressão de vídeo ainda em uso hoje. Agora uma professora associada do Departamento de Engenharia Elétrica e Ciência da Computação do MIT, Sze tem como objetivo um novo marco: trazer aplicativos de inteligência artificial para smartphones e pequenos robôs.

Sua pesquisa se concentra em projetar redes neurais profundas mais eficientes para processar vídeo e hardware mais eficiente para executar esses aplicativos. Recentemente, ela copublicou um livro sobre o assunto e ministrará um curso de educação profissional sobre como projetar sistemas eficientes de aprendizado profundo em junho.

Em 29 de abril, Sze se juntará ao professor assistente Song Han para uma mesa redonda do MIT Quest AI sobre o codesign de hardware e software eficiente moderado por Aude Oliva, diretor do MIT Quest Corporate e o diretor do MIT do MIT-IBM Watson AI Lab. Aqui, Sze discute seu trabalho recente.

P: Por que precisamos de IA de baixo consumo agora?

R: Os aplicativos de IA estão mudando para smartphones, pequenos robôs e aparelhos e outros dispositivos conectados à Internet com capacidade limitada de potência e processamento. O desafio é que a IA possui altos requisitos de computação. Analisar os dados do sensor e da câmera de um carro autônomo pode consumir cerca de 2.500 watts, mas o orçamento de computação de um smartphone é de apenas um watt. Fechar essa lacuna exige repensar toda a pilha, uma tendência que definirá a próxima década da IA.

Qual é o problema de executar IA em um smartphone?

Isso significa que o processamento de dados não precisa mais ocorrer na “nuvem”, em racks de servidores de warehouse. Desconectar a computação da nuvem nos permite ampliar o alcance da IA. Ele dá às pessoas em países em desenvolvimento com acesso limitado à infraestrutura de comunicação à IA. Ele também acelera o tempo de resposta, reduzindo o atraso causado pela comunicação com servidores distantes. Isso é crucial para aplicativos interativos como navegação autônoma e realidade aumentada, que precisam responder instantaneamente às mudanças nas condições. O processamento de dados no dispositivo também pode proteger registros médicos e outros registros confidenciais. Os dados podem ser processados ​​exatamente onde são coletados.

O que torna a IA moderna tão ineficiente?

A pedra angular da IA ​​moderna - redes neurais profundas - pode exigir centenas de milhões a bilhões de cálculos - ordens de magnitude maiores do que compactar vídeo em um smartphone. Mas não é apenas a análise de números que faz com que as redes profundas consumam muita energia - é o custo de embaralhar os dados de e para a memória para realizar esses cálculos. Quanto mais longe os dados precisam viajar, e quanto mais dados houver, maior será o gargalo.

Como você está redesenhando o hardware de IA para maior eficiência energética?

Nosso foco é reduzir a movimentação de dados e a quantidade de dados necessária para o cálculo. Em algumas redes profundas, os mesmos dados são usados ​​várias vezes para cálculos diferentes. Projetamos hardware especializado para reutilizar dados localmente, em vez de enviá-los fora do chip. O armazenamento de dados reutilizados no chip torna o processo extremamente eficiente em termos de energia.  

Também otimizamos a ordem em que os dados são processados ​​para maximizar sua reutilização. Essa é a principal propriedade do chip Eyeriss que foi desenvolvido em colaboração com Joel Emer. Em nosso trabalho de acompanhamento, Eyeriss v2 , tornamos o chip flexível o suficiente para reutilizar dados em uma ampla gama de redes profundas. O chip Eyeriss também usa compactação para reduzir a movimentação de dados, uma tática comum entre os chips AI. O chip Navion de baixa potência que foi desenvolvido em colaboração com Sertac Karaman para aplicações de mapeamento e navegação em robótica usa duas a três ordens de magnitude menos energia do que uma CPU, em parte usando otimizações que reduzem a quantidade de dados processados ​​e armazenados. lasca. 

Que mudanças você fez no lado do software para aumentar a eficiência?

Quanto mais o software se alinha com as métricas de desempenho relacionadas ao hardware, como eficiência de energia, melhor podemos fazer. A poda, por exemplo, é uma maneira popular de remover pesos de uma rede profunda para reduzir os custos de computação. Mas, em vez de remover os pesos com base em sua magnitude, nosso trabalho sobre a poda com consciência energética sugere que você pode remover os pesos que consomem mais energia para melhorar o consumo geral de energia. Outro método que desenvolvemos, NetAdapt , automatiza o processo de adaptação e otimização de uma rede profunda para um smartphone ou outras plataformas de hardware. Nosso recente trabalho de acompanhamento, NetAdaptv2 , acelera o processo de otimização para aumentar ainda mais a eficiência.

Em quais aplicativos de IA de baixo consumo você está trabalhando?

Estou explorando a navegação autônoma para robôs de baixa energia com Sertac Karaman. Também estou trabalhando com Thomas Heldt para desenvolver uma maneira de baixo custo e potencialmente mais eficaz de diagnosticar e monitorar pessoas com doenças neurodegenerativas como Alzheimer e Parkinson, rastreando os movimentos dos olhos. Propriedades do movimento ocular, como o tempo de reação, podem servir como biomarcadores para a função cerebral. No passado, o rastreamento do movimento dos olhos acontecia em clínicas por causa dos caros equipamentos necessários. Temos mostrado que uma câmera do smartphone comum pode fazer medições da casa de um paciente, tornando a coleta de dados mais fácil e menos caro. Isso poderia ajudar a monitorar a progressão da doença e acompanhar as melhorias nos ensaios clínicos de medicamentos.

Para onde vai a IA de baixa potência?

Reduzir os requisitos de energia da IA ​​estenderá a IA a uma ampla gama de dispositivos incorporados, estendendo seu alcance a pequenos robôs , casas inteligentes e dispositivos médicos . Um desafio importante é que a eficiência geralmente requer uma compensação no desempenho. Para ampla adoção, será importante se aprofundar nessas diferentes aplicações para estabelecer o equilíbrio certo entre eficiência e precisão.

 

.
.

Leia mais a seguir