Humanidades

Adaptando o treinamento de aprendizado profundo do MIT para o mundo virtual
Com tecnologias novas e antigas, os instrutores tentam recriar a interatividade de sua sala de aula pré-Covid.
Por Kim Martineau | - 06/03/2021


Os alunos de pós-graduação Ava Soleimany (à esquerda) e Alexander Amini mudaram seu popular curso IAP sobre aprendizado profundo online este ano, mas ainda assim conseguiram algumas surpresas. O curso matriculou um recorde de 550 alunos este ano e contou com 50 projetos finais cobrindo aplicações de aprendizado profundo em quase todas as disciplinas representadas no MIT. Créditos: Foto: Ashley Amini-Sami

O aprendizado profundo está avançando na velocidade da luz, e Alexander Amini '17 e Ava Soleimany '16 querem ter certeza de que eles terão sua atenção enquanto se aprofundam na matemática por trás dos algoritmos e nas maneiras como o aprendizado profundo está transformando a vida diária.

No ano passado, seu curso de sucesso, 6.S191  (Introdução ao Aprendizado Profundo) abriu com um vídeo falso de boas-vindas do ex-presidente Barack Obama. Este ano, a dupla deu suas palestras "ao vivo" no Stata Center - depois de gravá-las com semanas de antecedência em sua cozinha, equipada para a ocasião com luzes de estúdio, um pódio e uma tela verde para projetar o quadro-negro no Auditório Kirsch em seu Zoom fundos.

“É difícil para os alunos permanecerem engajados quando estão olhando para a imagem estática de um instrutor”, diz Amini. “Queríamos recriar a dinâmica de uma sala de aula real.”

Amini é estudante de graduação no  Departamento de Engenharia Elétrica e Ciência da Computação  (EECS) do MIT, e Soleimany é estudante de graduação no MIT e na Universidade de Harvard. Eles codesenvolveram o currículo do 6.S191 e o ensinaram durante o período de atividades independentes (IAP) do MIT por quatro dos últimos cinco anos. Suas palestras e laboratórios de software são atualizados a cada ano, mas a edição da pandemia deste ano representou um desafio especial. Eles responderam com uma mistura de soluções de baixa e alta tecnologia, desde filmar as palestras com antecedência até realizar sessões de ajuda em uma plataforma semelhante ao Minecraft que imita a sensação de socializar pessoalmente.

Alguns alunos perceberam que as aulas não eram ao vivo depois de perceberem pistas como a mudança abrupta de guarda-roupa quando os instrutores mudaram do modo de aula para a sessão de ajuda imediatamente após a aula. Os que pegaram parabenizaram a dupla nas avaliações do curso. Aqueles que não reagiram com espanto. "Você quer dizer que eles não foram transmitidos ao vivo?" perguntou a estudante de doutorado Nada Tarkhan, após uma longa pausa. “Parecia que um instrutor estava dando a palestra, enquanto o outro respondia a perguntas na caixa de bate-papo.”

A popularidade crescente do 6.S191 - tanto como uma aula para crédito no MIT, quanto como um curso individualizado on-line - reflete o surgimento de redes neurais profundas para tudo, desde tradução de idiomas até reconhecimento facial. Em uma série de palestras claras e envolventes, Amini e Soleimany cobrem os fundamentos técnicos de redes profundas e como os algoritmos selecionam padrões em resmas de dados para fazer previsões. Eles também exploram as inúmeras aplicações do aprendizado profundo e como os alunos podem avaliar as previsões de um modelo quanto à precisão e viés.

Respondendo ao feedback dos alunos, Amini e Soleimany este ano estenderam o curso de uma semana para duas, dando aos alunos mais tempo para absorver o material e montar os projetos finais. Eles também adicionaram duas novas palestras: uma sobre estimativa de incerteza, a outra sobre viés algorítmico e justiça. Ao colocar a classe online, eles também foram capazes de admitir 200 alunos extras que teriam sido recusados ​​pelo limite de 350 lugares do Auditório Kirsch.

Para tornar mais fácil para os alunos se conectarem com professores assistentes e entre si, Amini e Soleimany apresentaram Gather.Town , uma plataforma que eles descobriram em uma conferência de aprendizado de máquina no outono passado. Os alunos moveram seus avatares no auditório virtual 6.S191 para fazer perguntas sobre o dever de casa ou encontrar colaboradores e solucionar problemas relacionados aos seus projetos finais.

Os alunos deram ao curso notas altas por sua amplitude e organização. “Eu conhecia os chavões como aprendizado por reforço e RNNs, mas nunca entendi realmente os detalhes, como criar parâmetros no TensorFlow e definir funções de ativação”, diz Claire Dong, do segundo ano. “Saí da aula com mais clareza e mais energia sobre o campo.”

Este ano, 50 equipes apresentaram projetos finais, o dobro do ano anterior, e cobriram uma gama ainda mais ampla de aplicações, dizem Amini e Soleimany, desde o comércio de criptomoedas até a previsão de incêndios florestais e a simulação do enovelamento de proteínas em uma célula.

“A semana extra realmente os ajudou a elaborar sua ideia, criar parte dela, codificá-la e juntar as peças em uma apresentação”, diz Amini.

“Eles foram simplesmente brilhantes”, acrescenta Soleimany. “A qualidade e a organização das ideias, das conversas.”

Quatro projetos foram selecionados para os prêmios.

O primeiro foi uma proposta de classificação dos sinais cerebrais para diferenciar os movimentos da mão direita da esquerda. Antes de se transferir do Miami-Dade Community College para o MIT, Nelson Hidalgo havia trabalhado em interfaces cérebro-computador para ajudar pessoas com paralisia a recuperar o controle de seus membros. Para seu projeto final, Hidalgo, estudante do segundo ano do EECS, usou gravações de ondas cerebrais de EEG para construir um modelo para classificar os sinais de alguém tentando mover a mão direita e a esquerda.

Sua arquitetura de rede neural apresentava uma rede neural convolucional e recorrente combinada trabalhando em paralelo para extrair padrões sequenciais e espaciais nos dados. O resultado foi um modelo que aprimorou outros métodos para prever a intenção do cérebro de mover qualquer uma das mãos, diz ele. “Um classificador mais preciso poderia realmente tornar essa tecnologia acessível aos pacientes diariamente.”

Um segundo projeto explorou o potencial da silvicultura baseada em IA. O plantio de árvores se tornou uma forma popular de as empresas compensarem suas emissões de carbono, mas rastrear quanto dióxido de carbono essas árvores realmente absorvem ainda é uma ciência inexata. Peter McHale, um aluno de mestrado na MIT Sloan School of Management , propôs que sua startup recentemente lançada, Gaia AI , poderia voar drones sobre as florestas para obter imagens detalhadas do dossel acima e abaixo.

Essas imagens de alta resolução podem ajudar os gestores florestais a estimar melhor o crescimento das árvores, diz ele, e calcular quanto carbono absorveram do ar. A filmagem também pode fornecer pistas sobre quais tipos de árvores crescem melhor em determinados climas e condições. “Os drones podem fazer medições de forma mais barata e precisa do que os humanos”, diz ele.

Na primeira fase de desenvolvimento do Gaia AI, McHale diz que planeja se concentrar na venda de dados de sensores coletados por drones de alta qualidade para empresas madeireiras que precisam de métodos de pesquisa mais baratos e mais precisos, bem como empresas que fornecem validação de terceiros para compensações de carbono . Na fase dois, McHale prevê transformar esses dados e os lucros que eles geram para atacar as mudanças climáticas por meio do plantio de árvores com drones.

Um terceiro projeto explorou o estado da arte para codificar comportamento inteligente em robôs. Como SuperUROP no laboratório da professora Sangbae Kim, Savva Morozov trabalha com a min chita e está interessada em descobrir maneiras que robôs como ele possam aprender a aprender.

Para seu projeto, Morozov, um júnior no Departamento de Aeronáutica e Astronáutica , apresentou um cenário: um mini robô parecido com uma chita está lutando para escalar uma pilha de escombros. Ele localiza uma prancha de madeira que poderia ser pega com seu braço robótico e transformada em uma rampa. Mas não tem imaginação nem repertório de habilidades para construir uma ferramenta para chegar ao cume. Morozov explicou como diferentes métodos de aprender a aprender podem ajudar a resolver o problema.

Um quarto projeto propôs o uso de aprendizagem profunda para facilitar a análise de imagens de rua de edifícios para modelar o consumo de energia de uma cidade inteira. Um algoritmo desenvolvido pelo Laboratório de Design Sustentável do MIT  e o estudante graduado Jakub Szczesniak estima a proporção janela-parede de um edifício com base nos detalhes capturados na foto, mas o processamento da imagem requer muito trabalho tedioso no início.

Nada Tarkhan, estudante de doutorado na Escola de Arquitetura e Planejamento , propôs adicionar uma rede neural convolucional de processamento de imagens ao fluxo de trabalho para tornar a análise mais rápida e confiável. “Esperamos que isso possa nos ajudar a reunir dados mais precisos para entender as características de construção em nossas cidades - as características da fachada, materiais e proporções de parede a janela”, diz ela. “O objetivo final é melhorar nossa compreensão de como os edifícios funcionam em toda a cidade.”

Com base no feedback dos alunos, Amini e Soleimany afirmam que planejam manter o foco adicional na incerteza e no preconceito enquanto conduzem o curso para novas áreas. “Adoramos saber que os alunos foram inspirados a fazer mais aulas de AI / ML depois de fazer o 6.S191”, diz Soleimany. “Esperamos continuar inovando para manter o curso relevante.”

O financiamento para o curso foi fornecido pela Ernst & Young, Google, MIT-IBM Watson AI Lab e NVIDIA.

 

.
.

Leia mais a seguir