Talento

Desbloqueando novas portas para a inteligência artificial
Os alunos de pós-graduação do MEng se envolvem com a IBM para desenvolver suas habilidades de pesquisa e soluções para problemas do mundo real.
Por Lauren Hinkel - 05/03/2022


No sentido horário, a partir do canto superior esquerdo: Violetta Jusiega, Spencer Compton, Ivy Huang e Brandom Perez - Fotos cortesia dos alunos.

A pesquisa em inteligência artificial está constantemente desenvolvendo novas hipóteses que têm o potencial de beneficiar a sociedade e a indústria; no entanto, às vezes esses benefícios não são totalmente realizados devido à falta de ferramentas de engenharia. Para ajudar a preencher essa lacuna, os alunos de pós-graduação do Programa de Tese de Mestrado em Engenharia (MEng) 6-A do Departamento de Engenharia Elétrica e Ciência da Computação do MIT trabalham com algumas das empresas mais inovadoras do mundo e colaboram em projetos de ponta, enquanto contribuem para e completando sua tese MEng.

Durante uma parte do ano passado, quatro alunos do 6-A MEng se uniram e concluíram um estágio com a equipe de prototipagem avançada da IBM Research por meio do MIT-IBM Watson AI Lab em projetos de IA, geralmente desenvolvendo aplicativos da Web para resolver um problema do mundo real ou casos de uso de negócios. Aqui, os alunos trabalharam ao lado de engenheiros de IA, engenheiros de experiência do usuário, pesquisadores full-stack e generalistas para acomodar solicitações de projetos e receber conselhos de teses, diz Lee Martie, membro da equipe de pesquisa da IBM e gerente da 6-A. Os projetos dos alunos variaram desde a geração de dados sintéticos para permitir a análise de dados sensíveis à privacidade até o uso de visão computacional para identificar ações em vídeo que permitem monitorar a segurança humana e acompanhar o progresso da construção em um canteiro de obras.

“Apreciei toda a expertise da equipe e o feedback”, diz Violetta Jusiega '21, graduada 6-A, que participou do programa. “Acho que trabalhar na indústria oferece a lente de garantir que as necessidades do projeto sejam atendidas e [oferece a oportunidade] de fundamentar a pesquisa e garantir que seja útil para algum caso de uso no futuro.”

A pesquisa de Jusiega cruzou os campos de visão computacional e design para focar em visualização de dados e interfaces de usuário para a área médica. Trabalhando com a IBM, ela construiu uma interface de programação de aplicativos (API) que permite que os médicos interajam com um modelo de IA de estratégia de tratamento médico, que foi implantado na nuvem. Sua interface forneceu uma árvore de decisão médica, bem como alguns planos de tratamento prescritos. Depois de receber feedback sobre seu projeto de médicos em um hospital local, Jusiega desenvolveu iterações da API e como os resultados eram exibidos, visualmente, para que fossem fáceis de usar e compreensíveis para os médicos, que geralmente não codificam. Ela diz que, “Essas ferramentas muitas vezes não são adquiridas em campo porque carecem de alguns desses princípios de API que se tornam mais importantes em um setor onde tudo já é muito rápido, então há pouco tempo para incorporar uma nova tecnologia.” Mas esse projeto pode eventualmente permitir a implantação do setor. “Acho que esse aplicativo tem muito potencial, seja ele escolhido pelos médicos ou simplesmente usado em pesquisas. É muito promissor e muito emocionante ver como a tecnologia pode nos ajudar a modificar, ou posso melhorar, o campo da saúde para ser ainda mais personalizado para os pacientes e oferecer a eles o melhor atendimento possível”, diz ela. “Acho que esse aplicativo tem muito potencial, seja ele escolhido pelos médicos ou simplesmente usado em pesquisas. É muito promissor e muito emocionante ver como a tecnologia pode nos ajudar a modificar, ou posso melhorar, o campo da saúde para ser ainda mais personalizado para os pacientes e oferecer a eles o melhor atendimento possível”, diz ela. “Acho que esse aplicativo tem muito potencial, seja ele escolhido pelos médicos ou simplesmente usado em pesquisas. É muito promissor e muito emocionante ver como a tecnologia pode nos ajudar a modificar, ou posso melhorar, o campo da saúde para ser ainda mais personalizado para os pacientes e oferecer a eles o melhor atendimento possível”, diz ela.

Outro estudante de pós-graduação 6-A, Spencer Compton, também estava considerando ajudar os profissionais a tomar decisões mais informadas, para uso em ambientes que incluem cuidados de saúde, mas ele estava abordando isso de uma perspectiva causal. Ao receber um conjunto de variáveis ​​relacionadas, Compton estava investigando se havia uma maneira de determinar não apenas a correlação, mas a relação de causa e efeito entre elas (a direção da interação) apenas a partir dos dados. Para isso, ele e seus colaboradores da IBM Research e da Purdue University recorreram a um campo da matemática chamado teoria da informação. Com o objetivo de projetar um algoritmo para aprender redes complexas de relações causais, Compton usou ideias relacionadas à entropia, a aleatoriedade em um sistema, para ajudar a determinar se uma relação causal está presente e como as variáveis ​​podem estar interagindo. “Ao julgar uma explicação, as pessoas costumam usar a navalha de Occam como padrão”, diz Compton. “Estamos mais inclinados a acreditar em uma explicação mais simples do que em uma mais complexa.” Em muitos casos, ele diz, parecia ter um bom desempenho. Por exemplo, eles foram capazes de considerar variáveis ​​como câncer de pulmão, poluição e achados de raios-X. Ele ficou satisfeito que sua pesquisa permitiu que ele ajudasse a criar uma estrutura de “inferência causal entrópica” que poderia ajudar em decisões seguras e inteligentes no futuro, de maneira satisfatória. “A matemática é realmente surpreendentemente profunda, interessante e complexa”, diz Compton. “Nós estamos basicamente perguntando, 'quando a explicação mais simples é correta?' mas como uma questão de matemática.” eles foram capazes de considerar variáveis ​​como câncer de pulmão, poluição e achados de raios-X. Ele ficou satisfeito que sua pesquisa permitiu que ele ajudasse a criar uma estrutura de “inferência causal entrópica” que poderia ajudar em decisões seguras e inteligentes no futuro, de maneira satisfatória. “A matemática é realmente surpreendentemente profunda, interessante e complexa”, diz Compton. “Nós estamos basicamente perguntando, 'quando a explicação mais simples é correta?' mas como uma questão de matemática.” eles foram capazes de considerar variáveis ​​como câncer de pulmão, poluição e achados de raios-X. Ele ficou satisfeito que sua pesquisa permitiu que ele ajudasse a criar uma estrutura de “inferência causal entrópica” que poderia ajudar em decisões seguras e inteligentes no futuro, de maneira satisfatória. “A matemática é realmente surpreendentemente profunda, interessante e complexa”, diz Compton. “Nós estamos basicamente perguntando, 'quando a explicação mais simples é correta?' mas como uma questão de matemática.” 'quando a explicação mais simples está correta?' mas como uma questão de matemática.” 'quando a explicação mais simples está correta?' mas como uma questão de matemática.”

Determinar relacionamentos dentro de dados às vezes pode exigir grandes volumes para descobrir padrões, mas para dados que podem conter informações confidenciais, isso pode não estar disponível. Para seu trabalho de mestrado, Ivy Huang trabalhou com a IBM Research para gerar dados tabulares sintéticos usando uma ferramenta de processamento de linguagem natural chamada modelo de transformador, que pode aprender e prever valores futuros a partir de valores passados. Treinado em dados reais, o modelo pode produzir novos dados com padrões, propriedades e relacionamentos semelhantes sem restrições como privacidade, disponibilidade e acesso que podem vir com dados reais em transações financeiras e registros médicos eletrônicos. Além disso, ela criou uma API e implementou o modelo em um cluster IBM, o que permitiu aos usuários aumentar o acesso ao modelo e a capacidade de consultá-lo sem comprometer os dados originais.

Trabalhando com a equipe de prototipagem avançada, o candidato do MEng Brandon Perez também considerou como coletar e investigar dados com restrições, mas no seu caso foi usar estruturas de visão computacional, centradas em um modelo de reconhecimento de ações, para identificar os acontecimentos do canteiro de obras. A equipe baseou seu trabalho no conjunto de dados Moments in Time, que contém mais de um milhão de videoclipes de três segundos com cerca de 300 rótulos de classificação anexados e teve um bom desempenho durante o treinamento de IA. No entanto, o grupo precisava de mais dados de vídeo baseados em construção. Para isso, eles usaram o YouTube-8M. Perez construiu uma estrutura para testar e ajustar modelos de detecção de objetos existentes e modelos de reconhecimento de ação que podem ser conectados a uma ferramenta automática de localização espacial e temporal - como eles identificariam e rotulariam ações específicas em uma linha do tempo de vídeo. “Fiquei satisfeito por poder explorar o que me deixou curioso e grato pela autonomia que me foi dada com este projeto”, diz Perez. “Senti que sempre fui apoiado e meu mentor foi um grande apoio ao projeto.”

“O tipo de colaboração que vimos entre nossos alunos do MEng e pesquisadores da IBM é exatamente o que é o programa 6-A MEng Thesis no MIT”, diz Tomas Palacios, professor de engenharia elétrica e diretor do corpo docente do MIT 6-A. Programa de Tese do MEng. “Por mais de 100 anos, a 6-A conecta estudantes do MIT com a indústria para resolver juntos alguns dos problemas mais importantes do mundo.”

 

.
.

Leia mais a seguir