Tecnologia Científica

Resolvendo os desafios da fabricação robótica de pizza
Uma nova técnica pode permitir que um robô manipule objetos moles como massa de pizza ou materiais macios como roupas.
Por Adam Zewe - 03/04/2022


Pesquisadores do MIT e de outros lugares criaram uma estrutura que pode permitir que um robô conclua efetivamente tarefas complexas de manipulação com objetos deformáveis, como massa ou pano, que exigem muitas ferramentas e levam muito tempo para serem concluídos. Créditos: Imagens cortesia dos pesquisadores

Imagine um pizzaiolo trabalhando com uma bola de massa. Ela pode usar uma espátula para levantar a massa em uma tábua de corte e usar um rolo para achatá-la em um círculo. Fácil, certo? Não se este pizzaiolo for um robô.

Para um robô, trabalhar com um objeto deformável como a massa é complicado porque a forma da massa pode mudar de várias maneiras, que são difíceis de representar com uma equação. Além disso, criar uma nova forma a partir dessa massa requer várias etapas e o uso de diferentes ferramentas. É especialmente difícil para um robô aprender uma tarefa de manipulação com uma longa sequência de etapas – onde há muitas opções possíveis – já que o aprendizado geralmente ocorre por tentativa e erro.

Pesquisadores do MIT, da Universidade Carnegie Mellon e da Universidade da Califórnia em San Diego encontraram uma maneira melhor. Eles criaram uma estrutura para um sistema de manipulação robótica que usa um processo de aprendizado de dois estágios, que pode permitir que um robô execute tarefas complexas de manipulação de massa por um longo período de tempo. Um algoritmo de “professor” resolve cada passo que o robô deve dar para completar a tarefa. Em seguida, ele treina um modelo de aprendizado de máquina “estudante” que aprende ideias abstratas sobre quando e como executar cada habilidade necessária durante a tarefa, como usar um rolo. Com esse conhecimento, o sistema raciocina sobre como executar as habilidades para concluir toda a tarefa.

Os pesquisadores mostram que esse método, que eles chamam de DiffSkill, pode realizar tarefas complexas de manipulação em simulações, como cortar e espalhar massa ou juntar pedaços de massa em torno de uma tábua de cortar, enquanto supera outros métodos de aprendizado de máquina.

Além de fazer pizza, esse método pode ser aplicado em outros ambientes onde um robô precisa manipular objetos deformáveis, como um robô cuidador que alimenta, dá banho ou veste alguém idoso ou com deficiência motora.

“Esse método está mais próximo de como nós, humanos, planejamos nossas ações. Quando um humano realiza uma tarefa de longo prazo, não estamos anotando todos os detalhes. Temos um planejador de nível superior que nos diz aproximadamente quais são os estágios e alguns dos objetivos intermediários que precisamos alcançar ao longo do caminho, e então os executamos ”, diz Yunzhu Li, estudante de pós-graduação em Ciência da Computação e Inteligência Artificial Laboratory (CSAIL), e autor de um artigo apresentando DiffSkill.

Os coautores de Li incluem o autor principal Xingyu Lin, estudante de pós-graduação da Carnegie Mellon University (CMU); Zhiao Huang, estudante de pós-graduação da Universidade da Califórnia em San Diego; Joshua B. Tenenbaum, Professor de Desenvolvimento de Carreira Paul E. Newton de Ciência Cognitiva e Computação no Departamento de Cérebro e Ciências Cognitivas do MIT e membro do CSAIL; David Held, professor assistente da CMU; e autor sênior Chuang Gan, um cientista de pesquisa do MIT-IBM Watson AI Lab. A pesquisa será apresentada na Conferência Internacional sobre Representações de Aprendizagem.

Aluno e professor

 O “professor” na estrutura DiffSkill é um algoritmo de otimização de trajetória que pode resolver tarefas de horizonte curto, onde o estado inicial de um objeto e a localização de destino estão próximos. O otimizador de trajetória funciona em um simulador que modela a física do mundo real (conhecido como simulador de física diferenciável, que coloca o “Diff” em “DiffSkill”). O algoritmo do “professor” usa as informações do simulador para aprender como a massa deve se mover em cada estágio, um de cada vez, e então gera essas trajetórias.

Então a rede neural do “aluno” aprende a imitar as ações do professor. Como entradas, utiliza duas imagens de câmera, uma mostrando a massa em seu estado atual e outra mostrando a massa no final da tarefa. A rede neural gera um plano de alto nível para determinar como vincular diferentes habilidades para atingir a meta. Em seguida, ele gera trajetórias específicas de horizonte curto para cada habilidade e envia comandos diretamente para as ferramentas.

Os pesquisadores usaram essa técnica para experimentar três diferentes tarefas simuladas de manipulação de massa. Em uma tarefa, o robô usa uma espátula para levantar a massa em uma tábua de corte e depois usa um rolo para achatá-la. Em outro, o robô usa uma pinça para pegar a massa de todo o balcão, coloca-a em uma espátula e a transfere para uma tábua de cortar. Na terceira tarefa, o robô corta uma pilha de massa ao meio usando uma faca e depois usa uma pinça para transportar cada pedaço para diferentes locais.

Um corte acima do resto

DiffSkill foi capaz de superar técnicas populares que dependem de aprendizado por reforço, onde um robô aprende uma tarefa por tentativa e erro. Na verdade, o DiffSkill foi o único método capaz de completar com sucesso todas as três tarefas de manipulação de massa. Curiosamente, os pesquisadores descobriram que a rede neural do “aluno” foi capaz de superar o algoritmo do “professor”, diz Lin.

“Nossa estrutura fornece uma nova maneira para os robôs adquirirem novas habilidades. Essas habilidades podem ser encadeadas para resolver tarefas mais complexas que estão além da capacidade dos sistemas robóticos anteriores”, diz Lin.

Como o método deles se concentra no controle das ferramentas (espátula, faca, rolo etc.), ele pode ser aplicado a diferentes robôs, mas apenas se eles usarem as ferramentas específicas definidas pelos pesquisadores. Futuramente, eles planejam integrar o formato de uma ferramenta ao raciocínio da rede “estudante” para que possa ser aplicada a outros equipamentos.

Os pesquisadores pretendem melhorar o desempenho do DiffSkill usando dados 3D como entradas, em vez de imagens que podem ser difíceis de transferir da simulação para o mundo real. Eles também querem tornar o processo de planejamento da rede neural mais eficiente e coletar dados de treinamento mais diversos para aprimorar a capacidade do DiffSkill de generalizar para novas situações. A longo prazo, eles esperam aplicar o DiffSkill a tarefas mais diversas, incluindo manipulação de tecidos.

Este trabalho é apoiado, em parte, pela National Science Foundation, LG Electronics, MIT-IBM Watson AI Lab, Office of Naval Research e o programa Machine Common Sense da Defense Advanced Research Projects Agency.

 

.
.

Leia mais a seguir