Engenheiros do MIT projetaram uma interface versátil que permite aos usuários ensinar novas habilidades aos robôs de maneiras intuitivas.

Uma nova interface portátil desenvolvida por engenheiros do MIT permite que uma pessoa ensine novas habilidades a um robô, usando qualquer uma das três abordagens de treinamento: ensino natural (canto superior esquerdo), treinamento cinestésico (meio) e teleoperação. Crédito: Cortesia dos pesquisadores
Ensinar novas habilidades a um robô costumava exigir experiência em programação. Mas uma nova geração de robôs tem potencial para aprender com praticamente qualquer pessoa.
Engenheiros estão projetando robôs auxiliares que podem "aprender por meio de demonstrações". Essa estratégia de treinamento mais natural permite que uma pessoa conduza um robô em uma tarefa, normalmente de três maneiras: por controle remoto, como operar um joystick para manobrar remotamente um robô; movendo fisicamente o robô durante os movimentos; ou executando a tarefa ela mesma enquanto o robô observa e imita.
Robôs que aprendem fazendo geralmente treinam usando apenas uma dessas três abordagens de demonstração. Mas engenheiros do MIT desenvolveram uma interface de treinamento três em um que permite que um robô aprenda uma tarefa por meio de qualquer um dos três métodos de treinamento. A interface se apresenta na forma de uma ferramenta portátil equipada com sensores que pode ser acoplada a diversos braços robóticos colaborativos comuns. Uma pessoa pode usar o acessório para ensinar um robô a executar uma tarefa, controlando-o remotamente, manipulando-o fisicamente ou demonstrando a tarefa por conta própria — conforme o estilo que preferir ou que melhor se adapte à tarefa em questão.
A equipe do MIT testou a nova ferramenta, que eles chamam de "interface de demonstração versátil", em um braço robótico colaborativo padrão. Voluntários com experiência em manufatura usaram a interface para realizar duas tarefas manuais comumente realizadas em fábricas.
Os pesquisadores afirmam que a nova interface oferece maior flexibilidade de treinamento, o que pode expandir o tipo de usuários e "professores" que interagem com robôs. Ela também pode permitir que os robôs aprendam um conjunto mais amplo de habilidades. Por exemplo, uma pessoa pode treinar remotamente um robô para manusear substâncias tóxicas, enquanto, mais adiante na linha de produção, outra pessoa pode movimentar fisicamente o robô durante os movimentos de encaixotamento de um produto e, no final da linha, outra pessoa pode usar o acessório para desenhar o logotipo da empresa enquanto o robô observa e aprende a fazer o mesmo.
“Estamos tentando criar colegas de equipe altamente inteligentes e qualificados que possam trabalhar efetivamente com humanos para realizar trabalhos complexos”, diz Mike Hagenow, pós-doutorando no MIT no Departamento de Aeronáutica e Astronáutica. “Acreditamos que ferramentas de demonstração flexíveis podem ajudar muito além da área de produção, em outras áreas onde esperamos ver uma maior adoção de robôs, como em ambientes domésticos ou de cuidadores.”
Hagenow apresentará um artigo detalhando a nova interface na conferência IEEE Intelligent Robots and Systems (IROS) em outubro. Os coautores do artigo no MIT são Dimosthenis Kontogiorgos, pós-doutorando no Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL); Yanwei Wang, PhD '25, que recentemente obteve um doutorado em engenharia elétrica e ciência da computação; e Julie Shah, professora do MIT e chefe do Departamento de Aeronáutica e Astronáutica.
Treinando juntos
O grupo de Shah no MIT projeta robôs que podem trabalhar lado a lado com humanos no local de trabalho, em hospitais e em casa. Um dos principais focos de sua pesquisa é desenvolver sistemas que permitam que as pessoas ensinem aos robôs novas tarefas ou habilidades "no trabalho", por assim dizer. Tais sistemas ajudariam, por exemplo, um operário de fábrica a ajustar de forma rápida e natural as manobras de um robô para aprimorar sua tarefa no momento, em vez de parar para reprogramar o software do robô do zero — uma habilidade que um operário pode não necessariamente ter.
O novo trabalho da equipe baseia-se em uma estratégia emergente em aprendizagem de robôs chamada "aprendizagem por demonstração", ou LfD, na qual robôs são projetados para serem treinados de maneiras mais naturais e intuitivas. Ao analisar a literatura sobre LfD, Hagenow e Shah descobriram que os métodos de treinamento em LfD desenvolvidos até o momento se enquadram, de modo geral, nas três categorias principais: teleoperação, treinamento cinestésico e ensino natural.
Um método de treinamento pode funcionar melhor do que os outros dois para uma pessoa ou tarefa específica. Shah e Hagenow se perguntaram se conseguiriam projetar uma ferramenta que combinasse os três métodos para permitir que um robô aprendesse mais tarefas com mais pessoas.
“Se pudéssemos reunir essas três maneiras diferentes pelas quais alguém pode querer interagir com um robô, isso poderia trazer benefícios para diferentes tarefas e diferentes pessoas”, diz Hagenow.
Tarefas em mãos
Com esse objetivo em mente, a equipe projetou uma nova interface de demonstração versátil (VDI). A interface é um acessório portátil que se encaixa no braço de um braço robótico colaborativo típico. O acessório é equipado com uma câmera e marcadores que rastreiam a posição e os movimentos da ferramenta ao longo do tempo, juntamente com sensores de força para medir a quantidade de pressão aplicada durante uma determinada tarefa.
Quando a interface é acoplada a um robô, todo o robô pode ser controlado remotamente, e a câmera da interface registra os movimentos do robô, que podem ser usados como dados de treinamento para aprender a tarefa por conta própria. Da mesma forma, uma pessoa pode mover fisicamente o robô durante uma tarefa, com a interface acoplada. O VDI também pode ser destacado e fisicamente segurado por uma pessoa para executar a tarefa desejada. A câmera registra os movimentos do VDI, que o robô também pode usar para imitar a tarefa quando o VBI for reconectado.
Para testar a usabilidade do acessório, a equipe levou a interface, juntamente com um braço robótico colaborativo, a um centro de inovação local, onde especialistas em manufatura aprendem e testam tecnologias que podem aprimorar os processos de chão de fábrica. Os pesquisadores montaram um experimento no qual pediram a voluntários do centro que usassem o robô e os três métodos de treinamento da interface para realizar duas tarefas comuns de manufatura: prensagem e moldagem. Na prensagem, o usuário treinou o robô para prensar e encaixar pinos em furos, semelhante a muitas tarefas de fixação. Para a moldagem, um voluntário treinou o robô para empurrar e rolar uma substância elástica, semelhante a uma massa, uniformemente ao redor da superfície de uma haste central, semelhante a algumas tarefas de termomoldagem.
Para cada uma das duas tarefas, os voluntários foram solicitados a usar cada um dos três métodos de treinamento, primeiro teleoperando o robô usando um joystick, depois manipulando o robô cinestesicamente e, finalmente, destacando o acessório do robô e usando-o para executar a tarefa "naturalmente", enquanto o robô registrava a força e os movimentos do acessório.
Os pesquisadores descobriram que os voluntários, em geral, preferiam o método natural à teleoperação e ao treinamento cinestésico. Os usuários, todos especialistas em manufatura, ofereceram cenários nos quais cada método poderia apresentar vantagens sobre os outros. A teleoperação, por exemplo, pode ser preferível no treinamento de um robô para manusear substâncias perigosas ou tóxicas. O treinamento cinestésico pode ajudar os trabalhadores a ajustar o posicionamento de um robô encarregado de mover pacotes pesados. E o ensino natural pode ser benéfico na demonstração de tarefas que envolvam manobras delicadas e precisas.
“Imaginamos o uso da nossa interface de demonstração em ambientes de manufatura flexíveis, onde um robô pode auxiliar em uma série de tarefas que se beneficiam de tipos específicos de demonstração”, diz Hagenow, que planeja refinar o design do acessório com base no feedback do usuário e usará o novo design para testar o aprendizado do robô. “Vemos este estudo como uma demonstração de como uma maior flexibilidade em robôs colaborativos pode ser alcançada por meio de interfaces que expandem as maneiras pelas quais os usuários finais interagem com os robôs durante o ensino.”
Este trabalho foi apoiado, em parte, pelo Programa de Bolsas de Pós-Doutorado do MIT para Excelência em Engenharia e pela Bolsa de Pesquisa de Pós-Doutorado da Fundação Wallenberg.