Akasha Imaging, um spinout do MIT Media Lab, fornece imagens eficientes e econa´micas com deteca§a£o de recursos de alta resolua§a£o, rastreamento e orientaa§a£o de pose.

Os robôs são a principal aplicação e foco atual do Akasha ClearSight Deep Imaging System. No futuro, podera¡ ser para sistemas de embalagem e navegação. A empresa nasceu do MIT Media Lab. Foto cortesia de Akasha Imaging.
A automação existe desde a Granãcia antiga. Sua forma muda, mas a intenção de fazer com que a tecnologia assuma tarefas repetitivas permaneceu consistente, e um elemento fundamental para o sucesso tem sido a capacidade de imagem. A última iteração são os robôs, e o problema com a maioria deles na automação industrial éque eles trabalham em ambientes baseados em acessórios projetados especificamente para eles. Tudo bem se nada mudar, mas as coisas inevitavelmente mudam. O que os robôs precisam ser capazes, o que eles não são, ése adaptar rapidamente, ver objetos com precisão e coloca¡-los na orientação correta para permitir operações como montagem e embalagem auta´nomas.
A Akasha Imaging estãotentando mudar isso. A startup da Califórnia com raazes no MIT usa imagens passivas, modalidades e espectros variados, combinados com aprendizado profundo, para fornecer detecção de recursos de alta resolução, rastreamento e orientação de pose de maneira mais eficiente e econa´mica. Os robôs são a principal aplicação e foco atual. No futuro, podera¡ ser para sistemas de embalagem e navegação. Esses são secunda¡rios, diz Kartik Venkataraman, CEO da Akasha, mas como a adaptação seria manima, fala do potencial geral do que a empresa estãodesenvolvendo. “Essa éa parte empolgante do que essa tecnologia écapazâ€, diz ele.
Fora do laboratório
Iniciado em 2019, Venkataraman fundou a empresa com o Professor Associado do MIT Ramesh Raskar e Achuta Kadambi PhD '18. Raskar émembro do corpo docente do MIT Media Lab, enquanto Kadambi éum ex-aluno de pós-graduação do Media Lab, cuja pesquisa enquanto trabalhava em seu doutorado se tornaria a base para a tecnologia da Akasha.
Os sãocios viram uma oportunidade com a automação industrial, que, por sua vez, ajudou a dar nome a empresa. Akasha significa “a base e a essaªncia de todas as coisas no mundo materialâ€, e éesse ilimitado que inspira um novo tipo de imagem e aprendizado profundo, diz Venkataraman. Refere-se especificamente a estimativa da orientação e localização dos objetos. Os sistemas de visão tradicionais de lidar e lasers projetam vários comprimentos de onda de luz em umasuperfÍcie e detectam o tempo que leva para a luz atingir asuperfÍcie e retornar para determinar sua localização.
Existem limitações com esses manãtodos. Quanto mais distante um sistema precisar estar, mais energia seránecessa¡ria para a iluminação; para uma resolução mais alta, mais luz projetada. Além disso, a precisão com que o tempo decorrido édetectado depende da velocidade dos circuitos eletra´nicos, e háuma limitação baseada na física em torno disso. Os executivos da empresa são continuamente forçados a tomar uma decisão sobre o que émais importante entre resolução, custo e poder. “a‰ sempre uma trocaâ€, diz ele.
E a própria luz projetada apresenta desafios. Com objetos brilhantes de pla¡stico ou metal, a luz érefletida e a refletividade interfere na iluminação e na precisão das leituras. Com objetos transparentes e embalagens transparentes, a luz passa e o sistema fornece uma imagem do que estãopor trás do alvo pretendido. E com objetos escuros, hápouca ou nenhuma reflexa£o, dificultando a detecção, e muito menos fornecendo qualquer detalhe.
Colocando em uso
Um dos focos da empresa éaprimorar a roba³tica. Tal como nos armazanãns, os robôs auxiliam na fabricação, mas os materiais apresentam os desafios a³pticos mencionados acima. Os objetos também podem ser pequenos, onde, por exemplo, uma mola de 5-6 milametros de comprimento precisa ser pega e enroscada em um eixo de 2 mm de largura. Os operadores humanos podem compensar as imprecisaµes porque podem tocar as coisas, mas, como os robôs não tem feedback ta¡til, sua visão precisa ser precisa. Se não for, qualquer pequeno desvio pode resultar em um bloqueio onde uma pessoa tem que intervir. Além disso, se o sistema de imagem não for confia¡vel e preciso em mais de 90% do tempo, a empresa estãocriando mais problemas do que resolvendo e perdendo dinheiro, diz ele.
Outro potencial émelhorar os sistemas de navegação automotiva. Lidar, uma tecnologia atual, pode detectar que háum objeto na estrada, mas não pode necessariamente dizer qual éo objeto, e essa informação émuitas vezes útil, “em alguns casos vitalâ€, diz Venkataraman.
Em ambos os reinos, a tecnologia de Akasha oferece mais. Em uma estrada ou rodovia, o sistema pode captar a textura de um material e ser capaz de identificar se o que estãose aproximando éum buraco, um animal ou uma barreira de trabalho na estrada. No ambiente não estruturado de uma fa¡brica ou armazanãm, ele pode ajudar um roba´ a pegar e colocar essa mola no poa§o ou ser capaz de mover objetos de um recipiente transparente para outro. Em última análise, significa um aumento na sua mobilização.
Com robôs em automação de montagem, um obsta¡culo persistente éque a maioria não possui nenhum sistema visual. Eles são são capazes de encontrar um objeto porque éfixo e estãoprogramados para onde ir. “Funciona, mas émuito inflexavelâ€, diz ele. Quando novos produtos chegam ou um processo muda, os acessórios também precisam mudar. Requer tempo, dinheiro e intervenção humana, e resulta em uma perda geral de produtividade.
Além de não terem a capacidade de ver e entender essencialmente, os robôs não tem a coordenação olho-ma£o inata que os humanos tem. “Eles não conseguem entender a desordem do mundo no dia-a-diaâ€, diz Venkataraman, mas, acrescenta, “com nossa tecnologia, acho que isso comea§ara¡ a acontecerâ€.
Como acontece com a maioria das novas empresas, o pra³ximo passo étestar a robustez e a confiabilidade em ambientes do mundo real atéo “navel submilimanãtrico†de precisão, diz ele. Depois disso, os pra³ximos cinco anos devem ver uma expansão para várias aplicações industriais. a‰ praticamente impossível prever quais, mas émais fa¡cil ver os benefacios universais. “No longo prazo, veremos essa visão aprimorada como um facilitador para inteligaªncia e aprendizado aprimoradosâ€, diz Venkataraman. “Por sua vez, permitira¡ a automação de tarefas mais complexas do que era possível atéagora.â€