A Coactive, fundada por dois ex-alunos do MIT, criou uma plataforma alimentada por IA para gerar novos insights a partir de conteúdo de todos os tipos.

A Coactive, fundada por Cody Coleman, MEng e William Gaviria Rojas , construiu uma plataforma alimentada por IA para gerar novos insights a partir de conteúdo de todos os tipos, incluindo vídeo. Crédito: Cortesia da Coactive AI; MIT News
Os dados devem nortear todas as decisões de uma empresa moderna. Mas a maioria das empresas tem um enorme ponto cego: elas não sabem o que está acontecendo com seus dados visuais.
A Coactive está trabalhando para mudar isso. A empresa, fundada por Cody Coleman (turma de 2013), MEng (turma de 2015) e William Gaviria Rojas (turma de 2013), criou uma plataforma com inteligência artificial que pode interpretar dados como imagens, áudio e vídeo para gerar novos insights.
A plataforma da Coactive pode pesquisar, organizar e analisar instantaneamente conteúdo visual não estruturado para ajudar empresas a tomar decisões melhores e mais rápidas.
“Na primeira revolução do big data, as empresas aprimoraram sua capacidade de extrair valor de seus dados estruturados”, diz Coleman, referindo-se a dados de tabelas e planilhas. “Mas agora, aproximadamente 80% a 90% dos dados no mundo não são estruturados. No próximo capítulo do big data, as empresas terão que processar dados como imagens, vídeos e áudios em escala, e a IA é uma peça fundamental para desbloquear essa capacidade.”
A Coactive já está trabalhando com diversas grandes empresas de mídia e varejo para ajudá-las a entender seu conteúdo visual sem depender de classificação e marcação manuais. Isso as ajuda a entregar o conteúdo certo aos usuários com mais rapidez, remover conteúdo explícito de suas plataformas e descobrir como um conteúdo específico influencia o comportamento do usuário.
De forma mais ampla, os fundadores acreditam que a Coactive serve como um exemplo de como a IA pode capacitar os humanos a trabalhar de forma mais eficiente e resolver novos problemas.
“A palavra coativo significa trabalhar em conjunto simultaneamente, e essa é a nossa grande visão: ajudar humanos e máquinas a trabalharem juntos”, diz Coleman. “Acreditamos que a visão é mais importante agora do que nunca, porque a IA pode nos separar ou nos unir. Queremos que o Coativo seja um agente que nos una e dê aos seres humanos um novo conjunto de superpoderes.”
Dando visão aos computadores
Coleman conheceu Gaviria Rojas no verão anterior ao primeiro ano de faculdade, por meio do programa Interphase Edge do MIT. Ambos se formariam em engenharia elétrica e ciência da computação e trabalhariam para levar o conteúdo do MIT OpenCourseWare para universidades mexicanas, entre outros projetos.
“Aquele foi um ótimo exemplo de empreendedorismo”, lembra Coleman sobre o projeto OpenCourseWare. “Foi realmente gratificante ser responsável pelos negócios e pelo desenvolvimento do software. Isso me levou a abrir meus próprios pequenos negócios de desenvolvimento web e a fazer o curso Founder's Journey [do MIT].”
Coleman explorou pela primeira vez o poder da IA no MIT enquanto trabalhava como pesquisador de pós-graduação no Office of Digital Learning (agora MIT Open Learning), onde usou o aprendizado de máquina para estudar como os humanos aprendem no MITx, que hospeda cursos on-line abertos e massivos criados por professores e instrutores do MIT.
“Foi realmente incrível para mim que fosse possível democratizar essa jornada transformacional que vivi no MIT com o aprendizado digital — e que fosse possível aplicar IA e aprendizado de máquina para criar sistemas adaptativos que não apenas nos ajudam a entender como os humanos aprendem, mas também proporcionam experiências de aprendizagem mais personalizadas para pessoas ao redor do mundo”, diz Coleman sobre o MITx. “Essa também foi a primeira vez que pude explorar conteúdo em vídeo e aplicar IA a ele.”
Após o MIT, Coleman foi para a Universidade Stanford para seu doutorado, onde trabalhou para reduzir as barreiras ao uso da IA. A pesquisa o levou a trabalhar com empresas como Pinterest e Meta em aplicações de IA e aprendizado de máquina.
“Foi aí que consegui vislumbrar o futuro do que as pessoas queriam fazer com a IA e seu conteúdo”, lembra Coleman. “Eu estava vendo como empresas líderes estavam usando a IA para gerar valor comercial, e foi daí que surgiu a centelha inicial para a Coactive. Pensei: 'E se criarmos um sistema operacional de nível empresarial para conteúdo e IA multimodal para facilitar isso?'”
Enquanto isso, Gaviria Rojas mudou-se para a Bay Area em 2020 e começou a trabalhar como cientista de dados no eBay. Como parte da mudança, ele precisava de ajuda para transportar seu sofá, e Coleman foi o amigo sortudo para quem ele ligou.
“Durante a viagem de carro, percebemos que ambos víamos uma explosão acontecendo em torno de dados e IA”, diz Gaviria Rojas. “No MIT, tivemos um lugar privilegiado na revolução do big data e vimos pessoas inventando tecnologias para extrair valor desses dados em escala. Cody e eu percebemos que tínhamos outro barril de pólvora prestes a explodir, com empresas coletando enormes quantidades de dados, mas desta vez eram dados multimodais, como imagens, vídeo, áudio e texto. Faltava uma tecnologia para desbloqueá-los em escala. Essa tecnologia era a IA.”
A plataforma que os fundadores criaram — o que Coleman descreve como um "sistema operacional de IA" — é independente de modelo, o que significa que a empresa pode substituir os sistemas de IA subjacentes à medida que os modelos continuam a melhorar. A plataforma da Coactive inclui aplicativos pré-desenvolvidos que os clientes empresariais podem usar para realizar ações como pesquisar conteúdo, gerar metadados e realizar análises para extrair insights.
“Antes da IA, os computadores viam o mundo por meio de bytes, enquanto os humanos viam o mundo por meio da visão”, diz Coleman. “Agora, com a IA, as máquinas finalmente conseguem ver o mundo como nós, e isso fará com que os mundos digital e físico se misturem.”
Melhorando a interface homem-computador
O banco de dados de imagens da Reuters fornece milhões de fotos a jornalistas do mundo todo. Antes da Coactive, a empresa dependia de repórteres inserindo manualmente tags em cada foto para que as imagens corretas fossem exibidas quando os jornalistas pesquisassem por determinados assuntos.
“Era incrivelmente lento e caro analisar todos esses ativos brutos, então as pessoas simplesmente não adicionavam tags”, diz Coleman. “Isso significava que, quando você buscava algo, os resultados eram limitados, mesmo que houvesse fotos relevantes no banco de dados.”
Agora, quando jornalistas no site da Reuters selecionam "Ativar pesquisa de IA", a Coactive pode extrair conteúdo relevante com base na compreensão dos detalhes de cada imagem e vídeo pelo seu sistema de IA.
“Isso está melhorando muito a qualidade dos resultados para os repórteres, o que lhes permite contar histórias melhores e mais precisas do que nunca”, diz Coleman.
A Reuters não está sozinha na luta para gerenciar todo o seu conteúdo. A gestão de ativos digitais é um componente importante de muitas empresas de mídia e varejo, que hoje frequentemente dependem de metadados inseridos manualmente para classificar e pesquisar esse conteúdo.
Outro cliente da Coactive é o Fandom, uma das maiores plataformas do mundo para informações sobre programas de TV, videogames e filmes, com mais de 300 milhões de usuários ativos por mês. O Fandom está usando o Coactive para entender dados visuais em suas comunidades online e ajudar a remover conteúdo sexual e gore excessivo.
“Antes, o Fandom levava de 24 a 48 horas para revisar cada novo conteúdo”, diz Coleman. “Agora, com o Coactive, eles codificaram as diretrizes da comunidade e conseguem gerar informações mais detalhadas em uma média de cerca de 500 milissegundos.”
Em cada caso de uso, os fundadores veem a Coactive como uma forma de possibilitar um novo paradigma nas formas como os humanos trabalham com máquinas.
“Ao longo da história da interação humano-computador, tivemos que nos curvar sobre um teclado e um mouse para inserir informações de uma forma que as máquinas pudessem entender”, diz Coleman. “Agora, pela primeira vez, podemos simplesmente falar naturalmente, podemos compartilhar imagens e vídeos com a IA, e ela consegue entender esse conteúdo. Essa é uma mudança fundamental na maneira como pensamos sobre as interações humano-computador. A visão central da Coactive é que, por causa dessa mudança, precisamos de um novo sistema operacional e de uma nova maneira de trabalhar com conteúdo e IA.”