MaisConhecer - O MuZero da DeepMind conquista e aprende as regras enquanto faz

O MuZero da DeepMind conquista e aprende as regras enquanto faz

Albert Einstein disse uma vez:

Crédito: UnsplashÂ

Albert Einstein disse uma vez: "Vocaª tem que aprender as regras do jogo e, então, jogar melhor do que ninguanãm." Esse bem poderia ser o lema da DeepMind, já que um novo relatório revela que ela desenvolveu um programa que pode dominar jogos complexos sem nem mesmo conhecer as regras.

DeepMind, uma subsidia¡ria da Alphabet, já fez avanços inovadores usando o aprendizado de reforço para ensinar programas para dominar o jogo de tabuleiro chinaªs Go e o jogo de estratanãgia japonaªs Shogi, bem como xadrez e videogames desafiadores Atari. Em todos esses casos, os computadores receberam as regras do jogo.

Mas a Nature relatou hoje que o MuZero da DeepMind realizou as mesmas faznhas - e em alguns casos, superou os programas anteriores - sem primeiro aprender as regras.

Os programadores da DeepMind se baseavam em um princapio chamado "pesquisa antecipada". Com essa abordagem, MuZero avalia uma sanãrie de movimentos potenciais com base em como um oponente responderia. Embora provavelmente haja um número impressionante de movimentos potenciais em jogos complexos como o xadrez, MuZero prioriza as manobras mais relevantes e mais prova¡veis, aprendendo com as manobras bem-sucedidas e evitando aquelas que falharam.

Ao atuar contra Pac-Man da Atari, MuZero se restringiu a considerar apenas seis ou sete movimentos futuros em potencial, mas ainda assim teve um desempenho admira¡vel, de acordo com os pesquisadores.

"Pela primeira vez, temos realmente um sistema que écapaz de construir sua própria compreensão de como o mundo funciona e usar essa compreensão para fazer esse tipo de planejamento sofisticado que vocêviu anteriormente para jogos como o xadrez", disse o principal cientista pesquisador da DeepMind, David Silver. MuZero pode "comea§ar do nada, e apenas por tentativa e erro, descobrir as regras do mundo e usar essas regras para alcana§ar um tipo de desempenho sobre-humano."

Silver prevaª maiores aplicações para MuZero do que meros jogos. Progresso já foi feito na compressão de vadeo, uma tarefa desafiadora considerando o grande número de formatos de vadeo variados e vários modos de compressão. Atéagora, eles conseguiram uma melhoria de 5% na compressão, um feito nada pequeno para a empresa do Google, que também lida com o gigantesco cache de vadeos no segundo site mais popular do mundo, o YouTube, onde um bilha£o de horas de conteaºdo estãovisto diariamente. (O site nÂº 1? Google.)

Silver diz que o laboratório também estãoestudando programação de roba³tica e design de arquitetura de proteanas, que promete a produção personalizada de medicamentos.

a‰ um "avanço significativo", de acordo com Wendy Hall, professora de ciência da computação da Universidade de Southampton e membro do conselho de IA da Inglaterra. â€œOs resultados do trabalho da DeepMind são bastante surpreendentes e fico maravilhada com o que eles sera£o capazes de alcana§ar no futuro, dados os recursos de que dispaµemâ€, disse ela.

Mas ela também levantou uma preocupação sobre o potencial de abuso. "Minha preocupação éque, embora se esforcem constantemente para melhorar o desempenho de seus algoritmos e aplicar os resultados para o benefacio da sociedade, as equipes da DeepMind não estãocolocando tanto esfora§o em pensar nas possaveis consequaªncias não intencionais de seu trabalho", disse ela.

Na verdade, a Fora§a Aanãrea dos Estados Unidos aproveitou os primeiros documentos de pesquisa cobrindo o MuZero que foram divulgados no ano passado e usou as informações para projetar um sistema de IA que pudesse lana§ar masseis de um avia£o espia£o U-2 contra alvos específicos.

Quando questionado pela Wired sobre o que ele acha dessas aplicações militares, Silver não deixou daºvidas sobre suas preocupações.

"Eu me oponho ao uso de IA em qualquer arma mortal e gostaria que tivanãssemos feito mais progressos em direção ao banimento de armas auta´nomas letais", disse ele. Ele acrescentou que DeepMind e seus co-fundadores assinaram o Compromisso de Armas Auta´nomas Letais, que afirma a crena§a de que a tecnologia mortal deve sempre permanecer sob controle humano, e não algoritmos baseados em IA.

Silver diz que os desafios que temos pela frente são entender e implementar algoritmos tão eficazes e poderosos quanto o cérebro humano. "Devaamos ter como objetivo alcana§ar isso. O primeiro passo para fazer essa jornada étentar entender o que significa alcana§ar inteligaªncia", disse ele. "Achamos que isso realmente importa para enriquecer o que a IA pode realmente fazer porque o mundo éum lugar baguna§ado. a‰ desconhecido - ninguanãm nos da¡ este livro de regras incravel que diz: 'Oh, éexatamente assim que o mundo funciona'", disse Silver. "Se quisermos que nossa IA va¡ para o mundo e seja capaz de planejar e olhar para frente em problemas onde ninguanãm nos da¡ o livro de regras, realmente precisamos disso."

Tecnologia Científica