terça-feira, 19 de fevereiro de 2019

Programa de IA aprende a jogar vídeo game mais rápido e melhor


Programa de IA aprende a jogar vídeo game mais rápido e melhor
Programa de IA aprende a jogar vídeo game mais rápido e melhor

   Uma nova geração de algoritmos dominou os videogames Atari 10 vezes mais rápido que a IA de última geração, com uma abordagem inovadora para a resolução de problemas.

  Projetar IA que possa negociar problemas de planejamento, especialmente aqueles em que as recompensas não são imediatamente óbvias, é um dos desafios de pesquisa mais importantes no avanço do campo.

   Um famoso estudo de 2015 mostrou que o Google DeepMind AI aprendeu a jogar videogames Atari como o Video Pinball ao nível humano, mas notoriamente não conseguiu aprender o caminho para a primeira chave do videogame dos anos 1980, Montezuma's Revenge, devido à complexidade do jogo.

   No novo método desenvolvido na RMIT University em Melbourne, na Austrália, computadores montados para jogar autonomamente a vingança de Montezuma aprenderam com os erros e identificaram sub-objetivos 10 vezes mais rápidos que o Google DeepMind para finalizar o jogo.

   O professor associado Fabio Zambetta, da RMIT University, revela a nova abordagem nesta sexta-feira, na 33ª Conferência sobre Inteligência Artificial da AAAI, nos Estados Unidos.

   O método, desenvolvido em colaboração com o professor da RMIT, John Thangarajah e Michael Dann, combina aprendizado de reforço com uma abordagem de motivação intrínseca que recompensa a IA por ser curiosa e explorar seu ambiente.

  "AI verdadeiramente inteligente precisa ser capaz de aprender a completar tarefas de forma autônoma em ambientes ambíguos", diz Zambetta.

   "Mostramos que o tipo certo de algoritmo pode melhorar os resultados usando uma abordagem mais inteligente do que puramente bruta forçando um problema de ponta a ponta em computadores muito poderosos.

   "Nossos resultados mostram o quanto estamos mais perto de chegar à IA autônoma e pode ser uma linha chave de investigação se quisermos continuar a fazer progressos substanciais neste campo."

   O método de Zambetta recompensa o sistema por explorar autonomamente sub-objetivos úteis, tais como 'subir aquela escada' ou 'pular sobre aquele buraco', o que pode não ser óbvio para um computador, dentro do contexto de completar uma missão maior.

   Outros sistemas de última geração exigiram a entrada humana para identificar esses sub-objetivos ou então decidiram o que fazer em seguida, aleatoriamente.

   "Nossos algoritmos não apenas identificaram autonomamente tarefas relevantes cerca de 10 vezes mais rápido do que o Google DeepMind enquanto jogavam a Vingança de Montezuma, mas também exibiam um comportamento relativamente humano ao fazê-lo", diz Zambetta.

   "Por exemplo, antes de chegar à segunda tela do jogo, você precisa identificar subtarefas, como subir escadas, pular sobre um inimigo e, finalmente, pegar uma chave, aproximadamente nessa ordem.

   "Isso acabaria acontecendo aleatoriamente depois de uma enorme quantidade de tempo, mas para acontecer tão naturalmente em nossos testes mostra algum tipo de intenção.

  "Isso faz com que o nosso primeiro agente totalmente autônomo voltado para objetivos seja verdadeiramente competitivo com agentes de ponta nesses jogos."

   Zambetta disse que o sistema funcionará fora dos videogames em uma ampla gama de tarefas, quando abastecido com entradas visuais cruas.

   "Criar um algoritmo que possa completar videogames pode parecer trivial, mas o fato de termos projetado um que possa lidar com a ambiguidade enquanto escolhe um número arbitrário de ações possíveis é um avanço crítico.

   "Isso significa que, com o tempo, essa tecnologia será valiosa para atingir objetivos no mundo real, seja em carros autônomos ou como assistentes robóticos úteis com reconhecimento de linguagem natural", diz ele.

   O trabalho "Derivando Sub-objetivos Autonomamente para Acelerar a Aprendizagem em Domínios de Recompensa Esparsos" (lido acima) será apresentado na 33ª Conferência de Inteligência Artificial da AAAI em Honolulu, Havaí, em 1º de fevereiro de 2019.


Artigo:


Materiais fornecidos pela RMIT University ao site Science Daily.


Fonte:

www.sciencedaily.com


Nenhum comentário:

Postar um comentário