DeepMind es la empresa de inteligencia artificial de Alphabet, y es conocida por haber pulverizado a jugadores profesionales de StarCraft II, ganar al mejor jugador del mundo de Chess and Go o aprender a caminar por sí misma, entre otras cosas. De nuevo, esta IA vuelve a ser noticia ser la primera en ganar a un juego multijugador online, y explicarnos el procedimiento para haber logrado este objetivo.
A pesar de que este es un juego relativamente sencillo, guarda la peculiaridad de que es necesaria una buena compenetración en equipo, así como ser capaz de identificar correctamente cuándo atacar y defender. Tras esta victoria, DeepMind se convierte en la primera inteligencia artificial capaz de ganar en un juego multijugador online, algo que no se había logrado hasta la fecha.
Todo un logro para la inteligencia artificial en el juego cooperativo
Como leemos en New York Times, y tal y como aparece reflejado en un artículo publicado el pasado jueves en la revista Science, DeepMind ha sido capaz de ganar en Quake Arena III, mostrando en el proceso un comportamiento similar al de los humanos a la hora de unirse a jugadores reales y competir online, así como a la hora de jugar junto a agentes de inteligencia artificial que usaban el comentado algoritmo.
El artículo hace referencia al desempeño "a nivel humano" en juegos multijugador 3D, con el llamado aprendizaje de refuerzo basado en la población. La publicación destaca que las inteligencias artificiales están mejorando cada vez más a la hora de enfrentarse a otros jugadores, pero que la mayoría de entregas requieren de trabajo en equipo por parte de los mismos.
Del mismo modo, comentan que los sistemas de aprendizaje de refuerzo de extremo a extremo no habían tenido éxito hasta la fecha, por lo que fue todo un reto lograr que la IA utilizase estos métodos para jugar de forma colaborativa.
Cómo lo han logrado
El principal objetivo que se marcaron fue el de crear un algoritmo y un procedimiento para que la IA adquiriese habilidades acorde a la variabilidad de los mapas, cantidad de jugadores y los propios compañeros de equipo. ¿Los resultados? Una tasa de victoria frente a humanos del 80%.
Cada uno de estos agentes sigue un sistema de recompensas (por ejemplo, los puntos que da capturar una bandera), aprendiendo de esta forma a intentar la consecución de dicha recompensa, y aprendiendo por el camino que el resto de agentes o jugadores del equipo son elementos necesarios para lograr el objetivo final: encontrar una política que maximice las recompensas acumuladas.
Este tipo de aprendizaje, permite a estos agentes, además de trabajar junto a otros agentes, hacerlo junto a humanos, ya que el objetivo es el mismo. De esta forma, el algoritmo es capaz de ganar a humanos utilizando solo agentes, o haciendo que estos agentes jueguen junto a otros humanos.
Después de miles de horas de entrenamiento en distintos juegos, organizaron un torneo de evaluación, en los que la inteligencia artificial debía aliarse con humanos competir contra otros humanos, y los resultados fueron demoledores. El tiempo de reacción de la inteligencia artificial fue bastante superior, logrando identificar oponentes recién aparecidos en apenas 258ms, frente a los 559ms que tardaron los humanos... Del mismo modo, la precisión del algoritmo frente a los humanos fue de un 80% vs un 48%.
De nuevo, el mundo de la inteligencia artificial se apunta otro tanto en el juego contra humanos, mostrando que son capaces de resolver todo tipo de situaciones, incluso si lo hacen en conjunto con otros humanos (aunque el objetivo final sea derrotarles).
Vía | New York Times
Ver 1 comentarios