Deepmind muestra un algoritmo de aprendizaje unificado para juegos

A帽adir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuaci贸n0

2023-11-23 14:11:27

El nuevo sistema de IA de Deepmind juega a juegos de mesa como el ajedrez y el go, pero tambi茅n hace limpieza en la mesa de p贸quer. Por qu茅 es un verdadero reto.

Google Deepmind tiene un largo historial en el desarrollo de sistemas de IA para juegos de mesa y videojuegos. Deepmind salt贸 a la fama por primera vez con una inteligencia artificial que dominaba una serie de juegos de Atari mediante aprendizaje por refuerzo profundo.

Desde entonces, los sistemas de IA de Deepmind han derrotado a un campe贸n del mundo de Go con AlphaGo, han vencido a sus propios predecesores con AlphaGo Zero y AlphaZero, han vencido a profesionales del juego con AlphaStar y han introducido un modelo de IA que aprende reglas de juego por s铆 solo con MuZero.

La investigaci贸n de Deepmind para juegos de mesa y videojuegos es una investigaci贸n fundamental que puede aplicarse potencialmente a otras aplicaciones de IA econ贸micamente atractivas.

Estudiante de juegos: de especialista a multitalento

Los juegos pueden dividirse a grandes rasgos en dos categor铆as: Los que revelan toda la informaci贸n, como la posici贸n de las piezas, y los que ocultan informaci贸n, como las cartas de otros jugadores.

Los juegos de informaci贸n perfecta son la especialidad de AlphaZero. El sistema puede jugar a todo tipo de juegos de mesa, como el ajedrez o el Go, a un nivel sobrehumano. Los sistemas de IA para juegos con informaci贸n imperfecta, como el p贸quer, tambi茅n rinden ahora a un alto nivel: en 2016, la IA de p贸quer DeepStack venci贸 a profesionales humanos. A mediados de 2019, Facebook demostr贸 una IA de p贸quer capaz de vencer a cinco jugadores simult谩neamente en un torneo.

Pero: AlphaZero no juega al p贸quer, DeepStack no juega al ajedrez: los sistemas son especialistas.

El 煤ltimo sistema de inteligencia artificial de Deepmind, Student of Games (SoG), est谩 cambiando todo esto. Combina la b煤squeda guiada,
aprendizaje autom谩tico y razonamiento te贸rico de juegos.

Seg煤n el art铆culo publicado en Science, SoG es el 芦primer algoritmo que logra un s贸lido rendimiento emp铆rico en grandes juegos de informaci贸n perfecta e imperfecta, un paso importante hacia algoritmos verdaderamente generales para entornos arbitrarios禄.

Student of Games unifica enfoques anteriores

La receta del 茅xito de AlphaZero consisti贸 en conocer las reglas del juego y, a continuaci贸n, utilizar un algoritmo de b煤squeda para jugar innumerables partidas contra s铆 mismo. Para el algoritmo de b煤squeda, el sistema de IA se basa en la b煤squeda profunda de 谩rboles de decisi贸n, m谩s concretamente en MCTS (Monte Carlo Tree Search). Sin embargo, este m茅todo no es adecuado para juegos con informaci贸n incompleta, en los que las consideraciones te贸ricas del juego, como ocultar las propias intenciones, son esenciales.

Para SoG, Deepmind cambia el algoritmo de b煤squeda: SoG comienza con un simple 谩rbol de decisi贸n de posibles estrategias y juega contra s铆 mismo. Despu茅s de cada partida, el sistema analiza c贸mo una decisi贸n diferente en cada situaci贸n habr铆a cambiado el resultado de la partida. Con este m茅todo de aprendizaje contrafactual -denominado minimizaci贸n del arrepentimiento contrafactual en 谩rbol creciente (GT-CFR)-, el 谩rbol de decisi贸n crece a lo largo del entrenamiento.

El entrenamiento permite a SoG jugar al ajedrez, al go, al p贸quer y a Scotland Yard. Deepmind prob贸 el sistema de IA contra diversos bots, como AlphaZero, GnuGo, Stockfish y Slumbot. En p贸quer y Scotland Yard, SoG gan贸 la mayor铆a de las partidas. En Ajedrez y Go, SoG perdi贸 el 99,5% de las partidas contra AlphaZero. No obstante, el sistema juega a un nivel muy alto de aficionado, dice Deepmind.

Los investigadores sugieren que es posible introducir nuevas mejoras y quieren averiguar si se puede conseguir un rendimiento similar con muchos menos recursos inform谩ticos.

Una primera versi贸n del trabajo se public贸 en Arxiv en 2021, por aquel entonces el sistema se llamaba Jugador de Juegos.

Deja una opini贸n

Deje una respuesta

馃 AI MAFIA
Logo