¿Ya es posible aprender las reglas de un juego como Monopoly utilizando un aprendizaje no supervisado?

Sí, esto ya es posible.

Un juego de Monopoly puede verse como un conjunto de elecciones secuenciales hechas por un grupo de jugadores. Estas opciones tienen un componente probabilístico y determinista, donde, por ejemplo, la estrategia y la tirada de dados de un jugador son aleatorias (probabilísticas) y todos los jugadores deben seguir las reglas del juego (deterministas).

Para tomar esto como un problema de aprendizaje, se puede suponer que el monopolio es una instancia (aún desconocida) de un autómata finito determinista probabilístico (PDFA) [1]. El problema no supervisado aquí es aprender el Monopoly PDFA del conjunto de elecciones secuenciales de jugadores realizadas en uno o más juegos. Una vez aprendido, el PDFA expresa las reglas de un juego exactamente como (o al menos típicamente como) Monopoly.

Para obtener más información, consulte Clark y Thollard [2], donde muestran que los PDFA son aptos para PAC y un maravilloso Ph.D. tesis de Balle Pigem [3] que destaca técnicas de aprendizaje PDFA eficientes (incluidas las basadas en streaming).

[1] MO Rabin. Autómatas probabilísticos. Información y control, 6 (3): 230–245, 1963
[2] Página en jmlr.org
[3] Página en upc.edu

Los chicos de DeepMind (ahora adquiridos por Google) hacen que las computadoras aprendan a jugar viejos videojuegos arcade de Atari con solo mirar la pantalla y operar los controles, sin ninguna otra entrada / instrucción. Sin embargo, admiten tener problemas con los juegos que implican más pensamiento estratégico.