¿Qué impide que un sistema de aprendizaje automático aprenda su propia salida de jugar contra sí mismo y llegar muy por delante de otros motores de ajedrez?

De hecho, Matthew Lai, que ahora forma parte de Google DeepMind, y probablemente participó en el proyecto AlphaGo, hizo exactamente eso para su tesis de maestría:

http://arxiv.org/pdf/1509.01549v…

Sin embargo, la forma en que se plantea la pregunta anterior hace que parezca algo trivial. En juegos con grandes espacios de configuración, puede ser imposible simular e iterar sobre todas las configuraciones posibles en un tiempo finito / razonable incluso con grandes grupos de computadoras. Además, diseñar una arquitectura de modelo (aprendizaje automático) que pueda abstraerse del estado exacto del tablero y aprender algunas “ideas” generalmente aplicables puede ser muy desafiante, a diferencia de una memoria asociativa que solo recupera un tablero visto anteriormente. estado. No se puede lograr tal generalización con un algoritmo de aprendizaje de recuadro negro.

Incluso Alpha-Go no solo utiliza el aprendizaje automático: funciona combinando la búsqueda de árbol de fuerza bruta con una aproximación basada en el aprendizaje automático (altamente diseñada) que adivina más allá de las profundidades de los árboles que no son factibles de búsqueda.