Sí, recientemente se ha trabajado en esto con redes neuronales. Ver enlaces a Jirafa a continuación. Del resumen en papel:
Dada cualquier posición, este sistema estima la probabilidad de que cada uno de los movimientos sea el mejor movimiento sin mirar hacia adelante. El sistema es altamente efectivo: el mejor movimiento real se encuentra dentro de los 3 movimientos mejor clasificados el 70% del tiempo, de un promedio de aproximadamente 35 movimientos legales desde cada posición.
Desafortunadamente, no veo ningún resultado en el documento sobre lo que sucede si el sistema se usa para jugar simplemente seleccionando el movimiento superior de la red neuronal. En cambio, conectan este sistema a una búsqueda de árbol “con probabilidad limitada” (aún muy interesante) y construyen una máquina de fuerza IM.
- ¿Cuáles son algunos problemas de aprendizaje automático que se resolvieron con soluciones generativas en lugar de soluciones discriminatorias?
- ¿Cuáles son los casos de uso que aprovechan la tecnología Big data y Blockchain en los servicios financieros?
- ¿Debo aprender R y Python para Data Science y luego dominar uno de ellos?
- ¿Cuál es el plan de curso que debo tomar del estilo de datos?
- ¿Cuál es la diferencia entre los términos 'aprendizaje automático', 'aprendizaje profundo' e 'IA'?
Noticia:
Deep Learning Machine se enseña ajedrez en 72 horas, juega a nivel internacional
Papel Arxiv:
Usando Aprendizaje de refuerzo profundo para jugar ajedrez