Ajedrez: ¿Quién ganará si dos computadoras entrenadas de manera idéntica juegan una contra la otra? ¿Será un empate? ¿O ganará el que comienza primero? ¿O la serie de pérdidas / victorias será completamente al azar?

Asumiré que cuando dices “entrenado de manera idéntica” te refieres a “tener el mismo algoritmo”. En este caso, todo depende de cuál sea ese algoritmo.

Supongamos que ambas computadoras están programadas con la estrategia de ajedrez óptima (no sabemos qué es esto en este momento, pero dicho algoritmo existe teóricamente). El ajedrez es un juego empatado (lo que significa que si ambos jugadores juegan de manera óptima, cada jugador puede forzar un empate), una victoria blanca o una victoria negra (una vez más, no sabemos cuál es la respuesta, pero el ajedrez tiene que ser uno de estos). Sea lo que sea, ese será el resultado cuando dos computadoras que juegan de manera óptima juegan una contra la otra.

Ahora supongamos que ambas computadoras están programadas con la misma estrategia determinista * subóptima. Entonces el resultado solo depende de la estrategia, pero sea cual sea el resultado, ese será el resultado cada vez.

Finalmente, si las computadoras se programan con la misma estrategia aleatorizada * , incluso el resultado puede diferir de un juego a otro, dependiendo de la aleatoriedad interna que impulsa las decisiones de las computadoras.

* Una estrategia determinista es aquella en la que el jugador realiza un movimiento que depende solo del estado del tablero (por ejemplo, si las piezas están en estos lugares, mueva la pieza X al cuadrado A). Una estrategia aleatorizada es aquella en la que el jugador también puede lanzar algunas monedas aleatorias internas para ayudarlo a tomar una decisión (por ejemplo, si las piezas están en estos lugares, lanza una moneda … si sale cara, mueve la pieza X al cuadrado A; si colas, mueva la pieza Y al cuadrado B). Un ejemplo más simple es el juego de piedra, papel o tijera, un juego de 1 movimiento. Un ejemplo de una estrategia determinista es “jugar rock”, mientras que un ejemplo de una estrategia aleatoria es “jugar rock con probabilidad 1/3, jugar papel con probabilidad 1/3, jugar tijeras con probabilidad 1/3”.

Esto sucede todo el tiempo, a medida que se prueban los programas de ajedrez. También se realiza como una técnica de análisis por parte de jugadores humanos, para investigar posibles continuaciones desde una posición determinada, por ejemplo, jugar el resto del juego con la computadora en sí.

Si juegas una larga serie de juegos desde la posición inicial, obtendrás una distribución de resultados. Esto no es del todo igual. Habrá una ligera ventaja de primer movimiento para el jugador con las piezas blancas.

Nota: Puede pensar que los juegos que se juegan con algoritmos idénticos serían simétricos y todos terminarían en empate. Pero no es así como funciona el ajedrez. Cuando se realiza una verificación, no se puede responder con un movimiento idéntico. Esto fuerza una asimetría.

Otro factor a considerar es el “libro” de apertura utilizado por el programa. Estos son los posibles movimientos de apertura predefinidos que la computadora jugará automáticamente. Estas aberturas generalmente están diseñadas para crear posiciones desequilibradas.

Tenga en cuenta que un juego de ajedrez con un control de tiempo crea una restricción sobre qué tan profundo mirar hacia adelante y evaluar las posiciones con una función heurística. Digamos, por ejemplo, que las circunstancias conducen a un motor que mira hacia adelante 10 capas. Entonces, incluso un motor que juegue contra sí mismo evaluará las posiciones de manera diferente porque, por ejemplo, está jugando contra las blancas y elige un movimiento basado en la anticipación de 10 capas. Cuando es negro, también mira hacia adelante 10 capas, pero esto significa 1 más que como blanco, por lo que tiene más información. Mientras tanto, la elección de apertura suele ser aleatoria, y eso puede hacer una diferencia considerable si se alcanza una posición donde 1 capa adicional de anticipación cambia el curso del juego. Tantos resultados son posibles.

Estaba a punto de responder esto cuando apareció la respuesta de Alan y estoy totalmente de acuerdo con él.

La idea básica es que en esta situación la computadora está jugando contra sí misma (ya que ambas están programadas de manera idéntica), sin embargo, la computadora no es consciente de que está jugando contra sí misma. Un algoritmo aleatorio dará cualquiera de los resultados posibles y un algoritmo determinista finalmente terminará en empate.

Una cosa a tener en cuenta es que los juegos en los que el jugador que comienza los movimientos tiene una ventaja conducirá a ese jugador a ganar.

El que es más rápido (en términos de especificaciones de hardware) o si tienen especificaciones similares, el que comienza como blanco tiene una ventaja.

Ventaja de primer movimiento en ajedrez

Depende de la fuerza de los programas de ajedrez y el control del tiempo.

Los movimientos de los programas de ajedrez no son completamente deterministas. Depende de la cantidad de tiempo utilizado para analizar. En la misma situación, un mismo programa podría sorprenderse al usar más tiempo. Por lo tanto, el programa puede ganar contra sí mismo.

Más control de tiempo y más la fuerza del programa más será la tasa de extracción.

Lo más probable es un juego de sorteo. O eso espero, (no me gustaría que el ajedrez sea el que abre el juego gana “tipo de juego). Además, no creo que haya demasiado espacio para la aleatoriedad en el ajedrez, un jugador elige un movimiento en términos de un el plan que tiene. La verdad es que las máquinas todavía no trazan planes (hasta donde yo sé). Pero de todos modos el ajedrez es un juego lógico. Eso no descarta completamente la aleatoriedad, pero idealmente el ajedrez se resolverá cuando una máquina pueda analizar cada movimiento posible (secuencia de movimientos) y su resultado. Esos movimientos son más posibles que los átomos en el universo, blablabla … Hoy en día creo que las máquinas de ajedrez no recurrirán a la aleatoriedad, sino que verificarán sus bases de datos y elegirán “la mayoría movimiento ganador “en una posición similar en términos de estadísticas. Lo cual es aleatorio pero al final es sobre qué bases de datos están usando (lo mismo) para que estén copiando humanos …

¡La computadora que juega blanco siempre gana!