Go (juego de mesa): ¿Puede una IA adaptarse orgánicamente para jugar contra el jugador humano en un nivel casi uniforme en Go?

Podríamos imaginar la creación de tales sistemas, pero no se requieren las palabras “adaptarse orgánicamente” con un sentido del tiempo real. Alphago se basa en parte en el algoritmo líder anterior, monte carlo. Los métodos de Monte Carlo juegan muchos juegos posibles para estimar la probabilidad de que futuras variaciones legales / razonables resulten ganadoras. (Alphago también entrena jugando muchos millones de juegos consigo mismo durante, tal vez, meses). Un efecto secundario de maximizar esa probabilidad es que la máquina juega suavemente cuando está adelante, simplificando y satisfecha con una victoria de punta muy estrecha. Cuando están ligeramente por detrás, estos agentes son potencialmente propensos a ser un poco tontos. Entonces, actualmente para Go, falta una pieza de control si queremos un oponente que oscile en un nivel más o menos uniforme con un humano dado. No sé si tales métodos se han desarrollado en otros lugares. El software de enseñanza de ajedrez sería un obvio mercado / campo de prueba si lo hubiera hecho. En el ajedrez, es mucho más posible crear una función de evaluación que describa incluso las posiciones con parámetros que un estilo de juego podría afectar.

En Go no hay necesidad de hacer esto debido a un sistema llamado piedras de discapacidad. Los hándicaps de go te permiten ajustar las diferencias de fuerza entre los jugadores sin obligar al jugador más fuerte a ser deshonesto, es decir, jugar por debajo de toda la fuerza. Esto se alinea con la traducción al inglés del término japonés utilizado por la mayoría de los maestros de Go. En los rangos y clasificaciones de Go, si yo como jugador de 10 kyu jugara un jugador de 1 kyu, tendría una desventaja de 9 piedras.

Sí, cambiar el objetivo del algoritmo de aprendizaje de refuerzo. En lugar de estar entrenado para elegir el movimiento con la mayor probabilidad de vencer al oponente, elija el movimiento que resulte en la configuración del tablero más cercana a 50/50 donde ambos lados parecen tener la misma probabilidad de ganar.

La respuesta a esto se determina si está utilizando el término AI para hacer referencia a un sistema preprogramado diseñado para responder de memoria a sus movimientos, o si se refiere a una inteligencia artificial VERDADERA; por ejemplo, un programa capaz de aprender.

En el caso de los primeros, absolutamente no. Dichos sistemas son puramente reactivos, incluidos los sistemas utilizados en los videojuegos modernos a pesar de lo avanzados que puedan parecer.

En el caso de este último, absolutamente. Una IA adecuada aprenderá tanto como un humano. Como tal, puede crecer y adaptarse a medida que juega contra una persona determinada.

No estamos seguros de lo orgánico, pero a menudo entrenamos IA de dos maneras para mejorar el rendimiento contra los humanos.

El primero es darles tantos datos sobre cómo juegan los humanos. Juegos pasados, por ejemplo.

Otra es jugar la IA contra otras IAs tal vez copias de sí mismo.
Este puede ser un enfoque muy poderoso dada la velocidad a la que puede jugar.

More Interesting

Si los humanos se vuelven irrelevantes debido a la aparición de la Inteligencia Artificial y los robots, ¿estarán en desventaja las naciones superpobladas?

¿Es la computadora neuronal diferencial (DNC) el último modelo de computación hacia la inteligencia general artificial?

Si la hipótesis de la singularidad es correcta, ¿cuál sería el propósito de la IA súper inteligente y qué podría lograr?

¿Sería tan grande la demanda de inteligencia artificial que cuando desarrolle existencias se disparará?

¿Qué haríamos si desarrollamos una IA que se sabe que es más inteligente que nosotros y que tomó decisiones de vida radicalmente diferentes a las de cualquier humano?

¿Cuáles son algunos usos creativos para la IA?

¿Cuál es la mejor IA de hoy en día?

¿Por qué la gente está preocupada por la IA cuando la IA probablemente no tendría sentimientos?

¿Qué podríamos hacer si se llevara a cabo una toma de control de IA?

¿Cuál es la diferencia básica entre API.ai, wit.ai, IBM Watson y Luis.ai?

¿Qué tan pronto la inteligencia artificial comenzará a reemplazar trabajos masivamente?

¿Cuáles son las mejores acciones para invertir para capitalizar el aumento de la inteligencia artificial?

¿La inteligencia artificial conducirá al verdadero socialismo?

¿Cuáles son algunos ejemplos del mal uso de la IA en el futuro, que pueden dañar a la humanidad y, por lo tanto, son una amenaza potencial para nosotros?

¿Qué es la inteligencia artificial y cómo es útil?