Podríamos imaginar la creación de tales sistemas, pero no se requieren las palabras “adaptarse orgánicamente” con un sentido del tiempo real. Alphago se basa en parte en el algoritmo líder anterior, monte carlo. Los métodos de Monte Carlo juegan muchos juegos posibles para estimar la probabilidad de que futuras variaciones legales / razonables resulten ganadoras. (Alphago también entrena jugando muchos millones de juegos consigo mismo durante, tal vez, meses). Un efecto secundario de maximizar esa probabilidad es que la máquina juega suavemente cuando está adelante, simplificando y satisfecha con una victoria de punta muy estrecha. Cuando están ligeramente por detrás, estos agentes son potencialmente propensos a ser un poco tontos. Entonces, actualmente para Go, falta una pieza de control si queremos un oponente que oscile en un nivel más o menos uniforme con un humano dado. No sé si tales métodos se han desarrollado en otros lugares. El software de enseñanza de ajedrez sería un obvio mercado / campo de prueba si lo hubiera hecho. En el ajedrez, es mucho más posible crear una función de evaluación que describa incluso las posiciones con parámetros que un estilo de juego podría afectar.
Go (juego de mesa): ¿Puede una IA adaptarse orgánicamente para jugar contra el jugador humano en un nivel casi uniforme en Go?
Related Content
Cómo contribuir a la inteligencia artificial.
¿Es la IA actualmente responsable de más bien utilitario que los seres humanos?
¿Qué debo hacer si quiero trabajar en inteligencia artificial cuando sea mayor?
En Go no hay necesidad de hacer esto debido a un sistema llamado piedras de discapacidad. Los hándicaps de go te permiten ajustar las diferencias de fuerza entre los jugadores sin obligar al jugador más fuerte a ser deshonesto, es decir, jugar por debajo de toda la fuerza. Esto se alinea con la traducción al inglés del término japonés utilizado por la mayoría de los maestros de Go. En los rangos y clasificaciones de Go, si yo como jugador de 10 kyu jugara un jugador de 1 kyu, tendría una desventaja de 9 piedras.
Sí, cambiar el objetivo del algoritmo de aprendizaje de refuerzo. En lugar de estar entrenado para elegir el movimiento con la mayor probabilidad de vencer al oponente, elija el movimiento que resulte en la configuración del tablero más cercana a 50/50 donde ambos lados parecen tener la misma probabilidad de ganar.
La respuesta a esto se determina si está utilizando el término AI para hacer referencia a un sistema preprogramado diseñado para responder de memoria a sus movimientos, o si se refiere a una inteligencia artificial VERDADERA; por ejemplo, un programa capaz de aprender.
En el caso de los primeros, absolutamente no. Dichos sistemas son puramente reactivos, incluidos los sistemas utilizados en los videojuegos modernos a pesar de lo avanzados que puedan parecer.
En el caso de este último, absolutamente. Una IA adecuada aprenderá tanto como un humano. Como tal, puede crecer y adaptarse a medida que juega contra una persona determinada.
No estamos seguros de lo orgánico, pero a menudo entrenamos IA de dos maneras para mejorar el rendimiento contra los humanos.
El primero es darles tantos datos sobre cómo juegan los humanos. Juegos pasados, por ejemplo.
Otra es jugar la IA contra otras IAs tal vez copias de sí mismo.
Este puede ser un enfoque muy poderoso dada la velocidad a la que puede jugar.
More Interesting
¿Cuáles son algunos usos creativos para la IA?
¿Cuál es la mejor IA de hoy en día?
¿Por qué la gente está preocupada por la IA cuando la IA probablemente no tendría sentimientos?
¿Qué podríamos hacer si se llevara a cabo una toma de control de IA?
¿Cuál es la diferencia básica entre API.ai, wit.ai, IBM Watson y Luis.ai?
¿Qué tan pronto la inteligencia artificial comenzará a reemplazar trabajos masivamente?
¿La inteligencia artificial conducirá al verdadero socialismo?