¿Cómo es el póker más difícil que el ajedrez o Go for AI?

El problema es diferente.

Es mucho más fácil construir un algoritmo de póker defensivo que gane mucho dinero de los jugadores promedio y es difícil incluso para un experto ganar, que construir incluso el programa de ajedrez o Go más básico. El póker es un juego mucho más simple que cualquiera de esos, con muchas menos opciones y una resolución mucho más simple.

Sin embargo, el poker experto requiere la capacidad de aprender de un jugador que intenta engañarte. Esto dificulta incluso los problemas más simples.

Considere uno de los juegos más simples posibles, ro-sham-bo (o papel-tijera-piedra). Para evitar perder, solo paga cada uno con 1/3 de probabilidad, trivial para una computadora. Pero los jugadores expertos versus los humanos ganan mucho más de la mitad del tiempo. Las computadoras que intentan predecir el juego humano y explotarlo para ganar más de la mitad del tiempo ganan fácilmente a los jugadores promedio, pero tienen grandes dificultades con los expertos.

Si simplifica el juego de póker, dos jugadores, rondas limitadas, pila de fichas limitada o juego limitado, es posible encontrar soluciones matemáticamente óptimas que no pueden ser superadas, pero que no son particularmente buenas para extraer ventaja de los jugadores humanos. Eventualmente, las personas probablemente encontrarán soluciones óptimas para juegos más complicados, pero esperaría que tuvieran esta misma característica. Un jugador de póker no se considera un experto por nunca perder, la habilidad en el póker se mide por la capacidad de ganar.

Las computadoras están cerca del punto, o tal vez ya están allí, cuando pueden ganar consistentemente incluso con jugadores expertos. Sin embargo, no sabemos si surgirán personas que estudien a los mejores jugadores de computadora y aprendan a ganar con ellos.

Ir y el ajedrez son deterministas, puedes enumerar todas las permutaciones y combinaciones en estos juegos y decidir cuál es el mejor para que ganes. Las computadoras son realmente buenas para hacer este tipo de cálculos. Sé que en Go las posibilidades son prácticamente infinitas, pero aún así puedes aplicar la heurística junto con el aprendizaje profundo para obtener resultados consistentes.

Pero, por otro lado, el Poker tiene un elemento de engaño, es decir, farolear. Se vuelve increíblemente difícil para la IA predecir si el usuario está faroleando o no. La IA debe tener en cuenta muchos factores, como el lenguaje corporal del usuario, el historial reciente de jugadas, el estilo de juego, el historial de los jugadores, cuánto tiempo tarda el otro jugador en actuar, etc. Y no toda esta información es disponible para la IA.

La información oculta hace que el problema sea mucho más difícil de resolver. Si no conoces la mano de 2 cartas de un oponente y se quedan en el bote, en comparación con saber esto, el tamaño del problema (espacio de búsqueda) aumenta hasta 52 * 51 o 2500x (menos con algunas simetrías de cartas). Sin embargo, el problema es mucho peor que eso. Los jugadores de póker juegan estrategias mixtas. Simplemente, existe una probabilidad desconocida de que un jugador elija apostar cualquier cantidad dada de su posición. Esta probabilidad es un número real entre 0 y 1, y, por supuesto, el sentido común humano / conocimiento de póker podría refinar ese rango en ciertas circunstancias. Sin embargo, todavía hay un número infinito de estrategias que cada oponente podría estar jugando. Supongo que este tipo de desafío en la formación del problema es lo que desafía, o al menos complica, los enfoques computacionales generales del póker.

More Interesting

¿Cuáles son los mejores chatbots (AI) disponibles en línea?

¿Es cierto que comprender la inteligencia artificial es una forma de estudiar la inteligencia general?

¿La inteligencia artificial y el aprendizaje automático reemplazarán las pruebas de selenio y las pruebas de automatización?

Si quiero solicitar una maestría con un área de investigación en aprendizaje automático, ¿debería elegir inteligencia artificial en un curso de maestría en educación física o elegir las estadísticas de EM en UC Berkeley?

¿Cómo funciona el aprendizaje automático de acuerdo con este artículo?

Quiero hacer una IA simple (inteligencia artificial), entonces, ¿qué lenguaje de programación debo aprender para hacer una IA simple?

¿Qué pasaría si los robots de IA aprendieran a reprogramar su propio programa?

¿Cuál es el futuro del aprendizaje profundo para la segmentación de imágenes médicas?

¿La teoría de la medida es relevante para el aprendizaje automático?

¿Cuál sería una buena aplicación para las redes neuronales con púas artificiales en los ámbitos del aprendizaje automático supervisado?

¿Está explorando diferentes algoritmos de aprendizaje automático y qué tipo de conjunto de datos funcionan mejor con un buen tema de Math HL IA?

¿La programación de computadoras será automatizada en un futuro cercano por Inteligencia Artificial?

¿Dónde encajan los bots en el dominio de interacción humano-computadora?

Inteligencia artificial: ¿Cuántas líneas de código se necesitarían para codificar un AI / AGI fuerte?

Inteligencia artificial: ¿Cómo las redes neuronales convolucionales identifican las emociones humanas?