En pocas palabras, jugar póker para computadoras es tan difícil como lo es para los humanos. La decisión teórica, la información imperfecta y los aspectos de incertidumbre de los atletas lo convierten en un banco de pruebas perfecto para muchos campos de IA, incluido el aprendizaje automático. El aprendizaje de refuerzo podría ser el mejor enfoque, como es el caso de muchos otros juegos de IA, sin embargo, el aprendizaje supervisado es posible si pudiera obtener registros históricos, incluida la información ganadora.
Hay un grupo de investigación (página de inicio de CPRG) que trabaja en póker jugando por computadora. Otro grupo de investigación (Bayesian Poker Player) aplicó el enfoque bayesiano para el póker computacional. Este blog sobre bots de póker (Poker Bots) podría dar buenas manos sobre los bots de póker. Se pueden encontrar más artículos en Poker-AI.org. Consulte esta tesis (4) para obtener información detallada.
El problema se puede dividir en:
- ¿Qué les falta a las redes de confrontación para que realmente modelen una representación del mundo?
- ¿Puede explicar la optimización convexa sin matrices de arpillera y solo la segunda derivada?
- ¿Qué son los componentes del procesamiento del lenguaje natural?
- Soy maestra de preescolar pero estoy muy interesado en las máquinas y quiero comenzar un aprendizaje adecuado. ¿Donde debería empezar?
- ¿Qué significa realmente 'Deep' en Deep Learning?
Estimación de la fuerza de la mano:
Esto es para estimar el potencial ganador de la mano de los jugadores y de los oponentes, en base a las cartas abiertas. Los más exitosos están utilizando el muestreo Monte Carlo basado. La idea es completar las manos mediante el muestreo de tarjetas inaccesibles y contar los #wins, y allí mediante la estimación de la probabilidad.
El cálculo exacto de la probabilidad ganadora es más lento que el muestreo. La estimación paramétrica utilizando datos históricos puede encontrar algunas aplicaciones de aprendizaje automático.
Modelado opuesto :
Esto implica estimar la probabilidad de acciones disponibles (retirarse, igualar, subir) para cada oponente. Aquí podemos usar los datos históricos de los jugadores para la estimación. Un enfoque exitoso es usar la red neuronal para el modelado del oponente (1). Consideran varios factores como el conteo de jugadores, la posición, el tipo de juego, etc. Por supuesto, podría haber diferentes enfoques.
Toma de decisiones y gestión de riesgos :
Esto implica crear funciones de utilidad y estrategias de listado y calificación. Esta es un área potencial para ML. Podemos puntuar estrategias basadas en datos históricos o actuales.
Enfoques:
Se han intentado varios enfoques. algunos de ellos son :
1) Enfoques probabilísticos (redes bayesianas (2), etc.)
2) Basado en reglas (evento, pares de acciones)
3) Basado en funciones (redes neuronales, etc.)
4) Algoritmos genéticos (3)
1) A. Davidson, D. Billings, J. Schaeffer y D. Szafron. Oponente mejorado
modelado en póker. En la Conferencia Internacional sobre Inteligencia Articial,
ICAI’00, páginas 1467–1473, 2000.
2) AE Nicholson, KB Korb y D. Boulton. Uso de redes bayesianas para jugar al póquer Texas Hold’em
3) C. Cheng. Reconocer manos de póker con programación genética y restringida
iteración. En J. Koza, editor, Algoritmos genéticos y programación genética en
Stanford, 1997
4) Algoritmos y evaluación en Computer Poker. Darse Billings, Ph.D. Disertación, septiembre de 2006 (http://poker.cs.ualberta.ca/publ…)