Para algunas formas de póker como Heads-Up Limit Hold’em, hay programas de computadora que han sido competitivos con los mejores jugadores humanos durante varios años. Ver Poki, Sparbot, Vexbot y Polaris. Aplastan a la mayoría de los jugadores de póker que no se especializan en HU LHE. Quizás los mejores humanos aún sean mejores, quizás las computadoras los hayan superado, no estoy seguro, pero es solo cuestión de tiempo antes de que las computadoras dominen HU LHE. Este no es el tipo de póker que ves en la televisión: solo hay dos jugadores, y los tamaños de las apuestas son cantidades establecidas. No puedes simplemente decir: “Estoy dentro”. La mayoría de las veces, no necesitas pensar en cuántas fichas tiene tu oponente. Con solo dos jugadores, juegas una amplia gama de manos, y debes darte cuenta de que a veces se supone que debes invocar con una mano débil como una reina no mejorada.
Lo que ves en la televisión suele ser multijugador No Limit Hold’em, a veces torneos y, a veces, juegos en efectivo. Esto generalmente se acepta que es mucho más complicado que HU LHE porque debes prestar atención a los tamaños de las apuestas, los tamaños de las fichas, la posición y los posibles patrones de apuestas son mucho más complicados cuando hay varios jugadores en el bote. Hasta donde sé, los programas de computadora aún no son tan buenos como los mejores jugadores humanos en estos formatos. La gente ha creado programas que ganaron dinero en juegos de bajo riesgo, básicamente porque no se necesitaba mucha habilidad para ganar unos centavos por hora cuando jugaba contra oponentes terribles que parecen estar tratando de regalar dinero. Esto va en contra de los términos y condiciones de los sitios de póker. Los sitios de póker responsables pueden identificar bots y confiscar sus fondos, lo hayan ganado o no, ya que las personas se divierten más si piensan que están jugando contra otras personas. No recomiendo intentar hacer tales bots.
Entre HU LHE y el juego NLHE completo, hay variantes como LHE de tres manos y NLHE mano a mano. Estos se juegan en la competencia anual Computer Poker y las computadoras han estado progresando. Sin embargo, es posible que los programas más fuertes no compitan en tales competiciones, ya que un jugador profesional de HU NL tiene un valor considerable para tener un compañero de combate fuerte que no esté disponible públicamente.
- ¿Cuál es la diferencia entre los diferentes tipos de funciones de activación para redes neuronales y por qué es importante elegir una sobre otra?
- Cómo comenzar con el modelado predictivo
- Cómo usar un árbol de decisión para construir datos sintéticamente
- ¿Cuántas imágenes necesito para entrenar una red neuronal convolucional?
- ¿Cuáles son algunas aplicaciones del aprendizaje automático en la industria de la geología y la energía?
Un buen punto de partida para obtener información sobre el póker informático es el Computer Poker Research Group de la Universidad de Alberta. Hay otras personas en la academia que trabajan en el póker, pero el CPRG ha progresado mucho en el campo.
Usted pregunta específicamente sobre “calcular probabilidades”, “reconocer el patrón de un jugador dado y aprovecharlo” y “consistencia”. Sin embargo, estos son menos importantes de lo que cabría esperar.
Calcular las probabilidades en la forma en que las personas suelen decir no es tan importante durante una mano. Es útil que los jugadores humanos aprendan algunas probabilidades, pero generalmente no necesitas esta información durante la mano, o es solo uno de los muchos ingredientes. Es muy fácil para una computadora calcular las probabilidades de que la mano X gane contra la mano Y, pero cuando juegas, no sabes exactamente qué tiene tu oponente. Por ejemplo, en una mano sostuve Ah Qh, y en un tablero de Kh Th xx xx mi oponente fue all-in por aproximadamente el tamaño del bote. ¿Cuántas salidas tengo con un proyecto de color, tiro directo de gutshot y overcard? Tal vez una reina también estaría fuera. Llamé, y mi oponente tenía A4 y mi AQ ganó sin mejorar. 42 de las 44 cartas de river ganarían para mí, pero no tenía esa información cuando llamé.
Mucho más importante que conocer probabilidades como la frecuencia con la que AK gana contra QQ es entender el rango de tu oponente condicionado a las acciones. Esta es un área donde las computadoras tienen el potencial de ser mucho mejores que los humanos, pero el programador requiere mucho esfuerzo, y algunos programadores ni siquiera se dan cuenta de que esto es importante.
Reconocer las tendencias de juego de un oponente es emocionante. Sin embargo, esto es mucho menos importante de lo que la gente cree. Si bien hay bots de póker que modelan oponentes, muchas personas han fallado al enfatizar demasiado el modelado de oponentes. Incluso en niveles bajos de juego, no es suficiente saber cómo atacar a algunos oponentes fácilmente estereotipados. Tienes que evitar ser explotado tú mismo. Si gastas $ 10 para que alguien cometa un error de $ 1, has perdido incluso si has encontrado un lugar donde tu oponente comete un error. Si comienzas jugando bien al póker, ganarás. Entonces puedes mejorar esto adaptándote a los oponentes. Pero es bastante peligroso omitir el paso de aprender a jugar bien al póker. Muchos bots no detectan que alguien los está explotando y, como resultado, pierden mucho. Por ejemplo, muchos bots que la gente ha puesto en sitios de póker no leen los tamaños de las apuestas, solo si alguien ha apostado. Entonces se retiran demasiado cuando haces una apuesta mínima, digamos $ 1 en un bote de $ 100, cuando la teoría del juego dice que deberían retirarse con poca frecuencia. Creo que los jugadores humanos profesionales son mejores para explotar las debilidades de los oponentes humanos pobres que los bots, pero Este no es un problema tan importante en la IA del póker como la gente cree.
¿Consistencia? Por supuesto, las computadoras pueden ser consistentes. Las computadoras son mucho mejores en esto que los humanos. ¿Es esto una ventaja? Puede ser, aunque muchas personas dirían que la consistencia es una desventaja. Las personas confunden la previsibilidad con la consistencia, y sienten que tienen que cambiar de marcha, pasando de un juego apretado a un juego suelto o de regreso para ser impredecible. Ese no es el caso. Una estrategia sólida en el medio del camino es menos predecible que cambiar de marcha. Es difícil para los jugadores humanos ser buenos generadores de números aleatorios. Si sabes que se supone que debes farolear el 25% del tiempo, ¿seguirás faroleando el 25% del tiempo si tu oponente te atrapó las últimas dos veces? ¿Qué pasa si te saliste con la tuya? Los jugadores como yo explotan que es muy difícil para los humanos evitar adaptarse a las últimas ocurrencias, y como resultado, un jugador que está equilibrado en general no estará después de algunas secuencias. Las computadoras son mejores para implementar una estrategia de manera consistente, independientemente de lo que haya sucedido en manos anteriores, y esto es una fortaleza.