¿Qué estrategia emplearías para vencer a un algoritmo de computadora jugando póquer matemáticamente perfecto?

Si la computadora está jugando una estrategia mixta óptima teórica de juego, por definición no hay forma de explotarla y hacerlo mejor que una expectativa cero. Pero esto solo se aplica mano a mano, y en un juego justo.

En un juego de círculo o torneo, hay tres cosas que puedes hacer. Primero, juega con cautela contra la computadora, pero trata de explotar a los otros jugadores humanos. Puedo vencer a la computadora jugando de manera no óptima contra los errores de los otros humanos. Si la computadora se apega a su estrategia GTO, no lo hará, así que puedo ganarla. La estrategia de explotación máxima contra una estrategia particular no suele ser un GTO.

La segunda estrategia con expectativa positiva es sentarse a la izquierda de la computadora. El dinero fluye naturalmente de derecha a izquierda, en la dirección del juego. Por lo tanto (si también puedo jugar perfectamente, y la persona a * mi * izquierda no lo hace) tendré una pequeña expectativa positiva.

Una última opción es coludir contra la computadora. Su estrategia de GTO de juego de anillo o torneo puede o no asumir que los otros jugadores están en coalición contra él. Pero bien podemos llegar a una estrategia que gane colectivamente (y divida las ganancias fuera de línea).

En un partido mano a mano, haz trampa. Soborna al traficante. Espiar las tarjetas de la computadora.

Si su objetivo es simplemente “vencer a la computadora más de lo que pierde a la computadora”, también puede lograr esto sacrificando EV. Si toma decisiones que ganan a menudo pero en pequeñas cantidades (como empujar todo adentro todo el tiempo), puede ganar la mayoría de las manos incluso si pierde dinero en general.

AlgoritmosPoker

¿Qué algoritmos de programación utiliza cada sistema operativo común?

¿Cuál es la forma correcta de fusionar dos algoritmos de cifrado simples, sin causar un problema de cifrado?

Cómo aprender estructuras de datos y algoritmos lo suficientemente buenos como para conseguir un trabajo en 10 meses

¿Cuál de estos me dará la mejor oportunidad para usar los algoritmos y las estructuras de datos que se enseñan en el desarrollo web de la escuela o el desarrollo móvil?

¿Dónde puedo aprender los algoritmos de clasificación y búsqueda?

¿Es la incapacidad de implementar estructuras de datos básicas como una lista doblemente enlazada, un árbol con punteros primarios usando un código seguro la mayor debilidad de Rust?

En primer lugar, me gustaría señalar que nadie sabe qué es el póker matemáticamente perfecto. Así que supongo que la pregunta es hipotética, lo que obviamente está totalmente bien.

En segundo lugar, no está claro qué quiere decir con vencer a un algoritmo informático de este tipo. Quieres decir

ganar en una mano en particular?
ganar una sesión (¿cuánto tiempo?)
ganar a largo plazo, es decir, en una muestra lo suficientemente grande donde la suerte se vuelve insignificante?
hacer la jugada más rentable en una mano determinada?

La respuesta a 4 es que siempre debes tratar de hacer la mejor jugada matemática o acercarte lo más que puedas.

La respuesta a 3. es que no puedes vencerlo, ya que suponemos que nuestro oponente juega matemáticamente perfecto. Así que lo mejor que puedes hacer es no perder dinero si supieras jugar póker matemáticamente perfecto (suponiendo que no haya ningún rake, por supuesto).

La respuesta a 1. y 2. es que la suerte es enorme en el póker, incluso con más de miles de manos, por lo que ciertamente puedes ganar incluso con un mal juego contra una computadora así. Por lo tanto, su estrategia debería ser esperar un poco de suerte, al mismo tiempo que intenta jugar lo más matemáticamente perfecto posible.

Editar: Supuse que con matemáticamente perfecto querías decir Juego Teóricamente Óptimo (GTO).

Mark Gritter

Si por póker matemáticamente perfecto, quiere decir que apostará / se retirará exactamente a lo largo de las líneas de equidad calculada de las manos. Según el tamaño de la apuesta, será muy obvio lo que cree que tiene y puede explotarlo a través de faroles, doblando cuando está detrás y aumentando cuando está adelante.

Si te refieres a la teoría del juego óptima, es imposible hacerlo mejor que incluso por definición. Pero nadie se ha acercado a ese AFAICT.

Mark Gritter

Solo puedes ganar por suerte contra un oponente matemáticamente perfecto.

La forma más fácil de ganar por suerte es jugar un juego de alta variación, básicamente grandes aumentos y empujar todo en el preflop.

Mark Gritter

Esto va a sonar extraño, pero creo que es una estrategia bastante fácil de superar. El problema con el juego matemáticamente perfecto es que, por su naturaleza, es predecible.

Digamos que tengo As / 2 en mi mano, y estoy jugando un juego de matemáticas perfectas. Si el flop viene con dos espadas, entonces tengo una probabilidad de 1 en 3 de golpear tu color en el enfrentamiento. Las posibilidades de que mi oponente golpee una casa llena son casi insignificantes. Podría emparejar mi as, pero las probabilidades son escasas y no es una garantía de victoria. Un jugador matemáticamente perfecto calcularía esas probabilidades, por supuesto, pero mi punto es que, por el bien de nuestra discusión, podemos hablar de esta mano como si fuera a ganar 1/3 de las veces sin estar demasiado lejos de la marca.

Si voy a ganar esta mano 1/3 de las veces, entonces necesito que mis probabilidades de bote sean 2: 1 para alcanzar el punto de equilibrio. Si estoy cara a cara, la matemática es fácil: no debería apostar o subir, debería apostar cualquier cosa más pequeña que una apuesta del tamaño del bote, y debería doblar a cualquier cosa más grande que una apuesta del tamaño del bote.

Pero, mi oponente también sabe todas estas matemáticas. Eso significa que si se da cuenta de que estoy en un proyecto de color, lo cual, si estoy jugando matemáticas perfectas, no es difícil de hacer, entonces puede hacer que me retire en cualquier momento que quiera simplemente haciendo un poco más grande. apuesta del tamaño del bote, sin importar lo que tenga.

Esto es cierto para muchas manos, incluso las que no son especulativas. Si tengo reyes de bolsillo cuando hay un as en la mesa, tengo que hacer una apuesta de 6x. Ahora, esa es una gran apuesta para que alguien haga un as emparejado, incluso si lo tienen. El problema es que saber que * tengo * que plegarme a él elimina todo el riesgo de la jugada.

Mark Tabler

More Interesting

Creamos un algoritmo de software único para medir / cuantificar las diferencias de las imágenes a escala nano-planetaria. ¿Cómo monetizamos esto?

¿Cómo ordena Quora los elementos que aparecen en la secuencia de un usuario?

Cómo calcular el orden de crecimiento para un fragmento de código dado

¿Cuál es el enfoque algorítmico para invertir un árbol binario dado?

¿Las compañías aéreas han mejorado la eficiencia de sus algoritmos de sobreventa?

¿Qué son los algoritmos simples?

Dado un gráfico bipartito, ¿cómo puedo encontrar su subgrafo que es un gráfico bipartito completo y tiene la mayor cantidad de vértices?

¿Cómo funcionan los algoritmos de Google en los motores de búsqueda?

¿Qué debe saber todo programador sobre Lisp?

¿Qué son los treaps con claves implícitas?