¿Qué estrategia emplearías para vencer a un algoritmo de computadora jugando póquer matemáticamente perfecto?

Si la computadora está jugando una estrategia mixta óptima teórica de juego, por definición no hay forma de explotarla y hacerlo mejor que una expectativa cero. Pero esto solo se aplica mano a mano, y en un juego justo.

En un juego de círculo o torneo, hay tres cosas que puedes hacer. Primero, juega con cautela contra la computadora, pero trata de explotar a los otros jugadores humanos. Puedo vencer a la computadora jugando de manera no óptima contra los errores de los otros humanos. Si la computadora se apega a su estrategia GTO, no lo hará, así que puedo ganarla. La estrategia de explotación máxima contra una estrategia particular no suele ser un GTO.

La segunda estrategia con expectativa positiva es sentarse a la izquierda de la computadora. El dinero fluye naturalmente de derecha a izquierda, en la dirección del juego. Por lo tanto (si también puedo jugar perfectamente, y la persona a * mi * izquierda no lo hace) tendré una pequeña expectativa positiva.

Una última opción es coludir contra la computadora. Su estrategia de GTO de juego de anillo o torneo puede o no asumir que los otros jugadores están en coalición contra él. Pero bien podemos llegar a una estrategia que gane colectivamente (y divida las ganancias fuera de línea).

En un partido mano a mano, haz trampa. Soborna al traficante. Espiar las tarjetas de la computadora.

Si su objetivo es simplemente “vencer a la computadora más de lo que pierde a la computadora”, también puede lograr esto sacrificando EV. Si toma decisiones que ganan a menudo pero en pequeñas cantidades (como empujar todo adentro todo el tiempo), puede ganar la mayoría de las manos incluso si pierde dinero en general.

En primer lugar, me gustaría señalar que nadie sabe qué es el póker matemáticamente perfecto. Así que supongo que la pregunta es hipotética, lo que obviamente está totalmente bien.

En segundo lugar, no está claro qué quiere decir con vencer a un algoritmo informático de este tipo. Quieres decir

  1. ganar en una mano en particular?
  2. ganar una sesión (¿cuánto tiempo?)
  3. ganar a largo plazo, es decir, en una muestra lo suficientemente grande donde la suerte se vuelve insignificante?
  4. hacer la jugada más rentable en una mano determinada?

La respuesta a 4 es que siempre debes tratar de hacer la mejor jugada matemática o acercarte lo más que puedas.

La respuesta a 3. es que no puedes vencerlo, ya que suponemos que nuestro oponente juega matemáticamente perfecto. Así que lo mejor que puedes hacer es no perder dinero si supieras jugar póker matemáticamente perfecto (suponiendo que no haya ningún rake, por supuesto).

La respuesta a 1. y 2. es que la suerte es enorme en el póker, incluso con más de miles de manos, por lo que ciertamente puedes ganar incluso con un mal juego contra una computadora así. Por lo tanto, su estrategia debería ser esperar un poco de suerte, al mismo tiempo que intenta jugar lo más matemáticamente perfecto posible.

Editar: Supuse que con matemáticamente perfecto querías decir Juego Teóricamente Óptimo (GTO).

Si por póker matemáticamente perfecto, quiere decir que apostará / se retirará exactamente a lo largo de las líneas de equidad calculada de las manos. Según el tamaño de la apuesta, será muy obvio lo que cree que tiene y puede explotarlo a través de faroles, doblando cuando está detrás y aumentando cuando está adelante.

Si te refieres a la teoría del juego óptima, es imposible hacerlo mejor que incluso por definición. Pero nadie se ha acercado a ese AFAICT.

Solo puedes ganar por suerte contra un oponente matemáticamente perfecto.

La forma más fácil de ganar por suerte es jugar un juego de alta variación, básicamente grandes aumentos y empujar todo en el preflop.

Esto va a sonar extraño, pero creo que es una estrategia bastante fácil de superar. El problema con el juego matemáticamente perfecto es que, por su naturaleza, es predecible.

Digamos que tengo As / 2 en mi mano, y estoy jugando un juego de matemáticas perfectas. Si el flop viene con dos espadas, entonces tengo una probabilidad de 1 en 3 de golpear tu color en el enfrentamiento. Las posibilidades de que mi oponente golpee una casa llena son casi insignificantes. Podría emparejar mi as, pero las probabilidades son escasas y no es una garantía de victoria. Un jugador matemáticamente perfecto calcularía esas probabilidades, por supuesto, pero mi punto es que, por el bien de nuestra discusión, podemos hablar de esta mano como si fuera a ganar 1/3 de las veces sin estar demasiado lejos de la marca.

Si voy a ganar esta mano 1/3 de las veces, entonces necesito que mis probabilidades de bote sean 2: 1 para alcanzar el punto de equilibrio. Si estoy cara a cara, la matemática es fácil: no debería apostar o subir, debería apostar cualquier cosa más pequeña que una apuesta del tamaño del bote, y debería doblar a cualquier cosa más grande que una apuesta del tamaño del bote.

Pero, mi oponente también sabe todas estas matemáticas. Eso significa que si se da cuenta de que estoy en un proyecto de color, lo cual, si estoy jugando matemáticas perfectas, no es difícil de hacer, entonces puede hacer que me retire en cualquier momento que quiera simplemente haciendo un poco más grande. apuesta del tamaño del bote, sin importar lo que tenga.

Esto es cierto para muchas manos, incluso las que no son especulativas. Si tengo reyes de bolsillo cuando hay un as en la mesa, tengo que hacer una apuesta de 6x. Ahora, esa es una gran apuesta para que alguien haga un as emparejado, incluso si lo tienen. El problema es que saber que * tengo * que plegarme a él elimina todo el riesgo de la jugada.