La máquina no tiene cara de póker y las máquinas manejan mal la información incompleta.
Bueno, jugué más de 10 millones de manos de póker en mi vida (ahora tengo 24), lo que me coloca en el 1% del 1% (del 1%, probablemente) de los jugadores con más manos jugadas.
Todos fueron jugados en línea.
En vivo podría haber jugado 2 o 3 horas cuando era menor de edad, sin dinero involucrado (menos de 60 manos, suponiendo 20 manos / hora).
La cara de póker no es lo que te hace ganar o perder.
- ¿Qué sensores tiene el robot Nao?
- ¿Cómo los sistemas AI buscan en la web?
- ¿Los robots reemplazarán a los seres humanos en el lugar de trabajo por completo?
- ¿Por qué quieres iniciar una empresa relacionada con la IA?
- Si los robots humanos se convirtieran en algo común, ¿deberían ser profesores universitarios?
Los avisos están sobrevalorados entre los jugadores débiles.
Si un jugador fuerte dice algo, probablemente lo esté fingiendo.
Phil Hellmuth es considerado un pez entre muchos, pero probablemente sus habilidades para leer a los oponentes lo dicen muy bien.
Esto lo convierte en un muy buen ganador en torneos en vivo (perfil de Phil Hellmuth Jr en The Hendon Mob), pero en el juego de efectivo en línea con apuestas medias estaría en una gran dificultad.
El juego de póker es complejo, contrario a la creencia popular.
¿Cómo puede una máquina de póquer AI vencer a jugadores humanos?
No tengo dudas de que la “IA del póker” habría vencido a los humanos si estuvieran jugando una y otra vez … La IA es demasiado inteligente, tienen demasiado poder mental.
Por supuesto, este desafío fue estructurado de una manera realmente pobre.
- Las manos se reflejaron
Dong Kim tenía las manos entregadas a la IA cuando la IA jugaba con Jason Les, y Daniel MCauley tenía las manos entregadas a la IA cuando la IA jugaba con Jimmy Chou. Entonces, no necesariamente es Dong Kim el mejor jugador, puede que haya servido las mejores manos.
Además, esta forma de usar “manos reflejadas” no reduce la variación, como señala Dong Kim a los 14 minutos aproximadamente:
Reduce la volatilidad.
Una vez que los humanos sintieron que iban a perder, comenzaron a correr más riesgos, por ejemplo, abriendo 6 veces desde el botón, lo cual es totalmente poco convencional. Si estás perdiendo, intentas movimientos desesperados , y puedes ver en el cuadrante superior izquierdo que la pendiente es más grande después de 75,000 manos.
Las horas de juego fueron desgarradoras … Piensa en ello, generalmente juegas en línea cuando estás en tu juego A, cuando puedes rendir al máximo.
Si está perdiendo, está cansado, no puede concentrarse, renuncia.
Sabes que tu oponente te jugará mañana. No pudieron porque CMU hizo estas reglas, los humanos no se molestaron porque subestimaron lo cansados que estarían. Si estás “en inclinación” (en la jerga) es más probable que juegues mal y pierdas.
Este fue otro desafío este año: esta IA supuestamente puede vencer a los expertos en el póker No-Limit Texas Hold’em
Este es el papel:
https://arxiv.org/pdf/1701.01724…
En 2015 cerebros vs humanos: cerebros vs. Inteligencia artificial: la computadora Carnegie Mellon se enfrenta a los profesionales del póker en la épica competencia sin límites Texas Hold’Em-CMU News – Universidad Carnegie Mellon
¿Qué tiene de especial esta tecnología que le permite vencer a los humanos en juegos en los que se supone que los humanos son mejores?
Cladico (la IA de 2015) quedó abrumado por el problema de la inversión, es decir: los humanos apostaban 1bb y el bot no podía desarrollar contramedidas porque quien lo programó decidió incluir la apuesta de X a X + K como igual.
Por lo tanto, un ser humano inteligente invocaría 1bb en un bote de 20bb, mientras se retiraba a una apuesta de 9-10bb. Los humanos apostaban 1bb en lugar de 9bb para explotar esta debilidad, ya que para el bot era lo mismo.
Las reglas de ese desafío no hicieron posible que el bot fuera reprogramado durante los juegos.
Alberta y CMU resolvieron el problema de la inversión.
Alberta decidió no resolver el árbol, sino utilizar una función entrenada que determina la heurística del valor de las posiciones en el árbol. (Estoy traduciendo / copiando del italiano)
Podemos suponer que esto es lo que hizo Libratus (el bot de 2016).
El algoritmo utilizado para encontrar el GTO es la minimización de arrepentimiento confactual.
Para cada movimiento, el algoritmo da una probabilidad proporcional al arrepentimiento de no haberlo jugado antes.
El bot se juega a sí mismo y de esta manera descubre cómo jugar Game Theory Optimal.
Si el bot se enfrenta a un jugador explotable, el bot encontrará la mejor respuesta a la estrategia del oponente, si el oponente está jugando una estrategia equilibrada, el bot encontrará la mejor estrategia para la estrategia del oponente promedio.
Desafortunadamente, este Algo debería ser capaz de extrapolar un árbol de 10 ^ 160 nodos, mientras que con la tecnología actual solo pueden resolver un árbol de 10 ^ 14 nodos.
Alberta resolvió esto usando una red neuronal, el algo no introduce ningún sesgo y puede modificarse si falla la estrategia falla.
Básicamente, la IA estaba jugando como ningún humano:
Jason: abrí JJ llamó. Flop 872 rainbow, aposté alrededor de 2/3 pot y todo fue por 200bb con KTo. Esto no es necesariamente “tonto”, pero fue bastante “WTF”
https://www.reddit.com/r/IAmA/co…
En este momento, la IA no puede usar GTO en juegos con más de 2 jugadores, pero estoy seguro de que tienen una ventaja sobre los humanos incluso allí.
“Primero vinieron por los jugadores de ajedrez, y no dije nada, porque no era un jugador de ajedrez.
Luego vinieron por los jugadores go, y no dije nada, porque no era un jugador go.
Luego vinieron por los jugadores de póker … “
Cuidado, ellos vendrán a tomar tu trabajo también …