Hubiera sido una idea mucho mejor hace 10 años. El póker se ha vuelto mucho más difícil recientemente, aunque no dudo que este método sería razonable cuando los jugadores cometieran grandes errores, los bordes que se hacen ahora son mucho más delgados y requieren una toma de decisiones mucho más compleja.
Por ejemplo, imagina que jugamos Rock Paper Scissors. El jugador A siempre lanza piedra … Un sistema de aprendizaje automático se ajustará continuamente a partir de la suposición de que el jugador A tiene 33/33/33 … A medida que el jugador A continúa tirando piedra, el aprendizaje automático continuará agregando más papel porque esa es la teoría del juego podría sugerir. Esto no llevaría mucho tiempo ya que después de una muestra de 10 rocas rectas, el rango supuesto del jugador A tendrá un gran peso hacia la roca y seguirá siendo mejor y mejor.
Ahora, si el jugador A se está ajustando al aprendizaje automático, el juego finalmente terminará en un empate de ambos jugadores seleccionando aleatoriamente 33/33/33 … La analogía es mostrar que a medida que los jugadores en el póker son mejores, la estrategia para ganar es más complejo y requiere más datos y un pensamiento más riguroso para ganar. Los días de pasar de un jugador nuevo a un jugador ganador en una semana de aprendizaje se han ido, por lo que el día de un programa para poder elegir la estrategia correcta rápidamente (presumiblemente sería dictado por la capacidad de juntar manos) tomará más tiempo y será más difícil.
- ¿Puede AI tocar el piano como un pianista?
- ¿Cuáles son los programas de maestría para el aprendizaje de refuerzo profundo y / o el aprendizaje profundo en robótica en general? ¿Dónde puedo postular, particularmente en Europa?
- ¿Cuál es el futuro de la interfaz de usuario de chatbot?
- ¿Qué modelo de red neuronal es eficiente para la predicción del mercado de valores mediante el análisis de sentimientos? ¿Y qué herramienta / biblioteca usar?
- ¿Por qué es tan difícil para las personas comprender el hecho de que existen diferentes tipos de redes neuronales?
Suena como un proyecto divertido, pero podría no ser la forma más rápida o eficiente de aprender (a partir de ahora).