¿Qué tan difícil sería implementar el aprendizaje por refuerzo para un juego de mesa?

He hecho esto algunas veces. Hay cosas que lo hacen difícil, pero no es la parte de aprendizaje de refuerzo real.

Primero, necesitas implementar la lógica de todo el juego. Eso podría resultar sorprendentemente complejo para algunos juegos de mesa, con todas sus complejidades.

Luego, está la IA. Debido a que hay tantas reglas diferentes y decisiones diferentes que se deben tomar en un juego de mesa, generalmente es mejor crear una IA que combine un motor basado en reglas con aprendizaje de refuerzo. De lo contrario, hay tantas opciones que el agente de aprendizaje tardará una eternidad en descubrir patrones útiles. Básicamente, inicia la IA enseñándole un conjunto de reglas simples que le permitirán tomar decisiones óptimas cuando puedan calcularse directamente por la fuerza bruta. Después de eso, aplica el aprendizaje de refuerzo para optimizar las decisiones de más alto nivel. Esa es la parte fácil. Puede hacerlo utilizando Q-learning o redes neuronales o metaheurísticas.

Aprendizaje automáticoAprendizaje por refuerzo

Related Content

¿Se pueden programar las computadoras para comprender el valor estético de algo?

Cómo generar una oración gramaticalmente correcta y completa usando un número dado de palabras

¿Qué computadora portátil debo obtener para aprender el aprendizaje automático, usando SAS, R, MATLAB, Python, etc.?

¿Las redes de cápsulas reemplazarán a las redes neuronales?

¿Se puede dividir un modelo de regresión logística multinomial en modelos de regresión logística binarios separados?

¿Cómo es la regresión logística un caso especial de Markov Logic Networks?

¿Cómo difiere un sistema de clasificación artificial de una clasificación de sistema natural?

El campo ha avanzado mucho. Actualmente, lo usan incluso para juegos mucho más difíciles como GTA5 como se ve en DeepGTAV usando Universe.

lea más aquí Universo GTA V +

También DeepMind AlphaGo es un ejemplo de aprendizaje de refuerzo profundo. Utiliza Q-learning para jugar Atari:

Otro ejemplo de DQN:

Además, eche un vistazo al gimnasio OpenAI para el aprendizaje de refuerzo:

OpenAI Gym Beta

Aquí hay un ejemplo del gimnasio para el juego Go (un tablero):

OpenAI Gym: el entorno Go9x9-v0

Mona Jalal

More Interesting

Cómo comenzar la investigación en Machine Learning

¿Cuál es el mejor instituto en Bangalore para aprendizaje automático, inteligencia artificial y aprendizaje profundo (necesita práctica)?

Cómo aprender un campo aleatorio condicional

En optimización, ¿cuáles son algunos ejemplos geniales de reformulación?

¿Para qué sirve el aprendizaje automático o la inteligencia artificial?

¿Cuál es un buen libro para estadísticas como una consideración de ML para principiantes?

¿Qué es el aprendizaje activo?

¿Cómo es trabajar con Watson de IBM?

¿Existe alguna implementación del modelo de atención en el flujo tensorial?

¿Debo abandonar mi programa de doctorado CS para estudiar por mi cuenta?

¿Cuáles son las diferencias entre un científico de aprendizaje automático y un científico de datos?

¿Qué tan buenos son los conjuntos de datos SIG en India (por ejemplo, red de carreteras / calles, parcelas municipales, etc.)? ¿Cuáles son las fuentes para este tipo de conjuntos de datos?

Hipotéticamente, ¿sería posible cultivar tejido cerebral usando células madre y luego usarlo como un procesador distribuido para tareas de aprendizaje complejas?

¿Cuál es el estado de la investigación sobre chatbots y la PNL en 2017?

¿Por qué asumiríamos que los datos son iid cuando no lo son?

Web Analytics