¿Cómo diseñarías una red neuronal que aprende a jugar trackmania?

tldr: “Estrategia de aprendizaje por refuerzo”.

Entorno OpenAI

No sé si lo has visto, pero OpenAI lanza un juego de herramientas para construir algoritmos de refuerzo en el entorno del juego. No han incluido TrackMania y otros , pero puedes ver juegos muy similares como Coaster-Racer.

¿Qué porcentaje de tiempo pasa un analista de datos en diferentes tareas (recopilar datos, limpiar datos, analizar datos, etc.)?
¿Se ha aplicado AI / machine learning en Conway's Game of Life?
¿Cuál es la diferencia entre AI y Machine Learning Nanodegrees en Udacity?
¿Qué campo es mejor para el futuro de hoy, análisis de big data, inteligencia artificial o redes? No soy fuerte en programación.
¿Es irracional estar preocupado por un apocalipsis de IA?

Aquí hay un video que explica cómo usar el framework (nice guy por cierto):

Para TrackMania

Tendría que implementar todo por su cuenta. Aquí están los pasos principales:

Crea una función para obtener una pantalla del marco actual de tu juego,
Cambie la forma, cambie el tamaño, transforme su marco para adaptarse mejor a su algoritmo. ¿Son los colores una información útil?
Si opta por el algoritmo QLearning (un algoritmo de aprendizaje de refuerzo), tendría que construir una QTable que predice la recompensa máxima con descuento por realizar la acción A en el estado S. Para simplificar las cosas, puede elegir un marco como su estado actual. El problema con esta solución es que tiene millones de estados diferentes, por lo que esta tabla se vuelve bastante grande. Esperemos que Deep Q Network esté aquí para resolver este problema: Neural Network reemplaza esta enorme y descomunal mesa. Introdujo un marco en la red neuronal, y predecirá la recompensa por cada acción que tome. Aquí las acciones pueden ser: ir a la izquierda, ir a la derecha, acelerar, frenar …

Debe optar por una red neuronal de convolución que es bastante eficiente para el reconocimiento de imágenes.

Recomendaciones de lectura

http://karpathy.github.io/2016/0…

Aprendizaje asincrónico de refuerzo profundo a partir de píxeles

Aprendizaje automáticoInteligencia ArtificialRedes neuronales artificiales

Related Content

¿Qué tan buenos son los algoritmos generales de juego?

¿Para qué se puede usar un reconocedor de dígitos?

¿Cuál es el principio de 'apostar por la escasez' en el aprendizaje automático?

¿Es realmente posible usar clasificadores de aprendizaje automático listos para usar como SVM o Random Forest para predecir con precisión la dirección del stock?

¿La inteligencia artificial jugará un papel clave en la creación de buenos servicios al cliente?

¿Por qué todos están interesados en las redes neuronales profundas ahora cuando otros sistemas de inteligencia artificial como las máquinas LISP fueron promocionados y no pudieron obtener una gran adopción en el pasado?

¿Qué reemplazará las baterías en el futuro?

More Interesting

¿Qué tiene de malo las opiniones de Ray Kurzweil y Elon Musk sobre la IA?

¿Es mejor quedarse con el aprendizaje automático o pasar al aprendizaje profundo?

¿Qué pasaría en un escenario de la vida real de Walking Dead, Falling Skies y Terminator?

¿Sería posible, con los algoritmos actuales de aprendizaje automático o los conocimientos generales de informática, crear una computadora tan poderosa y artificialmente inteligente como la de Persona de interés?

¿Qué tan bien te prepara el curso Coursera de Geoff Hinton para una carrera en aprendizaje automático con redes neuronales?

¿Cuál es la diferencia entre el aprendizaje automático y las redes neuronales?

¿Qué lenguaje usaría una IA para programarse a sí misma o su engendro?

¿Alguna vez ha habido una situación en la que la IA no funcionó correctamente e hizo algo para lo que no estaba programada?

Según el tecnólogo Raymond Kurzweil, la Singularidad debería ocurrir alrededor de 2045. ¿Se considerará entonces la potencia informática?

¿Qué es lo que los humanos valoran que, incluso si los robots pueden hacer, podría no ser atractivo para los humanos?

¿Cuánta potencia informática requiere un robot inteligente general?

¿Hay algún buen punto de partida de código abierto para escribir una IA para un RTS?

Cómo incorporar nuevas características en los modelos de aprendizaje automático existentes

Visión por computadora: ¿Cuáles son los trabajos más interesantes de CVPR 2012?

¿Pueden los conceptos de (como ROT13, no programación) estar relacionados de alguna manera con los fundamentos del aprendizaje automático o la IA?

Web Analytics