¿Cómo diseñarías una red neuronal que aprende a jugar trackmania?

tldr: “Estrategia de aprendizaje por refuerzo”.

Entorno OpenAI

No sé si lo has visto, pero OpenAI lanza un juego de herramientas para construir algoritmos de refuerzo en el entorno del juego. No han incluido TrackMania y otros , pero puedes ver juegos muy similares como Coaster-Racer.

Aquí hay un video que explica cómo usar el framework (nice guy por cierto):

Para TrackMania

Tendría que implementar todo por su cuenta. Aquí están los pasos principales:

  • Crea una función para obtener una pantalla del marco actual de tu juego,
  • Cambie la forma, cambie el tamaño, transforme su marco para adaptarse mejor a su algoritmo. ¿Son los colores una información útil?
  • Si opta por el algoritmo QLearning (un algoritmo de aprendizaje de refuerzo), tendría que construir una QTable que predice la recompensa máxima con descuento por realizar la acción A en el estado S. Para simplificar las cosas, puede elegir un marco como su estado actual. El problema con esta solución es que tiene millones de estados diferentes, por lo que esta tabla se vuelve bastante grande. Esperemos que Deep Q Network esté aquí para resolver este problema: Neural Network reemplaza esta enorme y descomunal mesa. Introdujo un marco en la red neuronal, y predecirá la recompensa por cada acción que tome. Aquí las acciones pueden ser: ir a la izquierda, ir a la derecha, acelerar, frenar …

  • Debe optar por una red neuronal de convolución que es bastante eficiente para el reconocimiento de imágenes.

Recomendaciones de lectura

  • http://karpathy.github.io/2016/0…
  • Aprendizaje asincrónico de refuerzo profundo a partir de píxeles

More Interesting

¿Qué tiene de malo las opiniones de Ray Kurzweil y Elon Musk sobre la IA?

¿Es mejor quedarse con el aprendizaje automático o pasar al aprendizaje profundo?

¿Qué pasaría en un escenario de la vida real de Walking Dead, Falling Skies y Terminator?

¿Sería posible, con los algoritmos actuales de aprendizaje automático o los conocimientos generales de informática, crear una computadora tan poderosa y artificialmente inteligente como la de Persona de interés?

¿Qué tan bien te prepara el curso Coursera de Geoff Hinton para una carrera en aprendizaje automático con redes neuronales?

¿Cuál es la diferencia entre el aprendizaje automático y las redes neuronales?

¿Qué lenguaje usaría una IA para programarse a sí misma o su engendro?

¿Alguna vez ha habido una situación en la que la IA no funcionó correctamente e hizo algo para lo que no estaba programada?

Según el tecnólogo Raymond Kurzweil, la Singularidad debería ocurrir alrededor de 2045. ¿Se considerará entonces la potencia informática?

¿Qué es lo que los humanos valoran que, incluso si los robots pueden hacer, podría no ser atractivo para los humanos?

¿Cuánta potencia informática requiere un robot inteligente general?

¿Hay algún buen punto de partida de código abierto para escribir una IA para un RTS?

Cómo incorporar nuevas características en los modelos de aprendizaje automático existentes

Visión por computadora: ¿Cuáles son los trabajos más interesantes de CVPR 2012?

¿Pueden los conceptos de (como ROT13, no programación) estar relacionados de alguna manera con los fundamentos del aprendizaje automático o la IA?