tldr: “Estrategia de aprendizaje por refuerzo”.
Entorno OpenAI
No sé si lo has visto, pero OpenAI lanza un juego de herramientas para construir algoritmos de refuerzo en el entorno del juego. No han incluido TrackMania y otros , pero puedes ver juegos muy similares como Coaster-Racer.
- ¿Qué porcentaje de tiempo pasa un analista de datos en diferentes tareas (recopilar datos, limpiar datos, analizar datos, etc.)?
- ¿Se ha aplicado AI / machine learning en Conway's Game of Life?
- ¿Cuál es la diferencia entre AI y Machine Learning Nanodegrees en Udacity?
- ¿Qué campo es mejor para el futuro de hoy, análisis de big data, inteligencia artificial o redes? No soy fuerte en programación.
- ¿Es irracional estar preocupado por un apocalipsis de IA?
Aquí hay un video que explica cómo usar el framework (nice guy por cierto):
Para TrackMania
Tendría que implementar todo por su cuenta. Aquí están los pasos principales:
- Crea una función para obtener una pantalla del marco actual de tu juego,
- Cambie la forma, cambie el tamaño, transforme su marco para adaptarse mejor a su algoritmo. ¿Son los colores una información útil?
- Si opta por el algoritmo QLearning (un algoritmo de aprendizaje de refuerzo), tendría que construir una QTable que predice la recompensa máxima con descuento por realizar la acción A en el estado S. Para simplificar las cosas, puede elegir un marco como su estado actual. El problema con esta solución es que tiene millones de estados diferentes, por lo que esta tabla se vuelve bastante grande. Esperemos que Deep Q Network esté aquí para resolver este problema: Neural Network reemplaza esta enorme y descomunal mesa. Introdujo un marco en la red neuronal, y predecirá la recompensa por cada acción que tome. Aquí las acciones pueden ser: ir a la izquierda, ir a la derecha, acelerar, frenar …
- Debe optar por una red neuronal de convolución que es bastante eficiente para el reconocimiento de imágenes.
Recomendaciones de lectura
- http://karpathy.github.io/2016/0…
- Aprendizaje asincrónico de refuerzo profundo a partir de píxeles