Cómo aplicar el aprendizaje automático al desafío Vindinium AI

* A2A *

Mi herramienta preferida para los juegos suele ser el algoritmo TD-Learning [1]. Es más fácil codificar (pero es un poco más difícil hacerlo bien, ya que debe decidir el espacio de estado y el espacio de acción correctos). En estos días, el aprendizaje de refuerzo de conjunto se está volviendo más popular. [2] muestra una IA siendo entrenada para jugar a Mario usando el aprendizaje de refuerzo de conjunto y gradualmente ser bueno en eso.

Mi segunda herramienta de elección suele ser el aprendizaje por imitación. Hace varios años, solía pasar mucho tiempo jugando con Robocode [3]. Con robocode, tenía acceso al repositorio de robocode donde muchas personas habían subido sus bots para que otras personas los descargaran y usaran. Descargué uno de los bot de mayor rendimiento y cambié su código para registrar todo el estado y las acciones que tomó. Luego, ejecuté este bot contra varios jugadores diferentes y comencé a crear el registro. Una vez que tuve suficiente cantidad de datos, modifiqué estos datos (discreticé el espacio de acción) para entrenar un SVM multiclase. Luego escribí un bot que tomó medidas basadas en el clasificador SVM. La idea esencialmente aquí era imitar al mejor bot pero a través de un modelo aprendido. Lo hizo bastante bien. Aprendí un par de otros buenos bots y creé algunos modelos más. Luego, simplemente combiné todos estos modelos y elegí la acción basada en la acción que tuvo la mejor puntuación entre todos los modelos.

[1] Aprendizaje de diferencia temporal
[2] Michel Tokic – Hochschule Ravensburg-Weingarten
[3] Inicio de Robocode

Aprendizaje automáticoAprendizaje profundoinformáticaInteligencia ArtificialPreguntas prácticasProgramación competitiva

Related Content

¿Qué significa cuando los datos están ocultos?

¿Es cierto que un título en informática es útil solo si puedo ingresar a una universidad superior como MIT o Stanford, y es mejor ser un desarrollador autodidacta en lugar de estudiar en una universidad mala?

¿Cuál es mejor DJ Sanghvi IT o Thadomal Computer Science?

¿Cuál es la importancia de los FSM?

Cómo hacer un trabajo de primera clase en inteligencia artificial

¿Cuál es la diferencia entre las diferentes bases de datos NoSQL?

¿Qué tipo de tarea informática solo puede realizar una supercomputadora mientras que no puede hacerlo un clúster de productos básicos?

Aprenda algo sobre el aprendizaje por refuerzo. Hay una gran cantidad de literatura sobre el tema.

Alireza Ghasemi

Juega un millón de veces más o menos y registra tus movimientos, así como los estados como entrada y el resultado final del juego como salida. Ahora puede aprender un clasificador (DeepNet, Gaussian Process, SVM, …) que, dado un estado, determina el mejor movimiento.

Alireza Ghasemi

More Interesting

¿Qué es la criptografía y por qué es importante?

Tengo una idea para una aplicación de Realidad Virtual, ¿dónde puedo encontrar un desarrollador?

¿Cuáles son algunas aplicaciones interesantes del aprendizaje automático en la aplicación de la ley y la lucha contra el terrorismo?

¿Cuáles son algunas de las mejores ideas de proyectos para un estudiante de tercer año de CSE / IT?

¿Cómo se usa la teoría de categorías en autómatas celulares?

¿Es posible ver si / cuando un archivo fue copiado en mi computadora?

Se me ocurrió una idea para una aplicación móvil. Me acabo de enterar de que una empresa multinacional acaba de lanzar una aplicación que es muy similar, ¿cómo debo proceder?

¿Cuáles son las 3 mejores mejoras tangibles logradas con IA o aprendizaje profundo que han ayudado más a la medicina clínica?

¿Cuál es la mejor fuente de ejemplos exitosos de productos de arquitectura de la vida real, por ejemplo, definiciones de sistemas, diagramas UML, procesos de negocios?

¿Existen programas web auto modificables, ya que el navegador web es perfecto para el código auto modificable?

¿Cómo puede cooperar un sistema distribuido para determinar las reglas de su entorno?

Cómo deshabilitar el ping a un enrutador

¿Cómo se aplica el aprendizaje automático en la fabricación?

¿Cuáles son las desventajas de la computadora de uso general?

¿Qué necesito saber para construir una IA genérica?

Web Analytics