¿Cuál es la mejor plataforma para simular el agente de refuerzo de aprendizaje?

Agentes de Python:

  • OpenAI Baselines es un conjunto de implementaciones de alta calidad de algoritmos de aprendizaje de refuerzo.
  • Hay toneladas de proyectos y tutoriales menos comisariados que implementan algoritmos de última generación en diferentes marcos (desde PyTorch, vea también aquí) hasta MxNet y PyBrain.

Entornos Python:

  • OpenAI Gym se ha convertido en un juego de herramientas estándar para desarrollar y comparar algoritmos de aprendizaje de refuerzo, e incluye varios entornos. Ahora, también integra roboschool para la simulación de robots.
  • DeepMind Lab tiene un conjunto de tareas desafiantes de navegación 3D y resolución de rompecabezas para agentes de aprendizaje.
  • OpenAI Universe es una plataforma de software para medir y entrenar la inteligencia general de una IA a través del suministro mundial de juegos, sitios web y otras aplicaciones.
  • DeepMind y Starcraft de Blizzard, que incluye API, conjunto de datos y minijuegos para desarrollar agentes de IA que puedan jugar a Starcraft.
  • El Arcade Learning Environment (ALE) es un marco simple orientado a objetos que permite a los investigadores y aficionados desarrollar agentes de inteligencia artificial para juegos Atari 2600.
  • El proyecto de Microsoft Malmö es una plataforma para la experimentación e investigación de Inteligencia Artificial construida sobre Minecraft. Nuestro objetivo es inspirar a una nueva generación de investigación en nuevos problemas desafiantes presentados por este entorno único.

Java: Sugeriría probar BURLAP.

More Interesting

¿Cuál es el lenguaje de programación más utilizado para la IA?

¿Cuál es la investigación futura sobre la extracción de características utilizando la teledetección satelital?

¿Qué es exactamente la "creatividad computacional"? ¿Y hay algún programa aplicable desarrollado en ese campo? ¿O es solo un campo de investigación hasta ahora?

¿Pueden los conceptos de (como ROT13, no programación) estar relacionados de alguna manera con los fundamentos del aprendizaje automático o la IA?

¿Mi habilidad para programar un robot me ayudará a ganar la experiencia para hacer una IA similar a Jarvis?

¿Qué es el aprendizaje profundo? ¿Por qué es esta una tendencia creciente en el aprendizaje automático? ¿Por qué no usar SVM?

¿Cuáles son los avances potenciales en el hardware de computación en la próxima década (más allá de la ley de Moore): Memristors, Cognitive, Quantum, Nanobots, encriptación de ADN?

¿Los avances actuales [y pronosticados en el futuro cercano] en inteligencia artificial causarán una interrupción importante en el empleo? Si es así, ¿cómo [como se especula] tratarán los gobiernos / la sociedad?

¿Cuáles son algunos métodos para etiquetar datos de entrenamiento para una red neuronal?

¿Hay alguna diferencia entre redes neuronales y redes neuronales convolucionales?

Quiero entrenar una red neuronal para reconocer la planta de su hoja. ¿Cómo puedo encontrar el área, el perímetro, el largo y el ancho de la hoja a partir de su imagen?

¿Podría una IA ser elegida Presidente de los Estados Unidos?

¿Alguna vez vamos a tener robots conscientes? En caso afirmativo, ¿cuándo y cuáles serán los pros y los contras de tenerlos?

¿Cuál es el alcance del aprendizaje automático para estudiantes universitarios?

Cuando lleguemos a la inteligencia artificial general, ¿cómo determinaremos si es sensible o no?