¿Qué tipo de productos podemos esperar de OpenAI?

Nuestro objetivo principal es producir una gran investigación. (Si bien los sistemas de inteligencia artificial de hoy ya son bastante impresionantes, creemos que lo que está a la vuelta de la esquina será mucho más capaz y emocionante de lo que se puede construir hoy). Entonces, la pregunta más importante es qué investigación saldrá de OpenAI.

Hoy nos centramos en los campos del aprendizaje no supervisado, el aprendizaje de refuerzo y su intersección. Para el primero, la idea es aprender de datos no etiquetados, por ejemplo, para construir un sistema que pueda leer un libro sobre París y luego aumentar su rendimiento en tareas basadas en París. Para este último, la idea es capacitar a un agente para que tome medidas en el mundo. Ambos son campos emergentes hoy. La combinación de aprendizaje no supervisado y de refuerzo debe ser especialmente fructífera, ya que esperamos que produzca soluciones para el aprendizaje de refuerzo basado en modelos útiles (es decir, un agente que construya un modelo mental de su entorno), a la exploración (es decir, cómo encontrar mejores soluciones en un entorno), y aprender de mucha menos experiencia (es decir, cómo no necesitar millones de pruebas para realizar una nueva tarea).

Hasta ahora, hemos creado OpenAI Gym. Lanzaremos nuestros primeros documentos en las próximas semanas y también anunciaremos algunos proyectos específicos en los que estamos enfocados. Manténganse al tanto.