Creo que la mayoría de las principales empresas, de alguna manera, están trabajando o aprendiendo con refuerzo; RL tiene muchas formas diferentes de aplicarse a los problemas.
Como un ejemplo (entre muchos), una aplicación particularmente importante que usa RL se llama gestión de diálogo . Esencialmente, podemos enmarcar el problema que enfrenta un agente de conversación como uno en el que necesita decidir en cada paso de la conversación qué decirle a la otra parte. Los sistemas antiguos para la gestión de diálogos están escritos a mano, son frágiles y no se adaptan a los usuarios o los errores. Deep RL presenta una buena manera de superar algunos de estos obstáculos, aunque ciertamente se necesita más trabajo. Empresas como Microsoft (Cortana), Amazon (productos de Alexa) y Maluuba , (recientemente adquirida por Microsoft) están trabajando en este problema y están utilizando RL profundo.
Para agregar un nombre más, Facebook AI Research también está trabajando en RL profundo, tanto para uso dentro de Facebook como para investigación fundamental en juegos, como Doom y Starcraft.
- ¿De dónde obtengo un sentimiento de Twitter durante todo el día del conjunto de datos?
- ¿La máquina está aprendiendo la 'versión del hombre tonto' de intentar recrear la inteligencia?
- ¿Qué es un perceptrón?
- ¿Cómo evalúa el rendimiento de un algoritmo de aprendizaje no supervisado?
- Aprendizaje automático: Alex Casalboni: ¿Cuál es la mejor herramienta de ML para desenfocar caras (los tres tipos de visión izquierda, derecha y frontal) y placas en las imágenes?