Deep Reinforcement Learning es una subclase de Reinforcement Learning.
En Reinforcement Learning necesita encontrar una política que le brinde la mejor recompensa durante la vida del agente de aprendizaje. En el aprendizaje de refuerzo tradicional, los espacios problemáticos eran muy limitados y los posibles estados en un entorno eran muy pocos. Esta fue una de las principales limitaciones de los enfoques tradicionales. A lo largo de los años ha habido un par de enfoques relativamente exitosos que pudieron lidiar con espacios estatales más grandes al aproximarse al estado. Las redes neuronales se han utilizado para esto al menos desde el artículo de Riedmillers 2005 “Neural fit Q iteration”.
Los avances en algoritmos para DL han traído una nueva ola de aplicaciones exitosas en Reinforcement Learning, porque ofrece la oportunidad de trabajar eficientemente con datos de entrada de alta dimensión (como imágenes). En este contexto, el NN profundo entrenado puede verse como una especie de enfoque de RL de extremo a extremo, donde el agente puede aprender una abstracción de estado y una aproximación de política directamente de sus datos de entrada.
- ¿Cuál es un ejemplo de un sistema, proceso o actividad que no puede ser modelado por un proceso de decisión de Markov?
- ¿Existe algún modelo de aprendizaje profundo o algún otro método que ingrese como una colección de documentos y pueda predecir la probabilidad de un nuevo documento?
- Andrew Ng: ¿Qué opinas sobre el futuro del aprendizaje de Bayesian Networks?
- ¿Cuáles son los modelos de redes neuronales más básicos que un principiante debe aprender?
- ¿Qué métodos (sin supervisión) deberían usarse para la categorización jerárquica automática de documentos?