A2A.
Además del punto de Francisco. Parece que eres nuevo en RL, así que lee sobre los recursos que él proporcionó.
También recomendaría el libro de Barto sobre programación dinámica aproximada (Manual de aprendizaje y programación dinámica aproximada).
- ¿Qué es mejor para mí como estudiante? ¿Debería codificar los modelos de aprendizaje automático (donde pueda) o debería usar la biblioteca tanto como pueda?
- ¿Qué tan difícil es aprender el aprendizaje automático y el aprendizaje profundo si tienes un trabajo diario?
- ¿Cuál es la forma óptima de almacenar y cargar un gran conjunto de datos de imágenes?
- ¿Hay algún instituto que ofrezca aprendizaje automático?
- ¿Cómo podemos hacer que las redes profundas funcionen de manera eficiente en dispositivos de baja potencia (por ejemplo, teléfonos)?
Si desea hacer un RL profundo, también necesitará aprender un poco sobre el aprendizaje profundo. (Aprendizaje profundo: Ian Goodfellow, Yoshua Bengio, Aaron Courville: 9780262035613: Libros)
Para los temas que son áreas de investigación activas actuales (en profundidad RL ), puede ir a google scholar / google algunos de estos puntos (no todo, justo fuera de mi cabeza):
- RL basado en modelos (utilizando redes profundas como modelos: VAE / GAN)
- Mejora de la eficiencia de la muestra (mejora del algoritmo, mejora de la red / aprendizaje de una sola vez, mejor exploración, red de memoria externa ??)
- RL jerárquico / opciones
- aprendizaje multitarea / de por vida
- multi-agente RL