Cómo obtener todos los problemas de investigación en el aprendizaje por refuerzo

A2A.

Además del punto de Francisco. Parece que eres nuevo en RL, así que lee sobre los recursos que él proporcionó.

También recomendaría el libro de Barto sobre programación dinámica aproximada (Manual de aprendizaje y programación dinámica aproximada).

¿Qué es mejor para mí como estudiante? ¿Debería codificar los modelos de aprendizaje automático (donde pueda) o debería usar la biblioteca tanto como pueda?
¿Qué tan difícil es aprender el aprendizaje automático y el aprendizaje profundo si tienes un trabajo diario?
¿Cuál es la forma óptima de almacenar y cargar un gran conjunto de datos de imágenes?
¿Hay algún instituto que ofrezca aprendizaje automático?
¿Cómo podemos hacer que las redes profundas funcionen de manera eficiente en dispositivos de baja potencia (por ejemplo, teléfonos)?

Si desea hacer un RL profundo, también necesitará aprender un poco sobre el aprendizaje profundo. (Aprendizaje profundo: Ian Goodfellow, Yoshua Bengio, Aaron Courville: 9780262035613: Libros)

Para los temas que son áreas de investigación activas actuales (en profundidad RL ), puede ir a google scholar / google algunos de estos puntos (no todo, justo fuera de mi cabeza):

RL basado en modelos (utilizando redes profundas como modelos: VAE / GAN)
Mejora de la eficiencia de la muestra (mejora del algoritmo, mejora de la red / aprendizaje de una sola vez, mejor exploración, red de memoria externa ??)
RL jerárquico / opciones
aprendizaje multitarea / de por vida
multi-agente RL

Aprendizaje automáticoAprendizaje por refuerzoInteligencia ArtificialInvestigación

¿Cuáles son las aplicaciones más prometedoras de ML / AI en el cuidado de la salud, excluyendo la informática de imágenes?

¿Cuáles son las diferencias entre Apache Spark y el Tensor Flow de Google?

¿Cuál es el mejor curso para especializarse en inteligencia artificial y aprendizaje automático?

¿Cuáles son algunas falacias o errores comunes cometidos por los principiantes en estadística, aprendizaje automático y análisis de datos?

¿Qué proveedores de servicios de Internet están disponibles además de Comcast o U-verse en los Estados Unidos?

¿Cuáles son algunos proyectos geniales de aprendizaje automático que ha creado?

No creo que haya otra forma de hacerlo, sino familiarizarse con el trabajo.
Si eres nuevo en RL, comienza con el libro RL de Sutton y Barto, que te dará los fundamentos. Luego, comience a leer la investigación de algunos de los autores más influyentes en el campo: Rivh Sutton, Andy Barto, Doina Precup, Satinsder Singh, Phil Thomas, Jan Peters, David Silver … podría estar olvidando a otros autores prominentes, pero eso es suficiente para llevarte por el camino correcto.

Francisco García

More Interesting

¿Pueden los algoritmos de aprendizaje automático realmente ayudar en el comercio?

Cómo garantizar que la función SIFT sea invariante en perspectiva

¿Cómo debe un principiante en Machine Learning enfocar una declaración de problema?

¿Podemos usar variador automático para aprender una representación como el autoencoder de vainilla?

¿Dónde puedo encontrar un código de Python para SVM que use datos de funciones múltiples?

¿Cuáles son algunas razones por las que algunas personas prefieren R y Matlab a Python para el aprendizaje automático?

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar "imágenes de Google", me preguntó: "¿Quiso decir: imágenes de Google?".

¿Qué algoritmo de aprendizaje automático usarías para analizar los datos de los alumnos?

¿Cómo uso la regresión logística si la variable dependiente tiene más de 2 dimensiones?

Cómo construir sobre modelos de red profunda de detección de objetos pre-entrenados (YOLO) para detectar nuevas clases