¿Hay algunos trabajos relacionados con el aprendizaje por refuerzo?

Si los hay. Incluso hay organizaciones de investigación con grandes grupos de investigadores que trabajan específicamente en el aprendizaje por refuerzo, como Deepmind y OpenAI.

Una búsqueda rápida en LinkedIn de ofertas de trabajo en todo el mundo con la palabra clave ‘aprendizaje de refuerzo’ introducida también me dio casi diez páginas de resultados válidos, con un poco más de veinte publicaciones por página. Eso es un montón de trabajos.

Sin embargo, las publicaciones que solicitan específicamente expertos en aprendizaje por refuerzo están dirigidas principalmente a investigadores . Otros tipos de listados que se ven en el sitio son para científicos de datos e ingenieros de aprendizaje automático , que parecen tener la palabra clave ingresada en la publicación como una ocurrencia tardía.

Pero en mi opinión, después del éxito de AlphaGo, las compañías han comenzado (correctamente) a darse cuenta de que el aprendizaje por refuerzo es algo emocionante que esperar en el futuro, a pesar de que las áreas de aplicaciones son actualmente limitadas.

Gracias por el A2A.

More Interesting

¿Qué tipo de algoritmo de aprendizaje profundo utiliza IBM Watson para la clasificación del lenguaje natural? ¿Utiliza CNN o RNN?

¿Cuáles son las similitudes y diferencias entre los campos aleatorios condicionales (CRF) y las redes de Markov de margen máximo (M3N)?

¿Cómo se implementa la funcionalidad de verificación de spam mediante el aprendizaje automático?

¿Por qué utilizamos núcleos en algunos modelos de aprendizaje automático?

¿Qué recomendarías, Machine Learning o DevOps?

¿Los programas de software de aprendizaje automático toman riesgos?

¿Cuál es la relación entre K-means y PCA?

¿Qué sugerencias le daría Roman Trusov a una persona que acaba de ingresar a ML?

¿Cuál es el peor caso de sobreajuste que hayas visto en entornos sociales o psicológicos?

Con el desarrollo de marcos informáticos escalables como TensorFlow y Spark, ¿seguirán siendo relevantes los marcos de una sola máquina? NumPy podría ser solo API.

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

¿Cuál es el tamaño de equipo típico para un proyecto de aprendizaje automático?

¿Qué tan importante es el aprendizaje profundo en la conducción autónoma?

Con respecto al descenso de gradiente funcional, ¿qué significa minimizar un funcional con respecto a una función? Proporcione un ejemplo claro.

¿Cuál es la diferencia entre optimización submodular y convexa?