¿El aprendizaje de refuerzo se convertirá en un tema candente en ML después del éxito de AlphaGo? ¿Qué preguntas importantes de investigación en RL aún no tienen una buena respuesta?

El aprendizaje por refuerzo se ha vuelto cada vez más popular. http://Openai.com/gym también se muestra prometedor para hacer que RL sea más accesible. Sorprendentes resultados recientes como AlphaGo y jugar juegos de atari se atribuyen en gran medida al aprendizaje profundo en mis ojos, y esto puede continuar por un tiempo.

Para hacer que RL sea realmente atractivo, creo que necesitamos competencias (pagas) como kaggle, así como más investigaciones que traigan a RL más a la vista del público. En la industria, las aplicaciones de RL están bastante limitadas a empresas de investigación de primer nivel, robótica, militares y similares. Las compañías convencionales todavía están ocupadas construyendo su almacén de datos y analizándolas utilizando herramientas de Business Intelligence y Machine Learning básico. Quizás cuando RL madure para poder reemplazar varios trabajos de oficina, se calienta mucho.

More Interesting

¿Qué debo tomar Machine Learning o realidad aumentada?

¿Por qué el algoritmo AdaBoost es sensible a datos ruidosos y valores atípicos? ¿Y cómo?

¿Es posible tener experiencia en desarrollo web, desarrollo de Android, resolución de problemas, IA y ML para tener un buen trabajo, o solo necesito concentrarme en un campo y no fusionar campos?

¿Cuál es el beneficio de usar métodos de detección de comunidad gráfica sobre los enfoques de agrupación de datos y aprendizaje automático?

¿Cómo se usa el análisis de componentes principales en el procesamiento del lenguaje natural?

Un perceptrón multicapa tiene parámetros como el tamaño de un lote, épocas, neuronas, velocidad de aprendizaje, etc. ¿Cuáles son algunas experiencias prácticas de sintonización?

¿Cuáles son los siguientes pasos en el reconocimiento de voz después de extraer las funciones de MFCC?

Proporcione tres aplicaciones informáticas para las cuales el Aprendizaje automático parece apropiado y tres para las cuales parecen inapropiadas. ¿Incluya una justificación de sentencia para cada una?

¿En qué casos notamos un problema de gradiente que explota o desaparece y por qué?

¿Qué son las máquinas complejas?

Cómo aprender a crear un sistema óptico de reconocimiento de caracteres utilizando redes neuronales artificiales como mi mini proyecto

¿Puedo usar el algoritmo de aprendizaje automático en mi proyecto de investigación aunque no soy un experto en él?

¿Ha habido alguna investigación sobre cómo las pérdidas de capacitación en la convergencia de los algoritmos de aprendizaje profundo varían con el tamaño de los datos que ingresan?

¿Cómo se usa el aprendizaje automático en la generación de preguntas?

¿Qué tipo de problemas han funcionado bien con Bayesian Networks?