¿El aprendizaje de refuerzo se convertirá en un tema candente en ML después del éxito de AlphaGo? ¿Qué preguntas importantes de investigación en RL aún no tienen una buena respuesta?

El aprendizaje por refuerzo se ha vuelto cada vez más popular. http://Openai.com/gym también se muestra prometedor para hacer que RL sea más accesible. Sorprendentes resultados recientes como AlphaGo y jugar juegos de atari se atribuyen en gran medida al aprendizaje profundo en mis ojos, y esto puede continuar por un tiempo.

Para hacer que RL sea realmente atractivo, creo que necesitamos competencias (pagas) como kaggle, así como más investigaciones que traigan a RL más a la vista del público. En la industria, las aplicaciones de RL están bastante limitadas a empresas de investigación de primer nivel, robótica, militares y similares. Las compañías convencionales todavía están ocupadas construyendo su almacén de datos y analizándolas utilizando herramientas de Business Intelligence y Machine Learning básico. Quizás cuando RL madure para poder reemplazar varios trabajos de oficina, se calienta mucho.

Related Content

¿Cuál es el significado de los recientes anuncios de aprendizaje automático de código abierto?

¿Cuándo necesitamos tener un mayor número de unidades ocultas que el número de unidades de entrada y viceversa?

¿Cuáles podrían ser las características posibles para detectar fraude en transacciones en cajeros automáticos?

¿Cuándo debo coseno similitud? ¿Se puede usar para la agrupación?

¿Cuáles son las ventajas de usar una representación escasa en el aprendizaje automático, especialmente en los modelos de aprendizaje profundo?

¿Es cierto que los ingenieros tienen mayores posibilidades de convertirse en multimillonarios?

¿Qué podríamos hacer con Asimo si la computadora dentro estuviera con el poder de la caja de aprendizaje profundo Nvidia DGX-1?

More Interesting

¿Qué debo tomar Machine Learning o realidad aumentada?

¿Por qué el algoritmo AdaBoost es sensible a datos ruidosos y valores atípicos? ¿Y cómo?

¿Es posible tener experiencia en desarrollo web, desarrollo de Android, resolución de problemas, IA y ML para tener un buen trabajo, o solo necesito concentrarme en un campo y no fusionar campos?

¿Cuál es el beneficio de usar métodos de detección de comunidad gráfica sobre los enfoques de agrupación de datos y aprendizaje automático?

¿Cómo se usa el análisis de componentes principales en el procesamiento del lenguaje natural?

Un perceptrón multicapa tiene parámetros como el tamaño de un lote, épocas, neuronas, velocidad de aprendizaje, etc. ¿Cuáles son algunas experiencias prácticas de sintonización?

¿Cuáles son los siguientes pasos en el reconocimiento de voz después de extraer las funciones de MFCC?

Proporcione tres aplicaciones informáticas para las cuales el Aprendizaje automático parece apropiado y tres para las cuales parecen inapropiadas. ¿Incluya una justificación de sentencia para cada una?

¿En qué casos notamos un problema de gradiente que explota o desaparece y por qué?

¿Qué son las máquinas complejas?

Cómo aprender a crear un sistema óptico de reconocimiento de caracteres utilizando redes neuronales artificiales como mi mini proyecto

¿Puedo usar el algoritmo de aprendizaje automático en mi proyecto de investigación aunque no soy un experto en él?

¿Ha habido alguna investigación sobre cómo las pérdidas de capacitación en la convergencia de los algoritmos de aprendizaje profundo varían con el tamaño de los datos que ingresan?

¿Cómo se usa el aprendizaje automático en la generación de preguntas?

¿Qué tipo de problemas han funcionado bien con Bayesian Networks?

Web Analytics