¿Qué son las redes de iteración de valor?

Aquí hay un buen resumen del documento de aprendizaje profundo (NIPS 16) a través de [correo electrónico protegido] :

Redes de iteración de valor • r / MachineLearning

“Su contribución es ofrecer una nueva forma de pensar sobre VI en el contexto de redes profundas. Muestra cómo se puede secuestrar la arquitectura CNN para implementar el operador de optimización de Bellman, y cómo se puede usar la señal de backprop para aprender un modelo determinista del MDP subyacente. A corto plazo, creo que el documento atraerá a muchos investigadores profundos que de otra manera serían reacios a tratar explícitamente con MDP / RL. Como señalan los autores, la red VI también se puede usar como una política por sí sola, y podría combinarse con, digamos, un gradiente de política determinista. ”

Y aquí hay una introducción rápida a la iteración de valor (VI) en el aprendizaje por refuerzo: http://uhaweb.hartford.edu/comps…

More Interesting

¿Cómo combinaría Apache Spark y CUDA para implementar un marco de aprendizaje profundo?

¿Qué métodos de conjunto / aprendizaje automático pueden incorporar covariables que varían con el tiempo?

¿Cómo aprendo estadísticas y probabilidad de aprendizaje automático?

¿Qué piensa Pedro Domingos de la investigación de aprendizaje automático que está ocurriendo en la industria versus la academia?

¿Se ha realizado algún trabajo para hacer que la regresión lineal sea amigable para el laico?

Como aprender redes neuronales

Cómo adaptar el filtrado colaborativo para un sistema de recomendación si solo tiene datos de compra a nivel de pedido y no datos a nivel de usuario

¿Qué es un buen marco de visualización de datos en tiempo real?

¿Cuáles son los campos de negocios donde se puede usar la red neuronal?

En vista de los nuevos temas de TI (AI, IoT, datos grandes / rápidos, análisis, blockchain, etc.), ¿hay alguna ventaja en aprender la programación de Python?

¿Cuál es la diferencia entre un enfoque de bandido multi-armado y el control estocástico?

¿Cuál es una forma intuitiva de explicar los resultados de la PCA?

¿Debo hacer un gran proyecto de investigación de aprendizaje profundo con mi propio dinero (y tiempo), sin que me paguen, solo para que alguien pueda contratarme debido al trabajo?

¿Cuáles son las mejores fuentes para aprender el aprendizaje automático y el procesamiento del lenguaje natural?

Cómo hacer la clasificación y agrupamiento de documentos en rapidMiner