¿Cuáles son algunas aplicaciones de muestreo de importancia en Deep Learning?

Se ha trabajado en el uso del muestreo de importancia en el aprendizaje por refuerzo y los sistemas de razonamiento contrafactual, pero no conozco ninguna aplicación directa en el aprendizaje profundo. Sin embargo, puedo especular sobre qué aplicaciones pueden basarse en lo siguiente.

La forma en que se presenta el muestreo de importancia es generalmente en términos de estimar el valor esperado de alguna función aleatoria f (x) bajo alguna distribución p (x) usando una función diferente f (x) * p (x) / q (x) bajo la distribucion q esta vez. Pero hay otra forma. El valor esperado de una función bajo alguna distribución de probabilidad es solo la integral (o suma si la variable es discreta) de f (x) * p (x) sobre x. Tales integrales o sumas se pueden estimar usando “reglas de cuadratura” como Gauss Kronrod, etc. Incluso las simulaciones de Monte Carlo pueden (en un sentido muy específico que no profundizaré aquí) como reglas de cuadratura. El muestreo de importancia es solo otra regla de cuadratura donde el peso de la regla de cuadratura se cambia de p (x) a q (x).

¿Cómo se vincula esto con el aprendizaje profundo? En redes neuronales profundas, cada capa oculta calcula una suma de funciones de activación ponderadas (o una función de activación de una suma ponderada). Si piensa en el resultado deseado como el “valor correcto” de una suma, entonces el propósito completo del aprendizaje profundo es determinar los pesos óptimos para incluir en la suma para obtener el valor correcto.

Quizás una aplicación de muestreo importante podría ser determinar la forma óptima de elegir pesos aleatorios en una red neuronal profunda (supervisada) dada … ¡Solo un pensamiento!

More Interesting

¿Cómo se recupera la información de las cajas negras?

¿Qué debo usar para el aprendizaje automático si necesito una solución rápida: Python, R o SAS?

¿Soy un desarrollador de dinosaurios si no uso Github, no conozco CI / CD y docker y solo conozco el aprendizaje profundo de la palabra de moda?

RNN para modelado de idiomas en Tensorflow. ¿Cómo puedo rellenar las secuencias si mi entrada está constituida por la incorporación de palabras?

Cómo construir la matriz del núcleo para un polinomio de grado finito

¿Qué debo leer para desarrollar un rastreador web que raspe un subconjunto de Internet y me brinde los enlaces de los sitios web que son tiendas de abarrotes?

¿Cómo puedo comenzar a usar métodos de "generalización apilada" en Python para las competencias de Kaggle?

¿Qué técnicas utilizadas en el procesamiento del lenguaje natural son aplicables a otras áreas del aprendizaje automático?

¿Cuál es la mejor manera de aprender la regresión logística?

Durante la validación cruzada k-fold, ¿cuáles son algunas soluciones posibles cuando la varianza de las estimaciones de error de prueba es muy alta?

¿Puede el aprendizaje automático ayudarnos a comprender el cerebro humano?

Aprendizaje automático: ¿es el enfoque descrito a continuación una buena forma de evaluar la calidad de las recomendaciones basadas en comentarios implícitos?

¿Será el hardware especializado para el aprendizaje profundo un cambio de juego?

¿Son las redes de tipo neuronal el único juego real en la ciudad o podemos desarrollar máquinas sofisticadas de IA que no piensen como los humanos?

¿Cómo creo un conjunto de datos como MNIST para reconocer caracteres de otro idioma? Tengo un conjunto de datos como una carpeta de imágenes. ¿Cómo uso eso en Tensorflow?