Se ha trabajado en el uso del muestreo de importancia en el aprendizaje por refuerzo y los sistemas de razonamiento contrafactual, pero no conozco ninguna aplicación directa en el aprendizaje profundo. Sin embargo, puedo especular sobre qué aplicaciones pueden basarse en lo siguiente.
La forma en que se presenta el muestreo de importancia es generalmente en términos de estimar el valor esperado de alguna función aleatoria f (x) bajo alguna distribución p (x) usando una función diferente f (x) * p (x) / q (x) bajo la distribucion q esta vez. Pero hay otra forma. El valor esperado de una función bajo alguna distribución de probabilidad es solo la integral (o suma si la variable es discreta) de f (x) * p (x) sobre x. Tales integrales o sumas se pueden estimar usando “reglas de cuadratura” como Gauss Kronrod, etc. Incluso las simulaciones de Monte Carlo pueden (en un sentido muy específico que no profundizaré aquí) como reglas de cuadratura. El muestreo de importancia es solo otra regla de cuadratura donde el peso de la regla de cuadratura se cambia de p (x) a q (x).
¿Cómo se vincula esto con el aprendizaje profundo? En redes neuronales profundas, cada capa oculta calcula una suma de funciones de activación ponderadas (o una función de activación de una suma ponderada). Si piensa en el resultado deseado como el “valor correcto” de una suma, entonces el propósito completo del aprendizaje profundo es determinar los pesos óptimos para incluir en la suma para obtener el valor correcto.
- Modelos ocultos de Markov: ¿cómo se obtiene el siguiente valor observado pronosticado de un HMM?
- ¿Cuál es el beneficio de utilizar la agrupación promedio en lugar de la agrupación máxima?
- ¿Por qué el núcleo RBF (función de base radial) se asigna al espacio dimensional infinito, mencionado muchas veces en las conferencias de aprendizaje automático?
- Cómo usar el codificador automático de Geoffrey Hinton para datos MNIST para clasificar dígitos
- ¿Cuál es el uso de una capa de disminución de resolución en una red neuronal convolucional (CNN)?
Quizás una aplicación de muestreo importante podría ser determinar la forma óptima de elegir pesos aleatorios en una red neuronal profunda (supervisada) dada … ¡Solo un pensamiento!