Debido a que para llevar a cabo VI, debe elegir una clase de distribuciones que pueda aproximarse a alguna distribución desconocida P. El problema es que esta clase debe ser apropiada. Por ejemplo, si [matemática] P (X <0) = 0 [/ matemática], entonces [matemática] Q (X <0) [/ matemática] debería ser cero para cada Q en la clase que seleccionamos.
Déjame crear una viñeta para esto:
- [matemática] P [/ matemática] impone restricciones a las posibles [matemática] Q [/ matemática] que tendrían sentido como aproximaciones.
Un algoritmo que llevaría a cabo VI tendría que averiguar a partir de la información que tenemos sobre [matemáticas] P [/ matemáticas] cuál es la clase correcta de distribuciones para usar. No es inmediatamente obvio cómo incorporar este conocimiento específico del modelo en un programa.
- ¿Qué son los asombrosos papeles gráficos de conocimiento?
- ¿Son los modelos de n-gramas, la codificación de uno en caliente y word2vec diferentes tipos de representaciones de palabras y vectores de palabras?
- ¿Cuál es el propósito de usar un parámetro de penalización [matemática] C [/ matemática] en SVM?
- En el procesamiento del lenguaje natural para realizar análisis semántico, ¿es útil y necesario generar un árbol de análisis?
- ¿Es posible comenzar la investigación académica en matemáticas / aprendizaje automático sin la ayuda de un asesor? Está ocupado con su propuesta de subvención.
Sin embargo, esto no significa que no se pueda hacer nada; ver Inferencia variacional de caja negra. Esto se ha implementado en Stan.