¿Qué tan bueno es el ADVI en STAN en la práctica? La tecnología cambia la vida futura

¿Qué tan bueno es el ADVI en STAN en la práctica?

No lo he probado, así que toma lo que digo con un grano de sal. Aunque he leído el periódico. Es una gran contribución, y noté algunas ventajas:

El principal profesional es que la cantidad de codificación e incluso el pensamiento que tienes que hacer es pequeña, lo cual es bastante sorprendente.
su método le permite hacer inferencia con solo una muestra por iteración, lo que sugiere que es un método muy eficiente.

Hay dos inconvenientes que recuerdo:

Limitan el número de posteriores variacionales que puede caber. Se ajustan a un gaussiano en un espacio transformado, que no es gaussiano cuando se transforma de nuevo al espacio original, pero no puede ajustarse a su posterior variacional de elección. actualización: parece que no entendí su método correctamente. Esto no estaba claro en el documento de NIPS, pero en su artículo de diario, muestran que estas transformaciones pueden aproximarse bastante bien a la mayoría de las distribuciones continuas paramétricas (es decir, un Gamma).
Asumen una distribución totalmente factorizada en el espacio transformado, es decir, todos los componentes son independientes. En la práctica, es posible que no desee eso para poder capturar la covarianza entre los parámetros. u pdate : en el periódico ya no parecen asumir esto.

Para muchos modelos, probablemente no verá un rendimiento tan bueno como obtener las actualizaciones a mano, y si mira las revisiones de NIPS, lo admiten. Sin embargo, lo que puede hacer con él, lo cual es genial, es aplicar métodos VI en su conjunto de datos de elección de manera rápida y sin dolor. Si necesita una mayor precisión, puede intentar codificar uno de los otros métodos VI (aunque creo que BBVI también puede implementarse en STAN, no estoy seguro de cuán flexible es o si es tan fácil de usar), o si su conjunto de datos no es t demasiado grande y su modelo es apto para ello, también puede hacer muestras de gibbs utilizando STAN.

Aprendizaje automáticoestadísticasInferencia bayesianainformática