No lo he probado, así que toma lo que digo con un grano de sal. Aunque he leído el periódico. Es una gran contribución, y noté algunas ventajas:
- El principal profesional es que la cantidad de codificación e incluso el pensamiento que tienes que hacer es pequeña, lo cual es bastante sorprendente.
- su método le permite hacer inferencia con solo una muestra por iteración, lo que sugiere que es un método muy eficiente.
Hay dos inconvenientes que recuerdo:
- Limitan el número de posteriores variacionales que puede caber. Se ajustan a un gaussiano en un espacio transformado, que no es gaussiano cuando se transforma de nuevo al espacio original, pero no puede ajustarse a su posterior variacional de elección. actualización: parece que no entendí su método correctamente. Esto no estaba claro en el documento de NIPS, pero en su artículo de diario, muestran que estas transformaciones pueden aproximarse bastante bien a la mayoría de las distribuciones continuas paramétricas (es decir, un Gamma).
- Asumen una distribución totalmente factorizada en el espacio transformado, es decir, todos los componentes son independientes. En la práctica, es posible que no desee eso para poder capturar la covarianza entre los parámetros. u pdate : en el periódico ya no parecen asumir esto.
Para muchos modelos, probablemente no verá un rendimiento tan bueno como obtener las actualizaciones a mano, y si mira las revisiones de NIPS, lo admiten. Sin embargo, lo que puede hacer con él, lo cual es genial, es aplicar métodos VI en su conjunto de datos de elección de manera rápida y sin dolor. Si necesita una mayor precisión, puede intentar codificar uno de los otros métodos VI (aunque creo que BBVI también puede implementarse en STAN, no estoy seguro de cuán flexible es o si es tan fácil de usar), o si su conjunto de datos no es t demasiado grande y su modelo es apto para ello, también puede hacer muestras de gibbs utilizando STAN.
- ¿Es útil para un científico de datos conocer métodos ágiles como Scrum?
- ¿Cómo podemos estimar múltiples parámetros de un clasificador?
- ¿En qué problemas sería buena / mala una máquina neural de Turing?
- ¿Cuál es el mejor clasificador que puedo usar en 'Reconocimiento facial en tiempo real' después de extraer funciones usando 'Alexnet'?
- ¿Qué es la recuperación de información? ¿Qué tan relacionado está con el análisis de datos y el aprendizaje automático?