¿Cuáles son los grandes problemas en la inferencia variacional?

Probablemente alguien que conozca mucho mejor la literatura podría dar una mejor respuesta, pero hasta donde yo sé, los problemas más obvios son:

  • Es muy complicado. Necesita pasar mucho tiempo diseñando un esquema de inferencia y probándolo, etc. Para pequeños problemas, puede usar paquetes MCMC listos para usar para resolver el mismo problema, porque 8 horas de tiempo de cómputo es mucho más barato que 60 horas de uso humano. trabajo. Dicho esto, aparentemente las personas han estado trabajando para hacer que la inferencia variacional sea automática en ciertos tipos de problemas.
  • Depende de las propiedades de conjugación, por lo que si desea o necesita relajar algunas de estas condiciones, deberá utilizar un esquema de inferencia completamente nuevo. Hay algunas formas de evitarlo (por ejemplo, VB bajo la aproximación de Laplace), pero no creo que haya una solución general, ya que el objetivo de VB es mantener la capacidad de análisis, mientras que a algunas personas realmente no les importa o no quiero preocuparme por eso (por ejemplo, la tripulación de Andrew Gelman).
  • La inferencia variacional explota algo llamado ‘aproximación de campo medio’. Esta aproximación establece que los factores posteriores en un conjunto de componentes condicionalmente independientes o, si lo desea, aproxima la solución de un problema complejo con un ingenuo modelo tipo Bayes. Aunque eso tiene sentido en muchas situaciones, para algunos problemas complicados le preocupan las complejas interacciones de las características que está modelando. Por lo tanto, los métodos variacionales probablemente no sean suficientes.

More Interesting

¿Cómo puedo aprender ciencia de datos?

¿Cuándo recomendaría los modelos gráficos sobre el aprendizaje profundo?

Cómo probar la profundidad del fondo del procesamiento del lenguaje natural de alguien en una entrevista

¿Cuáles son las sinergias entre los estudios en Operaciones y Gestión de la Información y Ciencias de la Computación?

¿Hay alguna prueba de que no hay una solución algebraica para ajustar las redes neuronales con una (o más) capa (s) oculta (s)?

Como proyecto de graduación, elegimos hacerlo en el análisis de sentimientos de Twitter, tenemos algunos conceptos básicos de ML obtenidos de los MOOC, ¿a dónde deberíamos ir después?

¿Por qué algunos clasificadores no pueden manejar los atributos continuos?

Cómo probar la idoneidad de diferentes funciones del núcleo en un proceso gaussiano (GP) en el modelado de una función

¿Cuáles son los métodos de implementación con calidad de producción para los modelos de aprendizaje automático?

Visión por computadora: ¿cómo es la detección de objetos usando los puntos clave SIFT escala / rotacionalmente invariante?

¿Mejor ejecución de trabajos de Machine Learning directamente desde Pyspark o integración de scikit-learn en, a través del método de paralelización SparkContext?

Aprendizaje automático: ¿qué significa 'Los bosques aleatorios requieren casi ninguna preparación de entrada'?

¿Cuáles son los pros y los contras de los diversos algoritmos de clasificación de Tree Ensemble?

¿Existe algún conjunto de datos disponible públicamente para la clasificación étnica / nacionalidad de los nombres humanos?

¿Tiene sentido la regularización (L2, abandono, etc.) alguna vez para datos muy ruidosos, pero también abundantes, como series de tiempo financieras?