¿Cuál es el límite de variación, cuándo se usa y por qué es una buena aproximación?

No es “la” sino más bien “a”. Dejame explicar:

Los límites de variación son lo que obtenemos cuando unimos cantidades por funciones sobre algún conjunto. Por ejemplo, si [math] f, g [/ math] son ​​funciones y [math] F [/ math] es funcional, es decir, un mapa de algunas funciones en un conjunto, digamos, [math] C [/ math] , a números reales, luego supongamos que tenemos:

[matemáticas] f (x) \ geq F (g) (x) \ text {para todas las g en} C. \ tag {1} [/ matemáticas]

Como (1) es válido para todos [math] g [/ math] en ese conjunto, es natural pensar que si optimizamos el límite obtendremos un ajuste más ajustado en comparación con cualquier miembro individual del conjunto. Es decir,

[matemáticas] f (x) \ geq \ sup_ {g \ en C} F (g) (x). \ tag {2} [/ math]

El límite en (2) es un límite inferior variacional: el mejor límite que podemos obtener optimizando a través del conjunto [matemáticas] C [/ matemáticas] con esa función [matemáticas] F [/ matemáticas]. Como ejemplo, el ELBO, también conocido como evidencia de límite inferior [1], es un límite de la divergencia Kullback-Leibler sobre todas las distribuciones aproximadas [matemática] Q [/ matemática] y se usa en inferencia variacional.

Tales límites aparecen en las aplicaciones cuando ofrecen algo útil; El ELBO, por ejemplo, es útil porque se puede calcular mientras que el KL no.

En algunos casos, esos límites son aproximados pero pueden calcularse fácilmente, como el ELBO para familias de campo medio. En otros casos, como con la fórmula variacional de Donsker-Varadhan (ver Fórmulas 2.11–2.12 en la referencia), [2] la desigualdad es en realidad una igualdad sobre una clase lo suficientemente grande. Tampoco es fácil calcular la fórmula en ese caso.

Y este es el punto principal sobre los límites de variación: al ajustar el conjunto de funciones [matemáticas] C [/ matemáticas], podemos equilibrar la rigidez del límite con la computabilidad.

Notas al pie

[1] Bayes variacional y la evidencia límite inferior

[2] http://www.proba.jussieu.fr/page…