¿Cuál es la desventaja de usar ADVI?

Transforma los parámetros para tener soportes de línea reales pero no sabe cómo afectará eso a la estimación. Además, como señala el documento, la transformación no es única, por lo que debe elegir una sin saber cuál es mejor. Por supuesto, puede generar datos falsos y comparar esas transformaciones, pero realmente, quién sabe cómo serían los datos reales. Carece de soporte matemático en ese sentido.

Aparte de eso, como dice el nombre ADVI, se basa en la ‘diferenciación automática’ que funciona un poco más lento que los derivados codificados a mano. Pero esta parte generalmente se ignora porque el cálculo analítico de derivados a mano lleva mucho tiempo y es mucho más propenso a errores que AD.

Además de la falta de análisis de sensibilidad para las transformaciones de parámetros, creo que es una herramienta ML muy prometedora y flexible para tener en su caja de herramientas.

Aprendizaje automáticoInferencia bayesiana

Related Content

¿Cuáles son algunas posibles aplicaciones interesantes del aprendizaje automático?

¿Existen aplicaciones prácticas útiles y serias de redes neuronales que se ejecutan localmente en aplicaciones de teléfonos inteligentes móviles?

¿Por qué Bayes ingenuo se considera un modelo generativo?

¿Por qué las técnicas de optimización como el gradiente natural y los métodos de segundo orden (L-BFGS por ejemplo) no se usan mucho en el aprendizaje profundo?

¿Qué piensa sobre los procesos gaussianos profundos?

¿Cómo están revolucionando las redes neuronales convolucionales la visión por computadora?

Cómo agregar blogs en sitios web

More Interesting

¿Cómo se entrenan las redes estocásticas generativas?

¿Cuáles son algunas publicaciones importantes en estadísticas bayesianas?

¿Cuáles son algunos buenos documentos sobre la extracción de sinónimos de los registros de consultas?

¿Es posible utilizar el aprendizaje automático en la votación para que podamos incluir las razones de los votantes en lugar de sí / no?

¿Hay un grupo de investigadores trabajando en la síntesis de texto EEG (conversión de pensamiento a texto)?

¿Cómo se hace la inferencia en una red neuronal con capas de normalización por lotes?

¿Cuál es la mejor manera de hacer un análisis de sentimientos de los datos de Facebook en Java?

¿Cómo se explica el aprendizaje automático y la inteligencia artificial a un niño de 5 años?

Estoy creando un plan de enrutamiento de vehículos con la ruta y el costo más bajos. ¿Sería más significativo el agrupamiento k-k o los vecinos k-más cercanos?

¿Cómo se diseñan las redes neuronales artificiales y qué teoremas académicos las respaldan?

¿En qué se diferencia un autoencoder (apilado) de un MLP, aparte de que los autoencoders aprenden funciones de identidad aproximadas?

¿Cuál es la mejor manera de implementar un SVM usando Hadoop?

Para un problema de clasificación (dos clases), ¿es mejor usar dos salidas con softmax o una salida con entropía cruzada binaria?

¿Por qué todavía necesitamos aprender Minería de datos cuando tenemos Mahout?

¿Dónde debo comenzar si quiero escribir un algoritmo de etiquetado y clasificación de oraciones?

Web Analytics