¿Cuándo se ajusta bien un modelo de mezcla gaussiana?

Los modelos de mezclas tienen una variedad de aplicaciones, desde modelar texto hasta modelar tiempos de respuesta. He usado mezclas gaussianas para datos de tiempo de respuesta porque los tiempos de respuesta a menudo tienen modos múltiples que se pueden modelar bien con una mezcla. En un conjunto de datos, había tres modos diferentes que modelamos con una mezcla de tres gaussianos. Resultó que estos tres componentes se correspondían bien con una medida de edad (joven, mediana edad, edad) que estaba disponible.

En general, los modelos mixtos son muy útiles cuando está en presencia de una variable discreta o continua multimodal que desea modelar. Mi investigación utiliza modelos mixtos para resumir documentos como conjuntos de temas al modelar el uso de palabras como una mezcla de distribuciones multinomiales. Vea Blei et al., 2003 para una introducción seminal al modelado de temas si tiene curiosidad.

More Interesting

¿Cuáles son algunos marcos de tiempo realistas para dominar diversas habilidades de programación, como el dominio de Python para la ciencia de datos, git, etc.?

Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?

¿Cuáles son algunos documentos de investigación de inicio sobre búsqueda, aprendizaje automático y recuperación de información?

¿Podemos usar SGD para entrenar el modelo de mezcla, como GMM y movMF?

Quiero construir una copia casi perfecta de Eva de ex machina, entonces, ¿qué curso o área de informática necesito aprender profundamente?

¿Cómo utiliza Quora el aprendizaje automático en 2015?

Las entidades biológicas inconscientes que simplemente reaccionan automáticamente a su entorno han evolucionado y se han vuelto autoconscientes. ¿Qué impide que AI lo haga?

¿Cómo se siente la comunidad de aprendizaje automático sobre Kaggle?

¿Cuál es la conexión entre un modelo probabilístico y un gráfico en un modelo gráfico probabilístico?

¿Se utilizan algoritmos básicos de CS en el aprendizaje automático?

¿Es esta tabla Hoja de trucos de Machine Learning (para scikit-learn) una descripción precisa de cuándo se deben aplicar diferentes técnicas de aprendizaje automático?

¿Cuáles son algunos algoritmos de aprendizaje automático que puedo aprender sin cálculo?

¿Qué tiene de bueno la PNL?

¿Cuáles son algunas buenas ideas de proyectos en el área de análisis / predicción del mercado de valores utilizando Bayes ingenuo?

¿Cuál es la mejor base de datos para almacenar vectores de características de gran tamaño para su posterior recuperación y calcular las mediciones de distancia para la coincidencia de similitudes?