Un modelo de mezcla gaussiana puede verse como una mezcla de poblaciones heterogéneas cuya media subyacente sigue una distribución gaussiana. Vea la respuesta de Hongsun Kim a ¿Cuál es un ejemplo de aplicación en el mundo real de los modelos de mezcla gaussiana?
La respuesta anterior debería explicar un poco de la aplicación en el mundo real de la mezcla gaussiana y algo de la intuición. Al ajustar los datos, se espera que una estadística como, por ejemplo, el peso, siga una distribución normal. Sin embargo, al trazar los datos empíricos, si el gráfico parece tener una curtosis más alta que una distribución gaussiana estándar o es multimodal, existe una gran posibilidad de que la distribución de peso (en este ejemplo) pueda modelarse como un modelo de mezcla gaussiana.
Una distribución de mezcla tendrá una curtosis más alta que las distribuciones gaussianas individuales que componen la mezcla. Esta es una de las razones por las que la distribución t de Student tiene colas más pesadas (curtosis más alta) que una distribución gaussiana con igual media y desviación estándar. La distribución t de Student es una mezcla continua de distribuciones gaussianas (una mezcla infinita de distribuciones gaussianas). Por lo tanto, tiene una curtosis más alta dada una media igual y una desviación estándar.
- ¿Qué empresas / startups en India están contratando para trabajos de ciencia de datos, análisis de datos o aprendizaje automático?
- ¿Debo aprender Blockchain (Ethereum) o aprendizaje automático este verano?
- ¿Cuándo debo usar la similitud de coseno? ¿Se puede usar para agrupar?
- ¿Cómo decidimos qué algoritmo usar en el aprendizaje automático?
- ¿Cuáles son tus artículos favoritos de NIPS 2016?
Se puede usar una mezcla de distribuciones gaussianas para modelar poblaciones tan heterogéneas, y será más preciso al modelar dichas poblaciones. Sin embargo, siempre que sea posible y suficiente para hacerlo, un modelo gaussiano estándar debería servir como punto de referencia para los medios de estadísticas como la altura y el peso. La precisión y la complejidad del modelo deben tenerse en cuenta con la precisión suficiente que está tratando de lograr, un concepto estadístico conocido como parsimonia.