¿Qué es un modelo de mezcla de Bernoulli?

Una distribución de Bernoulli modela un proceso donde cada muestra tiene probabilidad q de salir como 1 y probabilidad 1-q de salir como 0.

Un modelo de mezcla es un modelo estadístico que asume que sus muestras provienen de diferentes subpoblaciones. Cada subpoblación tiene una distribución de probabilidad [matemática] p_i [/ ​​matemática]. Cada una de estas poblaciones es responsable de una fracción de las muestras [math] w_i [/ ​​math], de modo que [math] \ sum_i w_i = 1 [/ math]

El modelo de mezcla proporciona una distribución de probabilidad para toda la población igual a:

[matemáticas] p (X = x) = \ sum_i w_i \ cdot p_i (X = x) [/ matemáticas]

Por lo general, uno tiene observaciones de toda la población y quiere determinar los parámetros del modelo (es decir, las distribuciones y los pesos de cada subpoblación).

En el caso de un modelo de mezcla de Bernoulli, se supone que cada una de las poblaciones está representada por una distribución de Bernoulli, por lo que

[matemáticas] p_i (X = x) = q_i ^ x \ cdot (1-q_i) ^ {(1-x)} [/ matemáticas]

[matemáticas] x \ in \ {0,1 \}, q_i \ in [0,1] [/ matemáticas]

Si quieres intuir lo que esto representa, imagina que tienes N juegos de suerte (jugar dados, ruleta, etc.) en un casino. Este casino tiene mesas [math] t_i [/ ​​math] para jugar el juego i y en este juego tienes una probabilidad [math] q_i [/ ​​math] de ganar. Si quieres divertirte al azar, puedes repetir estos pasos indefinidamente:
-> Elige una mesa aleatoria de manera uniforme
-> Juega el juego en esa mesa una vez

La probabilidad de que ganes una ronda viene dada por un modelo de mezcla de Bernoulli con pesos [math] w_i = \ frac {t_i} {\ sum_i t_i} [/ math] y la probabilidad de éxito [math] q_i [/ ​​math] para cada uno Las subpoblaciones.

Si hace un poco de matemática, puede ver que esto no es muy interesante porque la probabilidad de éxito del modelo de mezcla es simplemente:

[matemáticas] p (X = 1) = \ sum_i w_i \ cdot q_i [/ ​​matemáticas]

que es equivalente a una sola variable aleatoria de Bernoulli cuya probabilidad de éxito es el promedio ponderado de las probabilidades de éxito de cada subpoblación.

En otras palabras, jugar en este emocionante casino o en un casino que tiene una sola mesa te da el mismo resultado. Puede decir que el modelo de mezcla de Bernoulli y una sola variable aleatoria de Bernoulli son indistinguibles.

Si en lugar de considerar una sola variable aleatoria de Bernoulli, considera un vector de Bernoulli (es decir, un vector aleatorio con dimensión M, donde cada uno de los componentes se distribuye como Bernoulli), el modelo de mezcla se vuelve más interesante. Aunque cada uno de los componentes del vector sigue siendo un Bernoulli, el modelo de mezcla puede codificar interacciones entre los diferentes componentes. Vea este artículo para un ejemplo.

More Interesting

¿Dónde puedo encontrar modelos de temas previamente capacitados para MALLET?

¿Cómo utilizan las empresas los algoritmos de IA en aplicaciones prácticas?

¿Cómo se puede utilizar el aprendizaje profundo TensorFlow para la detección de anomalías?

¿Qué es mejor, el algoritmo de vecinos más cercanos a k (k-NN) o el clasificador de máquina de vectores de soporte (SVM)? ¿Qué algoritmo se usa principalmente en la práctica? ¿Qué algoritmo garantiza una detección confiable en situaciones impredecibles?

¿Cuáles son las principales conferencias sobre inteligencia artificial, procesamiento del lenguaje natural y aprendizaje automático?

¿Por qué NP = P es tan difícil de resolver?

¿Por qué es tan difícil automatizar la inferencia variacional?

¿Puedo usar el aprendizaje automático para pronosticar datos de series temporales para puntos de datos discretos dispersos?

¿Cuántos documentos son suficientes para estudiar para escribir una encuesta sobre aprendizaje profundo?

¿Cuáles son las definiciones de entrada, salida y destino en el aprendizaje automático?

¿Cuál es una pista adecuada para la clasificación de documentos con MATLAB?

¿Qué es más beneficioso para la comprensión general de la informática, el procesamiento del lenguaje natural o la teoría de la computación?

¿Por qué está disminuyendo el número de concursos públicos de Kaggle con premios en efectivo?

Cómo manejar múltiples funciones usando SVM en visión artificial

¿Qué hace que una computadora sea única? ¿Es el HDD? Si es así, ¿eliminarlo y ponerlo en otra máquina hace que esa máquina sea la misma que la original?