¿Qué significa una probabilidad gaussiana en el clasificador bayesiano ingenuo gaussiano?

En resumen, “probabilidad gaussiana” se refiere a la probabilidad condicional del valor de la característica dada una etiqueta de clase como aproximada por la distribución condicional ajustada a esa característica durante el entrenamiento. Para ser más específicos, la probabilidad es la altura de la función de densidad de probabilidad (PDF) de esa distribución en el valor de la característica en cuestión. Se denomina probabilidad “gaussiana” porque el clasificador gaussiano Naive Bayes estándar modela todas las características continuas utilizando distribuciones gaussianas.

El clasificador gaussiano Naive Bayes utiliza alturas condicionales de PDF en lugar de las probabilidades condicionales utilizadas por el clasificador estándar Naive Bayes en su tratamiento de variables categóricas. Hacerlo puede parecer matemáticamente dudoso, pero resulta tener una base rigurosa. Su justificación se reduce a aproximaciones integrales. Para obtener la probabilidad de un valor de variable específico del PDF continuo de la variable, integre el PDF alrededor del valor en cuestión durante un intervalo de ancho epsilon, y tome el límite de esa integral a medida que epsilon se acerca a 0. Para epsilon pequeño, esta integral será ser equivalente al producto de epsilon y la altura del PDF en el valor variable en cuestión. Normalmente, el límite de esta expresión sería 0 cuando epsilon se acercó a 0. Sin embargo, el clasificador Naive Bayes usa razones de probabilidades condicionales para hacer predicciones y no las probabilidades condicionales en sí. Debido a que tanto el numerador como el denominador de una razón de probabilidades condicionales incluirán un factor de épsilon, estos factores de épsilon se cancelan. Como resultado, el límite de la razón de probabilidades condicionales será equivalente a la razón de las alturas de PDF en el valor variable en cuestión. Si está interesado en una explicación larga y rigurosa, consulte mi respuesta a (¿Cómo puedo?) ¿Debería crear un modelo Naive Bayes con diferentes distribuciones de características?