¿Cuál es una explicación intuitiva de un ingenuo clasificador de Bayes?

Naive Bayes es básicamente un conteo avanzado. Imaginemos que estamos tratando de clasificar si jugar al golf, y observamos dos atributos: el clima (soleado, nublado, lluvioso) y la temperatura (caliente, medio, frío, bajo cero).

Los ingenuos Bayes se pueden representar como canicas que se colocan en cajas. En total para este problema tenemos 14 cajas.

  Sunny-Play, Overcast-Play, Raining-Play
 Hot-Play, Medium-Play, Cold-Play, Sub-Zero-Play
 Sunny-NoPlay, Overcast-NoPlay, Raining-NoPlay
 Hot-NoPlay, Medium-NoPlay, Cold-NoPlay, Subzero-NoPlay

Cada vez que vemos un ejemplo, ponemos algunas canicas en las cajas. Si vemos un ejemplo de entrenamiento, colocamos algunas canicas en algunas cajas. Por ejemplo, si vemos un día soleado y caluroso con la etiqueta “Play”, colocamos una canica en la casilla Sunny-Play y una canica en la casilla Hot-Play.

Digamos que después de 20 ejemplos de “Jugar” y 20 ejemplos de “No jugar”, el conteo de canicas se ve así:

  Sunny-Play: 15
 Overcast-Play: 4
 Lluvia-Juego: 1

 Juego caliente: 7
 Juego medio: 7 
 Juego en frío: 5
 Juego bajo cero: 1

 Sunny-NoPlay: 2
 Overcast-NoPlay: 8 
 Raining-NoPlay: 10 

 Hot-NoPlay: 4 
 Medium-NoPlay: 4
 Cold-NoPlay: 6
 Subzero-NoPlay: 6

Ahora, para ver un ejemplo, hago una suposición de independencia condicional, en otras palabras P (juego | clima, temperatura) = P (juego | clima) P (juego | temperatura).

¡Eso significa que todo lo que necesito hacer para resolver la clase es multiplicar! Digamos que tengo un día lluvioso y frío.

Puntuación de juego = 1 * 5 = 5.

Puntuación de no jugar = 10 * 6 = 60.

Entonces elegiríamos no jugar. ¡Todo lo que hicimos fue contar canicas y tenemos un clasificador!

Algunas notas sobre cómo falta esta analogía:

  • Esto ignora la normalización y supone números iguales de ambas clases, tendría que incluir un factor de ajuste adicional.
  • Esto no incluye cosas como la corrección de Laplace (por ejemplo, si nunca ve un día bajo cero).
  • Un ejercicio interesante es comparar esto con el clasificador óptimo bayesiano. Eso tendría 24 cajas en lugar de 14. Pero eso queda para otra pregunta :-).

More Interesting

¿Debo saber Python y R para aprender Machine Learning?

¿Cómo ha sido su experiencia en Quora con Computer Vision y la comunidad relacionada?

¿Cómo funciona el sistema de clasificación de Aarne-Thompson?

¿Puede el aprendizaje automático desarrollar el gusto?

¿Puedo aprender ML por mi cuenta?

¿Cómo reconoce la red neuronal convolucional los objetos de las imágenes sin la percepción o reconocimiento 3D?

¿Qué tipo de servicio suele ofrecer el inicio del procesamiento del lenguaje natural?

¿Cuál crees que es la razón detrás de la asociación de Microsoft y Amazon en la tecnología de red neuronal llamada 'Gluon'?

¿Hay algún solucionador que minimice la función objetivo [matemática] f (x) = \ matemática {e} ^ x [/ matemática] donde [matemática] x> 0 [/ matemática]?

Podría ser el primer experto en aprendizaje automático en una empresa como consultor o a tiempo completo. En cualquier caso, ¿cuál debería ser mi tasa?

¿Hay algún proyecto de aprendizaje automático de código abierto al que un principiante pueda contribuir?

Para un puesto de ciencia de datos, ¿por qué las empresas hacen preguntas sobre la estructura de datos?

¿Cuáles son las aplicaciones del tensor en estadística y aprendizaje automático?

¿Cómo funciona la función predict () en R?

¿Conoces algún software que implemente cálculos de los últimos k vectores singulares de matriz dispersa de entrada? Solía ​​irlba, pero que yo sepa, solo calcula los primeros k vectores singulares