¿Cuál es la diferencia entre un clasificador Naive Bayes y AODE?

AODE es una forma extraña de relajar las suposiciones de independencia ingenuas de bayes. Ya no es un modelo generativo, pero relaja los supuestos de independencia de una manera ligeramente diferente (y menos basada en principios) que la regresión logística. Reemplaza el problema de optimización convexo utilizado en el entrenamiento de un clasificador de regresión logística por una dependencia cuadrática (en el número de características) en los tiempos de entrenamiento y prueba.

Básicamente funciona creando, para cada característica j, un clasificador que asume que las otras características son independientes dada la etiqueta y la característica j, y predice promediando estos clasificadores. Esto le permite modelar dependencias cuadráticas entre características en la función de etiqueta, a expensas de muchos parámetros adicionales. En mi opinión, es un poco ad-hoc y es mejor usar SVM con núcleos cuadráticos (si desea dependencias de características) o regresión logística (si solo desea un bayes ingenuo menos sesgado).

More Interesting

¿Cómo se debe elegir el parámetro [math] l [/ math] en la regresión de mínimos cuadrados parciales?

¿La ingeniería de características es relevante para los bosques aleatorios? ¿Cómo son relevantes las transformaciones de centrado, escala y Box-Cox en este contexto?

¿Cómo elegiría el marco de aprendizaje profundo adecuado para un proyecto?

¿Qué pasa si el universo está aprendiendo y cambiando sus teorías fundamentales? ¿Puede haber una teoría unificada entonces?

¿Cómo se pueden entender intuitivamente las dimensiones de las entradas LSTM?

¿Cómo reconoce la red neuronal convolucional los objetos de las imágenes sin la percepción o reconocimiento 3D?

¿Qué áreas del aprendizaje automático son más importantes para los fondos de cobertura y los bancos de inversión (en equipos cuantitativos)?

¿Cómo escriben las personas pruebas automatizadas para sus algoritmos estocásticos?

¿Qué función podría usar en R para encontrar los n valores más grandes de un vector?

¿Todas las funciones de pérdida sufren el problema del gradiente de fuga en las redes neuronales?

¿Qué es más exigente, desarrollo de aplicaciones, aprendizaje automático, aprendizaje profundo, inteligencia artificial o IOT?

Dado lo éticamente y empáticamente incompetentes que son los humanos, ¿cuándo comenzaremos a entrenar el aprendizaje automático en grandes conjuntos de datos de decisiones éticas?

¿Es bueno hacer un muestreo estratificado para la regresión cuando se le da con grandes conjuntos de datos?

¿Cómo asociaría un producto con una categoría y subcategoría basada en la descripción de texto del producto?

¿Qué tan útil es la regresión del proceso gaussiano? ¿Tienes un buen ejemplo?