¿Cuál es la principal diferencia entre la forma bayesiana de estimación de parámetros y la regresión lineal?

En un nivel alto, lo describiría como modelos generativos versus modelos discriminativos.

– Los clasificadores generativos aprenden un modelo de probabilidades conjuntas p (x, y) y usan la regla de Bayes para calcular p (x | y) para hacer una predicción
– Los modelos discriminativos aprenden la probabilidad posterior p (x | y) “directamente”

Puede pensar en modelos discriminatorios como “distinguir entre personas que hablan idiomas diferentes sin aprender realmente el idioma”.

En los modelos discriminativos, tiene “menos supuestos”, por ejemplo: en Bayes ingenuo y clasificación, usted asume que su p (x | y) sigue (típicamente) una distribución gaussiana, bernoulli o multinomial, e incluso viola la suposición de independencia condicional de las características. A favor de los modelos discriminativos, Vapnik escribió una vez “uno debe resolver el problema de clasificación directamente y nunca resolver un problema más general como un paso intermedio”.
(Vapnik, Vladimir Naumovich y Vlamimir Vapnik. Teoría del aprendizaje estadístico . Vol. 1. Nueva York: Wiley, 1998.)

Creo que realmente depende de su problema, sin embargo, qué método prefiere. No puedo encontrar una referencia ahora, pero, por ejemplo, en la clasificación, Bayes ingenuo converge más rápido, pero generalmente tiene un error mayor que la regresión logística. En pequeños conjuntos de datos, es posible que desee probar Bayes ingenuos, pero a medida que crece el tamaño de su conjunto de entrenamiento, es probable que obtenga mejores resultados con la regresión logística.

Related Content

¿Cuál es la diferencia entre embolsado y bootstrapping en ML / estadísticas?

ELI5: ¿Qué son las redes neuronales?

¿Qué es el "aprendizaje de refuerzo de múltiples agentes"?

¿Qué significa decir que las redes neuronales convolucionales comparten cálculos comunes a las regiones superpuestas?

¿Es obligatoria la experiencia de aprendizaje automático para conseguir un trabajo con Google? ¿Es realmente un tema importante en las universidades?

¿Cómo debo proceder para implementar un analizador probabilístico de lenguaje natural?

Cómo interpretar los resultados de agrupación de k-means

More Interesting

¿Qué es AdaBoost?

¿Cuál es la relación entre un modelo múltiple que interactúa y un filtro de Kalman?

No tengo dinero para comprar una computadora poderosa, ¿cómo puedo aprender en la GPU?

¿Cómo cambiará Google Brain el futuro de la búsqueda?

Teoría de la complejidad computacional: ¿Qué es un problema NP difícil?

Al aplicar redes neuronales para la clasificación binaria, ¿hay algún beneficio para el conjunto de entrenamiento que tiene un número igual de 0 y 1?

Cómo asegurarse de no analizar algo que termina sin sentido

¿Cuáles son las ventajas de las técnicas de aprendizaje automático sobre las técnicas de pronóstico tradicionales?

¿La validación cruzada más pequeña siempre es un indicador de un mejor modelo predictivo incluso si un modelo predictivo tiene una gran cantidad de parámetros?

¿Puedo usar una CPU para generar datos (aumento) cuando el entrenamiento de flujo de tensor en GPU es de forma paralela?

¿Cómo es trabajar en problemas de aprendizaje automático en un entorno empresarial?

¿Es una exageración aplicar un conjunto de redes neuronales?

Fuera de Theano, Caffe y DeepLearning4j, ¿hay alguna buena biblioteca de DeepLearning?

En Python, ¿cómo puedo probar y asegurarme de que mi modelo predice datos correctamente? (principiante preguntando)

¿Es posible comenzar a aprender y trabajar en el aprendizaje por refuerzo y el aprendizaje profundo sin un conocimiento previo sólido de otras clases de ML?

Web Analytics