Considere Naive Bayes y la regresión logística con características equivalentes, a veces llamadas “par generativo-discriminativo”. Dado el modelo P (X, Y) de Naive Bayes, obtienes densidad condicional P (Y | X) al marginar. Dado el modelo de regresión logística P (Y | X), obtienes la densidad completa P (X, Y) multiplicándola por la densidad empírica P (X) del conjunto de entrenamiento. En definitiva, la única diferencia entre dos modelos es el objetivo que están maximizando. Ver [1] para detalles sobre el álgebra
Si su objetivo es modelar P (X, Y) directamente (es decir, para la detección de anomalías, compresión, agrupamiento), no tiene sentido utilizar un objetivo discriminatorio.
Suponga que su objetivo es predecir Y dada X. Obtendrá una mayor precisión en los datos de entrenamiento mediante el uso de objetivos discriminativos. Si su conjunto de entrenamiento es lo suficientemente grande, esto significa una mejor precisión en los datos futuros. Para conjuntos de entrenamiento pequeños, el buen desempeño en los datos de entrenamiento no se transfiere a datos futuros, y usted obtiene una mayor precisión al entrenar su modelo generativamente. En el entrenamiento generativo, la parte marginal del objetivo esencialmente funciona como un regularizador. Las personas observaron modelos híbridos discriminativos-generativos donde el peso del término marginal es un parámetro, lo que le permite elegir un punto entre el entrenamiento totalmente discriminativo y totalmente generativo. [2] analizaron el comportamiento de una compensación óptima que se comporta como otros regularizadores: cuantos más datos tenga, más “discriminatorio” debería ser su objetivo.
- ¿Cuál es su proceso para diseñar funciones de pérdida para problemas de Machine Learning?
- ¿La variable de tiempo muestra una conexión recurrente en RNN?
- ¿Cómo se usa el aprendizaje automático en la generación de preguntas?
- En optimización, ¿cuáles son algunos ejemplos geniales de reformulación?
- Cómo hacer una carrera desde el nivel más básico hasta el nivel profesional en ciencia de datos, aprendizaje automático y aprendizaje profundo
[1] http://yaroslavvb.blogspot.com/2…
[2] http://citeseerx.ist.psu.edu/vie…