Es mejor comenzar leyendo sobre un modelo generativo simple llamado Clasificador Naive Bayes. Sería una buena idea repasar sus fundamentos sobre la probabilidad y revisar la regla de Bayes antes de sumergirse.
Una vez que comprenda la intuición básica detrás del Clasificador de Bayes (si una palabra en un documento aparece con frecuencia en la categoría, aumenta la probabilidad de que el documento pertenezca a esa categoría), puede leer sobre otros modelos discriminatorios como la Regresión logística.
Después de esto, es posible que también necesite leer sobre ‘suavizado’, frecuencia de documentos inversa y otras mejoras específicas de dominio para estos modelos.
- Word2vec: ¿Cómo puede el método de entrenamiento jerárquico soft-max de CBOW garantizar su autoconsistencia?
- ¿Cuál es la mejor y más fácil forma de aprender el aprendizaje automático?
- ¿Cuáles son algunas redes neuronales diferentes que podrían usarse como algoritmos de control en cuadricópteros autónomos?
- ¿Qué es un método de kernel en el contexto del aprendizaje automático?
- ¿Cuál es la guía genérica y la mejor guía para aprender TensorFlow desde la plataforma Python? ¿O hay otras bibliotecas mejores que TensorFlow?
PD -> No se preocupe, si algunas de las palabras anteriores son nuevas, pronto las encontrará y las comprenderá. La mayoría de los temas, como el suavizado, son bastante amplios y recomiendo centrarse en obtener la intuición detrás de estos algoritmos para que pueda tomar una decisión informada sobre cuál usar y cómo mejorarlo.