Supongo que se refiere a la clasificación de datos en el contexto del aprendizaje automático.
¡Esta es una pregunta realmente muy amplia!
Trataré de escribir algunas viñetas como guía. Estoy seguro de que muchas más respuestas lo harán más completo y proporcionarán un buen conjunto de recursos para su pregunta.
- ¿Cómo podemos analizar un conjunto de datos que es completamente (tanto X como Y) de naturaleza categórica?
- ¿Cuál es la mejor manera para que un gerente de producto gane competencia en ciencias de datos en su tiempo libre (es decir, no en el trabajo)?
- ¿Cómo uso el aprendizaje automático para datos espaciales?
- ¿Qué sistema operativo es mejor para Python, R y data science, Mac o Windows?
- ¿Quién gana más? Analista de datos o analista de negocios?
1. Algoritmos lineales: regresión logística, SVM lineal y perceptrón.
2. Algoritmos no lineales: Kernel SVM, redes neuronales, aprendizaje profundo.
3. Métodos probabilísticos y análisis bayesiano.
4. Visualización de datos (¡siempre ayuda!)
5. Detección de valores atípicos.
6. Compensación de sesgo y varianza. Overfitting vs underfitting y remedios.
7. Selección del modelo: validación cruzada.
8. Ingeniería de características.
9. Selección de características y creación de características: codificadores automáticos, RBM, codificación dispersa.
10. Regularización, L1 vs L2, redes elásticas.
11. Algoritmos en línea de clasificación de big data.
12. Clasificación multiclase uno contra todos, uno contra uno, softmax.
13. Métodos basados en árboles: CART, bosques aleatorios.
14. Impulso: Adaboost y GBM.
Estoy seguro de que estoy olvidando algo, pero esto parece un buen comienzo.
Gracias por el A2A!
Luis.