La regresión se usa para predecir valores continuos . La clasificación se usa para predecir de qué clase es parte un punto de datos ( valor discreto ).
Ejemplo: Tengo una casa con W habitaciones, X baños, Y pies cuadrados y Z de tamaño de lote. Basado en otras casas en el área que se han vendido recientemente, ¿por cuánto (cantidad en dólares) puedo vender mi casa? Usaría la regresión para este tipo de problema.
Ejemplo: Tengo una fruta desconocida de color amarillo, 5.5 pulgadas de largo, diámetro de una pulgada y densidad de X. ¿Qué fruta es esta? Usaría la clasificación para este tipo de problema para clasificarlo como un plátano (en lugar de una manzana o naranja).
- ¿Cuál es la diferencia entre el análisis factorial y las técnicas de selección de características, como el análisis de componentes principales y la asignación de dirichlet latente?
- ¿Cuáles son las diferentes técnicas de minería de texto?
- ¿Cuál es el potencial de las redes neuronales en la compresión de datos?
- ¿Qué son las redes neuronales profundas?
- ¿Qué (empíricamente) necesita más datos de entrenamiento (etiquetados): modelos discriminativos o modelos generativos?
Aquí hay una buena infografía para ayudar a razonar a través de los métodos que puede utilizar para su problema:
De: Elegir el estimador correcto Scikit-Learn