La clasificación cae dentro del aprendizaje supervisado, y la agrupación cae dentro del aprendizaje no supervisado. Rara vez se encontrará en una situación en la que tendrá que elegir el uno sobre el otro, sino más bien saber cuándo usar el uno o el otro. Como lo discutió Kien en la respuesta anterior, generalmente, utilizará la clasificación en datos etiquetados (supervisados) y la agrupación en datos sin etiquetas (sin supervisión).
Ciertamente, hay casos en los que las dos técnicas se complementan entre sí, es posible que tenga un conjunto de datos etiquetados y un conjunto de datos no etiquetados y utilice la agrupación para determinar a qué grupo / etiqueta pertenecen sus datos no etiquetados, y una técnica de clasificación para entrenar a clasificador para predicciones futuras.
Intente obtener la mayor cantidad posible de datos etiquetados, tal como están las cosas, tenemos mejores algoritmos para aprender sobre datos etiquetados que sobre datos no etiquetados.
- ¿Cuál es una buena referencia para aprender cómo implementar y usar la búsqueda de línea para la optimización?
- ¿Cuál es la mejor manera (habitual) de combinar los puntajes tf-idf para cada documento que un usuario ha visto al crear un perfil para este usuario?
- ¿Cuál es el estándar de JMLR contra documentos en ICML y NIPS?
- ¿Qué suele hacer que una red neuronal deje de mejorar temprano?
- ¿Cómo implementaría el servicio de noticias de Quora?