¿Cuál es la diferencia entre regresión, clasificación y agrupamiento en el aprendizaje automático?

El aprendizaje automático se clasifica en general en supervisado , no supervisado , semi-supervisado .

La regresión y la clasificación se encuentran en el aprendizaje supervisado (la respuesta para todos los puntos característicos se mapean) y la agrupación se encuentra en el aprendizaje no supervisado (la respuesta no se dará para los puntos).

Regresión : si el valor de predicción tiende a ser un valor continuo, entonces cae dentro del problema de tipo Regresión en el aprendizaje automático

Ejemplo: dar el nombre del área, el tamaño de la tierra, etc. como características y predecir el costo esperado de la tierra.

Clasificación : si el valor de predicción tiende a ser una categoría como sí / no, positivo / negativo, etc., entonces cae dentro del problema de tipo de clasificación en aprendizaje automático

Ejemplo: dada una oración que predice si es crítica negativa o positiva

Agrupación – Agrupando un conjunto de puntos para un número dado de agrupaciones.

Ejemplo: Dado que 3, 4, 8, 9 y el número de grupos son 2, el sistema ML podría dividir el conjunto dado en el grupo 1 – 3, 4 y el grupo 2 – 8, 9

La regresión y la clasificación son un enfoque de aprendizaje supervisado que asigna una entrada a una salida en función de pares de entrada-salida de ejemplo, mientras que la agrupación es un enfoque de aprendizaje no supervisado.

Regresión : predice una salida continua valorada. El análisis de regresión es el modelo estadístico que se utiliza para predecir los datos numéricos en lugar de las etiquetas. También puede identificar las tendencias de distribución en función de los datos disponibles o los datos históricos. Predecir los ingresos de una persona a partir de su edad, la educación es un ejemplo de tarea de regresión.

Clasificación : predice un número discreto de valores. En la clasificación, los datos se clasifican en diferentes etiquetas de acuerdo con algunos parámetros y luego se predicen las etiquetas para los datos. La clasificación de correos electrónicos como spam o no spam es un ejemplo de problema de clasificación.

Agrupación : la agrupación es la tarea de dividir el conjunto de datos en grupos, llamados agrupaciones. El objetivo es dividir los datos de tal manera que los puntos dentro de un solo grupo sean muy similares y los puntos en diferentes grupos sean diferentes. Determina la agrupación entre datos sin etiquetar.

La regresión y la clasificación son métodos de aprendizaje supervisados, mientras que el agrupamiento es un método de aprendizaje no supervisado. El aprendizaje supervisado ajusta un modelo a los datos con etiquetas conocidas (resultados continuos para regresión, grupos para clasificación), mientras que el aprendizaje no supervisado no se ajusta a un modelo o requiere que se conozcan las etiquetas. Adjunto un breve PPT que detalla estas diferencias y los algoritmos utilizados en ellas: https://www.slideshare.net/Colle

regresión : calcule la relación probabilística entre variables con el propósito de pronosticar o predecir .

clasificación : calcule la categoría (o clase ) de un elemento y la confianza ( probabilidad ) de la clasificación.

agrupación : agrupe los elementos en grupos ( grupos ) de modo que los elementos similares estén en el mismo grupo (y los elementos no similares no lo estén).

La regresión y la clasificación son bastante cercanas: se le da un conjunto de capacitación de entradas y salidas, y aprende una función que relaciona las dos que, con suerte, le permite predecir las salidas dadas a partir de datos nuevos. La única diferencia es que en la clasificación, los resultados son discretos, mientras que en la regresión, los resultados no lo son. Pero los conceptos son borrosos, como en la “regresión logística”, que puede interpretarse como un método de clasificación o regresión.

Sin embargo, la agrupación es bastante diferente: no hay salidas en los datos en absoluto. Entonces, en la agrupación, la idea es asignar diferentes clases a diferentes puntos de datos dependiendo de cómo se agrupen. La agrupación se denomina método de aprendizaje “sin supervisión”, porque no hay ejemplos de etiquetado “correcto” que se puedan utilizar para la capacitación.

Creo que este diagrama debería darte una imagen clara