¿Los métodos de aprendizaje automático solo son adecuados para fines de clasificación?

Los métodos de aprendizaje automático se pueden dividir en dos subtemas principales: aprendizaje supervisado y no supervisado .

Aprendizaje supervisado

En el aprendizaje supervisado, se nos proporciona un conjunto de datos y ya sabemos cómo debería ser nuestra salida correcta, teniendo la idea de que existe una relación entre la entrada y la salida.

Los problemas de aprendizaje supervisados ​​se clasifican en problemas de ” regresión ” y ” clasificación “. En un problema de regresión , estamos tratando de predecir resultados dentro de una salida continua , lo que significa que estamos tratando de asignar variables de entrada a alguna función continua . En un problema de clasificación , estamos tratando de predecir resultados en una salida discreta . En otras palabras, estamos tratando de asignar variables de entrada en categorías discretas .

Ejemplo :
Dada la información sobre el tamaño de las casas en el mercado inmobiliario, intente predecir su precio. El precio en función del tamaño es una salida continua , por lo que este es un problema de regresión.

Podríamos convertir este ejemplo en un problema de clasificación al hacer nuestra producción sobre si la casa “se vende por más o menos que el precio de venta”. Aquí estamos clasificando las casas según el precio en dos categorías discretas .

Aprendizaje sin supervisión

El aprendizaje no supervisado, por otro lado, nos permite abordar problemas con poca o ninguna idea de cómo deberían ser nuestros resultados. Podemos derivar la estructura de datos donde no necesariamente conocemos el efecto de las variables.

Podemos derivar esta estructura agrupando los datos en función de las relaciones entre las variables en los datos.

Con el aprendizaje no supervisado no hay comentarios basados ​​en los resultados de la predicción, es decir, no hay un maestro para corregirlo. No se trata solo de agrupar. Por ejemplo, la memoria asociativa es aprendizaje no supervisado.

Ejemplo :
Agrupación : tome una colección de 1000 ensayos escritos sobre la economía de los EE. UU., Y encuentre una forma de agrupar automáticamente estos ensayos en un pequeño número que de alguna manera sea similar o esté relacionado por diferentes variables, como la frecuencia de palabras, la longitud de las oraciones, el recuento de páginas, etc. en.

Asociativo : supongamos que un médico con años de experiencia forma asociaciones en su mente entre las características del paciente y las enfermedades que tienen. Si aparece un nuevo paciente, según las características de este paciente, tales como síntomas, historial médico familiar, atributos físicos, perspectiva mental, etc., el médico asocia posibles enfermedades o enfermedades basadas en lo que el médico ha visto antes con pacientes similares. Esto no es lo mismo que el razonamiento basado en reglas como en los sistemas expertos. En este caso, nos gustaría estimar una función de mapeo desde las características del paciente hasta las enfermedades.

Fuente: curso de aprendizaje automático de Andrew Ng en Coursera (también CS229 en Stanford)

Sí, predecir valores reales se llama regresión.

Los árboles de decisión no son adecuados, tampoco lo es SVM, y k-NN tendré que pensar un poco más. Por lo general, no se usa para la regresión, pero creo que es bastante trivial extenderlo a la regresión.

Las redes neuronales artificiales es una técnica que viene a la mente. La mayor parte de la investigación se centra en la clasificación, pero es bastante fácil modificarla para la regresión (simplemente cambiando la capa de salida).

Y para cosas muy simples, puedes hacer una regresión polinómica.

El aprendizaje automático no solo es adecuado para la clasificación, sino que también es muy útil para la regresión. Por ejemplo, puede usar un MLP con una función de activación lineal en la capa de salida para realizar la regresión, mientras que usar Softmax o Sigmoid sería más adecuado para la clasificación.

Los árboles de decisión no son muy buenos para estimar valores, pero otros métodos lo son.
La regresión lineal es una forma bastante estándar de estimar un valor dados sus datos.