¿A qué se refiere el término “regresión” en “análisis de regresión”?

La regresión proviene del trabajo realizado por Francis Galton. Galton notó que los padres altos tendían a tener hijos más bajos (en promedio), y que los padres bajos tendían a tener hijos más altos (en promedio). Francis Galton era primo (medio) de Charles Darwin, y pensó que tal vez esto tenía algo que ver con la evolución: es mejor, por alguna razón, tener una estatura promedio.

Llamó a esto “regresión hacia la mediocridad”, hoy en día decimos regresión hacia la media. (La palabra mediocridad ha cambiado su significado. [1])
Pero Galton hizo el análisis al revés: descubrió que los hijos altos tendían a tener (en promedio) padres más bajos. Y los hijos pequeños tendían a tener (en promedio) padres altos. Se dio cuenta de que esto no era un hecho biológico, sino un artefacto matemático.

Se dio cuenta de que cada vez que hay dos medidas que no están perfectamente relacionadas, habrá una regresión a la media. Cuanto más débil sea la relación, mayor será la regresión. Quería una forma de cuantificar cuánta regresión a la media iba a haber, una forma de medir la fuerza de la relación, porque las relaciones más fuertes conducen a una menor regresión. Esto condujo, de manera indirecta, a la correlación (trabajó con Pearson, y era un gran admirador de) Galton.

Hoy en día pensamos que el análisis de correlación y regresión se trata de describir relaciones, pero el nombre se ha quedado. La r, que se utiliza para representar la correlación, significa regresión.

[1] No es el único trabajo que se utiliza en las estadísticas que ha cambiado su significado, lo significativo es otro. Pero esa es otra respuesta.

Related Content

¿Qué significa el término difusión en bibliotecas numéricas con matrices como MATLAB, Numpy o TensorFlow?

¿Cómo se relaciona el error cuadrático medio (RMSE) y la clasificación?

¿Cómo afecta el término de regularización a la constante de Lipschitz en la minimización empírica regularizada del riesgo?

¿Hay algún lugar donde los métodos tradicionales de aprendizaje automático puedan vencer el aprendizaje profundo o las redes neuronales?

¿Por qué el embolsado es más preciso que solo mirar todo el conjunto de datos y tomar el promedio?

¿Cómo desarrollar una intuición para diseñar nuevos algoritmos?

¿Cuál es el mejor método (s) para verificar una dirección de correo electrónico durante el registro de un sitio web?

Solo una cosa histórica, AFAIK
Uno de los primeros estudios que utilizó la regresión fue sobre las alturas en la población de personas. Se demostró que las alturas extremas no se transmiten de padres a hijos y, en general, tienden a estar más cerca de la media de la población.

Waleed Kadous

More Interesting

¿Es mejor hacer una competencia de ciencia de datos en Kaggle o crear un algoritmo comercial en Quantopian para encontrar un trabajo en finanzas cuantitativas?

Procesamiento del lenguaje natural: ¿Cuáles son algunos métodos efectivos para detectar / calificar cadenas que pueden contener palabras profanas / ofensivas?

Cómo recopilar datos para problemas de la vida real mientras se entrena un modelo de aprendizaje automático

¿Cuáles son algunas posibles aplicaciones de aprendizaje profundo que son bastante novedosas?

¿Cuáles son las aplicaciones de aprendizaje profundo que consideras sin explotar?

¿Cuándo harán las máquinas la física y volverán a aprender las características de los datos de observación y luego reemplazarán aquellas como masa, giro, color o carga?

¿Cuál es la diferencia entre rpart y randomForest en R?

¿Qué es un perceptrón?

¿Con qué empiezo, minería de datos, inteligencia artificial o aprendizaje automático?

¿Qué enfoque se recomienda para aprender Machine Learning?

¿Dónde puedo obtener un conjunto de datos de notas de suicidio para fines de aprendizaje automático?

Quiero solicitar un programa de doctorado en Machine Learning, ¿cómo debo prepararme?

¿Qué usos novedosos hay para el aprendizaje de refuerzo profundo?

¿Cuáles son los principales enfoques de la inteligencia artificial?

¿Pueden proporcionarme un código para la predicción de palabras con word2vec?

Web Analytics