Cómo obtener líneas de regresión y encontrar coeficientes de correlación a partir de datos

Siempre que tenga los datos adecuadamente podados, en teoría necesitará estimadores de mínimos cuadrados para obtener la pendiente de la regresión lineal y la media del vector de respuesta como ubicación. ¡Ponga estos dos en formato Y = mX + C y Et Voila!

Curiosamente, debe calcular el coeficiente de correlación (nos encanta nuestra jerga) para obtener la estimación de mínimos cuadrados que es básicamente E (XY) -E (X) E (Y). para explicar con datos, (supongamos que E significa suma) 1 / frecuencia neta {E (XY) -E (X) E (Y)}.

¡Ahora, esto se puede calcular con un montón de softwares!

la más fácil de ellas es Minitab, SPSS, Matlab, Statistica, etc., pero ninguna es una plataforma de código abierto.

Entonces podemos hacerlo en estos dos lenguajes de nivel de máquina de manera bastante simple: R y Python.

Mira hacia arriba: ‘ cor’ y ‘ lm’ funcionan en R!

¡Aclamaciones! * Disculpas por llegar tarde a la fiesta.

Los softwares se enumeran a continuación:

  • Con la ayuda de MS Excel. Busca en Google sobre los comandos.
  • Con la ayuda de R. Busque en Google sobre los comandos.
  • Con la ayuda de MINITAB. Busca en Google sobre los comandos.

Ahora, si desea conocer las explicaciones matemáticas, revise algunos libros básicos sobre Regresión. Vea cómo construimos un modelo lineal, cuáles son los supuestos, cómo estimamos los parámetros.

Las fórmulas que usamos para calcular el coeficiente de correlación o los parámetros de regresión son bastante simples. No será un problema aplicarlos. Pero al principio lea la teoría.

Bueno, puede obtener ecuaciones de regresión y la estimación beta correspondiente utilizando cualquier software estadístico como SAS / R, incluso puede ejecutar la ecuación de regresión en Excel también.