No todos los tutoriales de regresión están escritos por personas que realmente saben de lo que están hablando. Pero entre los que sí lo están, todavía hay razones por las que es posible que no cubras nada de esto.
Si está utilizando una regresión lineal como modelo predictivo, muchas de esas cosas realmente no importan. La única pregunta importante es qué tan bien predice. Si es lo suficientemente bueno, envíalo. Si no, bueno, hay muchas alternativas.
Es solo cuando comienza a mirar las propiedades estadísticas tradicionales de un modelo de regresión que necesita verificar los supuestos de regresión. La linealidad es importante para dar sentido a sus estimaciones. La homocedasticidad es importante si desea intervalos de confianza y pruebas de significación. Los errores correlacionados pueden hacer que las estimaciones de sus parámetros sean sesgadas.
- ¿Qué te hizo realmente gustar la ciencia de datos?
- ¿Cuáles son las mejores herramientas utilizadas para el modelado de datos?
- ¿Cuáles son los mejores libros sobre ciencia de datos?
- Cómo manejar grandes datos
- ¿Cuántos conocimientos estadísticos y de probabilidad se requieren para aprender ciencia de datos?
Todos estos son temas importantes, pero no son algo que deba aprender al principio, o incluso simplemente para comenzar a hacer análisis de datos. Sin embargo, me preocuparía si alguien no está expuesto a ellos.