Déjame intentar responder a esta pregunta con un ejemplo. Estás trabajando para una empresa que vende helados. Ahora, como sabe en verano, las ventas aumentarán y en invierno las ventas bajarán, puede obtener una serie de datos que dicen a nivel mensual. Los datos de series temporales se capturan a intervalos regulares. Entonces, con solo una variable que son las ventas, puede predecir las ventas para el próximo año / mes. Esto es modelado de series de tiempo o llamado análisis univariado. Ejemplo: ARIMA, ARMA, Holt-Winter, modelado híbrido, UCM, etc.
Pero para una gran empresa, el pronóstico de ventas no es suficiente porque invertirán mucho dinero en I + D o promoción, por lo que les gustaría saber cuáles son los impulsores que impulsan las ventas y sus contribuciones. Puede ser sabor, sabor, color, precio, promoción, ingresos y muchos más factores. Entonces, para entender lo mismo, necesita un modelo basado en controladores llamado regresión.
Entonces ambos son útiles para la ciencia de datos. El propósito varía pero es bueno tener el mando en ambas tecnologías.
- ¿Cómo trato con los datos faltantes cuando ejecuto una regresión logística?
- ¿Existe alguna herramienta de inteligencia empresarial que aproveche algoritmos como "Edgerank" para controlar qué informes se muestran?
- ¿Qué tiene más alcance y permanecerá durante mucho tiempo en el mercado, la ciencia de datos, la computación en la nube o Hadoop y big data?
- ¿Cuáles son algunos de los "productos de datos" creados por los grandes como Amazon, LinkedIn, Twitter, Facebook, etc.?
- ¿Qué buscas en los científicos de datos?
¡Gracias!