Buena pregunta y la respuesta podría ser depende !
Galit Shmueli escribió un artículo ampliamente conocido [1] sobre su pregunta. En el pasado, la investigación académica se centró principalmente en la causalidad . El objetivo era / es identificar los impulsores de un efecto y explicar por qué este es el caso.
La ciencia de datos , por el contrario, se centra más en el rendimiento predictivo . Simplemente dicho, guardo todos mis datos en ese cuadro negro y quiero la mayor precisión (el mejor ejemplo son las redes neuronales).
- ¿Quién debería hacer big data?
- ¿Existe alguna correspondencia (en línea / visitas cortas al campus) del curso de Ciencia de Datos que ofrecen las Universidades en Europa para los Profesionales que trabajan en India?
- ¿Qué debo hacer para convertirme en un científico de datos exitoso si soy de un entorno sin codificación?
- ¿Cuáles son las aplicaciones de los procesos estocásticos, particularmente en ciencia de datos y aprendizaje automático?
- ¿Cuáles son las desventajas comunes de tener un conjunto de datos dispersos al crear un modelo ML?
Para responder a su pregunta, el grado de causalidad que desea se basa en su problema. ¿Necesita saber por qué un cliente se convirtió en un competidor? ¿Fue su ingreso, edad, salario o la reputación de su producto? Luego debe aplicar modelos de causalidad (p. Ej., Modelado de ecuaciones estructuradas [2]).
Notas al pie
[1] https://www.stat.berkeley.edu/~a…
[2] http://oophox.net/publist/semfam…