¿La ciencia de datos se preocupa por la causalidad?

Buena pregunta y la respuesta podría ser depende !

Galit Shmueli escribió un artículo ampliamente conocido [1] sobre su pregunta. En el pasado, la investigación académica se centró principalmente en la causalidad . El objetivo era / es identificar los impulsores de un efecto y explicar por qué este es el caso.

La ciencia de datos , por el contrario, se centra más en el rendimiento predictivo . Simplemente dicho, guardo todos mis datos en ese cuadro negro y quiero la mayor precisión (el mejor ejemplo son las redes neuronales).

Para responder a su pregunta, el grado de causalidad que desea se basa en su problema. ¿Necesita saber por qué un cliente se convirtió en un competidor? ¿Fue su ingreso, edad, salario o la reputación de su producto? Luego debe aplicar modelos de causalidad (p. Ej., Modelado de ecuaciones estructuradas [2]).

Notas al pie

[1] https://www.stat.berkeley.edu/~a…

[2] http://oophox.net/publist/semfam…