¿Se reemplazará la econometría por la ciencia de datos?

Probablemente no, aunque sea posible, y absolutamente no debería serlo si la gente sabe lo que es bueno para ellos.

En primer lugar, “ciencia de datos” es un término inventado por la industria, y es simplemente un reetiquetado de estadísticas con más énfasis en la programación y las aplicaciones en la industria. Y de acuerdo con Larry Wasserman en Carnegie Mellon, tampoco existe una diferencia real entre las estadísticas y el aprendizaje automático (Estadísticas versus Aprendizaje automático).

Entonces, lo que estoy tratando de decir es que todos estos nombres de la industria son solo para cambiar las etiquetas de una lata de sopa de pollo con fideos. Puedes animarlo, agregar muchas palabras de moda y llamarlo como quieras, pero en última instancia, lo que hay dentro de la lata es la misma sopa de fideos con pollo, independientemente de lo que diga la etiqueta en el exterior. Lo único que es nuevo acerca de todo este asunto de la ciencia de datos es que la industria acaba de descubrir que les gusta la sopa de pollo con fideos (estadísticas aplicadas a sus propios datos), en lugar de la crema de champiñones que han estado comiendo durante las últimas décadas ( “intuición ejecutiva”).

Entonces, en cierto sentido, la econometría no puede ser reemplazada por ciencia de datos porque son simplemente nombres diferentes para básicamente el mismo pájaro. La econometría es solo la aplicación de estadísticas para responder preguntas sobre política económica. Data Science es solo la aplicación de estadísticas para responder preguntas sobre la política de la empresa. Cada uno usa una variedad de técnicas, con mucha superposición. Por ejemplo, muchas aplicaciones de la econometría son esencialmente la evaluación de ensayos controlados aleatorios para ver el efecto de algún tipo de iniciativa política. ¿Sabes cuál es la diferencia entre esto y una prueba A / B de ciencia de datos? Absolutamente nada.

Existen algunas técnicas en econometría que no tendrían mucha aplicación en un entorno industrial. Por ejemplo, la econometría estructural es la creación de un modelo de datos basado en la teoría económica, para estimar los parámetros estructurales de ese modelo teórico. En la industria, esto sería excesivo; No estás tratando de descubrir los secretos del universo en la mayoría de los casos. Otra técnica econométrica es buscar “experimentos naturales” que aleatorizan más o menos a un grupo en algún programa de políticas y luego evaluar los efectos del programa con una variable instrumental, discontinuidad de regresión o un método de diferencia en diferencia. En la industria, a menudo no necesita buscar una aleatorización accidental, ya que controla en gran medida sus propios datos y puede experimentar en segmentos de sus propios clientes. El uso en la industria de métodos de aprendizaje automático puramente predictivos tiene menos aplicaciones en econometría, ya que los métodos puramente predictivos tienen poco valor para evaluar políticas (pero pueden funcionar muy bien en un motor de recomendación en vivo). En resumen, las diferencias entre estos paraguas están solo en los tipos de técnicas estadísticas que cada uno tiende a usar, ya que la elección del método se adapta a cada dominio del problema en particular.

Ciencia de datosEconometría