Cuando los departamentos universitarios cambian su nombre para incluir la palabra ‘Ciencia de datos’, ¿se trata principalmente de marketing?

Parcialmente si. Pero también es un reconocimiento de algunos conceptos muy importantes:

Primero, muchos estadísticos técnicamente son científicos de datos.

¿Recuerdas el famoso diagrama de Venn de ciencia de datos?

La cuestión es que, después de un cierto nivel de aprendizaje en estadística, realmente no puede sobrevivir sin algún conocimiento de piratería como el que aprende en R o SAS.

En segundo lugar, si su experiencia sustantiva es en sí misma, estadística, los pone en la ventaja de ser el experto teórico en el espectro de la ciencia de datos.

Por último, esa ciencia de datos no es una especialización o una nueva aparición de habilidades, sino que en realidad es un término más amplio para abarcar lo que ya existe: los datos y la formalización de cómo los estudiamos.

Por supuesto, podría estar equivocado, ya que no soy un gran científico de datos, pero de mis propias reflexiones filosóficas y evaluación de las anécdotas del profesional de la industria, me parece que, en cualquier caso, los datos son algo que existe para todos. Además, diferentes profesionales tienen diferentes niveles de familiaridad con sus datos. Pero todos los profesionales deben estudiar cómo interactuar con sus datos para realizar su trabajo; eso hace que casi todos sean científicos de datos [1]. Los estadísticos son casi siempre científicos de datos porque probablemente estén más familiarizados con los datos en comparación con cualquier otra persona.

Notas al pie

[1] Datos intensivos

El 90% del aprendizaje automático (no profundo) son simplemente estadísticas con un nuevo nombre (pr se basa en gran medida en ello), pero con un enfoque en la predicción en lugar de la validación.

Calcule que la regresión lineal, una herramienta estadística elemental que puede calcular con la mano o con el globo ocular (por ejemplo, la línea de mejor ajuste) se considera como “aprendizaje supervisado” en ML. Aunque no es demasiado preciso, sigue siendo uno de los algoritmos más utilizados debido a su velocidad, linealidad (evita el sobreajuste) e interpretabilidad. Del mismo modo, muchas funciones de error / costo le sonarán familiares a cualquier persona con un mínimo de conocimientos matemáticos … ¿Qué es el error cuadrático medio?

Por supuesto, la ciencia de datos abarca más que solo ML, por ejemplo, adquisición y visualización de datos. Pero, en general, la ciencia de datos es estadística, excepto que busca predecir en lugar de validar. Por lo tanto, marketing, pero apenas engañoso.

Diría que es marketing inteligente, pero si Yale y otros departamentos de estadística se toman en serio la integración de la ciencia de datos, representa un paso importante para cerrar la brecha entre la academia y la sociedad para las ciencias cuantitativas.

Observe cómo Hadley Wickham denota las diferencias entre los dos en esta entrevista:

Al mismo tiempo que la remodelación, y varios de sus paquetes, estaban siendo ampliamente utilizados, Wickham se estaba desencantando con la disciplina estadística. Observó durante su doctorado en estadísticas que había una “desconexión total entre lo que las personas necesitan para comprender los datos y lo que se les estaba enseñando”.

“Definitivamente, hay algunos estadísticos académicos que simplemente no entienden por qué lo que hago son estadísticas, pero básicamente creo que todos están equivocados. Lo que hago es fundamentalmente estadística. El hecho de que la ciencia de datos exista como un campo es un fracaso colosal de las estadísticas. Para mí, de eso se trata la estadística. Está obteniendo información de los datos mediante el modelado y la visualización. La manipulación y manipulación de datos es difícil y las estadísticas acaban de decir que ese no es nuestro dominio “.

En la medida en que renombrar una escuela fomenta una mejor colaboración y el intercambio entre estadísticos académicos y profesionales de datos en el campo, soy un seguidor.

Mucho de esto es marketing. Después de todo, Data Science como disciplina ha existido mucho antes de la popularización del término.

Pero Data Science ha evolucionado más allá de las estadísticas, para abarcar todo lo que sucede antes y después de que los datos estén disponibles: adquisición, destilación, procesamiento y presentación.

La facultad decide el nombre de su departamento. El nombre representa el propósito y el trabajo de la facultad, el personal, la administración, los becarios, los estudiantes y todas las personas. Aclara la posición del departamento dentro de la institución más grande.

La influencia en la decisión puede surgir de fuerzas externas. Estos se encuentran fuera del departamento o institución. Incluyen las fuerzas del mercado en el empleo, las sociedades profesionales, las revistas de investigación y las reuniones de conferencias, o de otro modo, las expectativas regionales.

El departamento declara su propósito, historia y estructura organizacional. El nombre del departamento rara vez cambia, pero en el orden de décadas. Para nombrar a las personas y la organización, el “Departamento de Estadística y Ciencia de Datos” sugiere el esfuerzo combinado entre ambas disciplinas.

More Interesting

¿Existen nuevas empresas de almacenamiento de datos en Pune / Mumbai?

¿Por qué están tan de moda los modelos de caja negra?

¿Qué tecnología tiene un futuro más brillante, el desarrollo de software full stack o el desarrollo de big data de Hadoop?

¿Cuáles son algunos escenarios de "big data"?

¿Menos marcas en IA afectarán mis posibilidades de admisión a un curso de maestría en ciencias de datos en una universidad estadounidense de renombre?

Hay varios cursos disponibles sobre ciencia de datos y análisis como Udaicity, Upgrad Imarticus, etc. ¿Cuál es el mejor para unirse?

Si pudiera contratar a 4/5 científicos / ingenieros para un equipo de análisis de big data centrado en elegir y responder preguntas comerciales concretas (por ejemplo, predecir una solicitud de producto), ¿cómo lo construiría?

¿Qué tan grande será el mercado para el modelado de datos de crowdsourcing? ¿Qué sectores se beneficiarán más? ¿Qué tipos de expertos se ganarán la vida compitiendo en estos sitios en el futuro?

¿Dónde puedo encontrar preguntas y problemas sobre análisis de datos y ciencia de datos?

¿Qué es ciudadano de datos?

¿Qué hace a un buen científico de datos? ¿Cómo superan los principales científicos de datos a otros generalistas (es decir, actuarios de P&C, analistas de negocios) en análisis predictivo?

¿Cómo se puede aplicar la ciencia de datos a los anuncios de Facebook?

¿A qué coaching / instituto debo unirme para un curso de aprendizaje de big data?

¿Es mejor tener demasiados falsos positivos o demasiados falsos negativos?

¿Cuál es la diferencia entre una maestría en análisis de negocios y big data y una maestría en ciencia de datos? ¿Qué habilidades necesitas dominar para cada uno?