¿Qué papel deberían jugar los estadísticos en la ciencia de datos?

El papel de un estadístico en comparación con un científico de datos debe ser análogo a la relación entre un físico y un ingeniero; el estadístico debe informar los principios fundamentales sobre los cuales se basa el diseño y análisis del científico de datos, dejando los matices y desafíos de la implementación al científico de datos.

Por el contrario, los estadísticos deben estar familiarizados con la computación para que estén equipados para desarrollar dichos principios teniendo en cuenta la eficiencia.

Avanzar hacia esta relación requeriría significativamente más diálogo entre los estadísticos y los “científicos de datos”, o al menos formular una definición más sólida de lo que constituye “ciencia de datos”. Esta es una pregunta difícil de responder porque la “ciencia de datos” está mal definida; en el mejor de los casos, es una combinación nebulosa de estadística, informática y matemática aplicada, campos cuya intersección es difícil de caracterizar.

Los estadísticos son las mejores personas para hablar cuando desea comprender cuáles son las limitaciones de sus datos. Ninguno de los otros especialistas en el campo de la ciencia de datos realmente parece preocuparse demasiado por esto.

Creo que los estadísticos y graduados centrados en la investigación de operaciones tienen una mejor perspectiva y comprensión de la ciencia de datos y sus algoritmos en lugar de los ingenieros informáticos.

Aprendemos el quid de los algoritmos,

P.ej . Algoritmos de descenso de gradiente, árboles de decisión, pronósticos y programación lineal.

Si bien les puede resultar más fácil aprender los paquetes de ciencia de datos en sus respectivos lenguajes de programación.

Pero al final del día, creo firmemente que un estadístico que aprende la codificación es mucho mejor que un informático que trata de aprender el esquema de algoritmos para su trabajo.

Para hacer eco del punto de Justin Rising, me he encontrado con algunas situaciones en las que los estadísticos han señalado errores significativos a los científicos entusiastas de los datos. Obtuve esto a través de la investigación con estadísticos y experiencia personal. El sinónimo es “académico”, como en “eso es solo académico: necesitamos respuestas y esta es una respuesta” (incluso si es totalmente erróneo / engañoso).

Estos son algunos conceptos de los que los estadísticos tienen una mejor conciencia: relación ruido / señal, sesgo, muestreo e inferencia, hacer y verificar supuestos sobre un modelo o datos, por ejemplo, multicolinealidad, comparaciones múltiples y pruebas a priori vs. post hoc, experimentos y causalidad .

la razón por la cual surgieron las estadísticas es por la limitación de datos. es decir, queremos hacer una declaración de una población con un tamaño de muestra seleccionado.
Sin embargo, con conjuntos de datos que son tan grandes y con una tecnología en crecimiento, es posible que no necesitemos estadísticas cuando podamos analizar a toda la población real. Por lo tanto, creo que las técnicas de los estadísticos podrían no ser realmente relevantes.

More Interesting

¿Cómo manejar los datos faltantes (estadísticas)? ¿Qué técnicas de imputación recomienda o sigue?

Cómo implementar big data como Quora en mi sitio web para mostrar solo cosas interesadas por el usuario

¿Cuál es el mejor instituto para la formación en ciencia de datos en Jaipur?

¿Cómo se puede pasar del nivel principiante avanzado al nivel intermedio en ciencia de datos?

Estoy interesado en el aseguramiento de la calidad del software. Necesito entrar en el análisis de big data. ¿Cuáles son los cursos y certificaciones que necesito tomar?

¿Cuáles son los mejores campos de entrenamiento de ciencia de datos?

¿Qué es el ERP? ¿Cómo apoya ERP a las empresas? ¿Es una herramienta que ayuda con el mantenimiento de registros y ofrece una instalación de almacenamiento de datos?

¿Cuáles son las mejores herramientas gratuitas de recuperación de datos para Windows?

¿Cuáles son los lenguajes utilizados en ciencia de datos en India?

¿Cuál es la proporción de creatividad vs trabajo de rutina en ciencia de datos?

¿Cómo gana y retiene DeepMind los datos que necesita para el aprendizaje automático mientras garantiza la privacidad del paciente?

Cómo ingresar a la genómica o la biología computacional como científico de datos

¿Puedo usar el agrupamiento (técnicas de minería de datos) para la detección de cuentas falsas en las redes sociales?

¿Dónde debo solicitar un trabajo de enseñanza de big data en Bangalore?

¿Cuál es la diferencia entre procesamiento de datos y análisis de datos?