No es un término bien definido. Muchos expertos tienen pocas definiciones diferentes al respecto. Trataré de explicar mis entendimientos.
Es recopilar, organizar, limpiar, presentar, tabular, analizar, herramientas de programación, manejo de datos, informes, etc. Etc … Todo es ciencia de datos. Se podría decir que desde hace siglos los estadísticos están haciendo lo mismo, entonces, ¿qué es diferente en la ciencia de datos?
En realidad, los estadísticos saben poco sobre informática y más sobre estadística, pero la ciencia de datos es más sobre datos en informática. Importar exportación, atributos de datos, manejar big data necesita conceptos de CS y es parte de la ciencia de datos …
- Cómo ingresar a la genómica o la biología computacional como científico de datos
- ¿En qué orden deben realizarse estas operaciones de ciencia de datos: munging, limpieza, escalado, transformaciones y modelado?
- ¿Cómo se puede utilizar la ciencia de datos para reducir las tasas de criminalidad?
- Cómo aprender análisis de big data en línea
- ¿Puedo ingresar a la ciencia de datos con un GPA bajo?
La confusión se trata de la parte analítica, porque sin obtener una comprensión estadística básica, algunos programadores informáticos piensan que también pueden manejar el análisis. Todo el mundo sabe que manejar datos de 100 gb en el escritorio para el análisis estadístico es un trabajo desafiante, por lo que aquí se necesita un especialista y se llama científico de datos.
Finalmente computadoras + estadísticas = ciencia de datos o big data.
Espero que lo recibas correctamente. Los errores de ortografía pueden ser, como estoy respondiendo desde Android.