¿Qué significa exactamente la ciencia de datos?

No es un término bien definido. Muchos expertos tienen pocas definiciones diferentes al respecto. Trataré de explicar mis entendimientos.

Es recopilar, organizar, limpiar, presentar, tabular, analizar, herramientas de programación, manejo de datos, informes, etc. Etc … Todo es ciencia de datos. Se podría decir que desde hace siglos los estadísticos están haciendo lo mismo, entonces, ¿qué es diferente en la ciencia de datos?

En realidad, los estadísticos saben poco sobre informática y más sobre estadística, pero la ciencia de datos es más sobre datos en informática. Importar exportación, atributos de datos, manejar big data necesita conceptos de CS y es parte de la ciencia de datos …

La confusión se trata de la parte analítica, porque sin obtener una comprensión estadística básica, algunos programadores informáticos piensan que también pueden manejar el análisis. Todo el mundo sabe que manejar datos de 100 gb en el escritorio para el análisis estadístico es un trabajo desafiante, por lo que aquí se necesita un especialista y se llama científico de datos.

Finalmente computadoras + estadísticas = ciencia de datos o big data.

Espero que lo recibas correctamente. Los errores de ortografía pueden ser, como estoy respondiendo desde Android.

En esencia, la ciencia de datos implica el uso de métodos automatizados para analizar cantidades extremas de datos y extraer conocimiento de ellos. Con tales métodos automatizados que aparecen en todas partes, desde la genómica hasta la física de alta energía, la ciencia de datos está ayudando a crear nuevas ramas de la ciencia e influyendo en áreas de las ciencias sociales y las humanidades. Se espera que la tendencia se acelere en los próximos años a medida que crezcan los datos de sensores móviles, instrumentos sofisticados, la web y más. En la investigación académica, veremos un número cada vez mayor de disciplinas tradicionales que generan nuevas subdisciplinas con el adjetivo “computacional” frente a ellas. En la industria, veremos que la ciencia de datos transforma todo, desde la atención médica hasta los medios de comunicación.

La ciencia de datos es la intersección de la informática, las matemáticas y el procesamiento de datos, con énfasis en el uso aplicado del método científico.

Un muy buen artículo de Forbes: una historia muy corta de Big Data resolverá esto, supongo.