Si cada ciencia usa datos, ¿qué es la ciencia de datos?

Me gusta decir que un científico de datos es un científico con la arrogancia de creer que no está limitado a ningún campo.

He realizado marketing, seguros, fraude, fractura hidráulica, exploración de minerales, medicina y más. En cada proyecto, trabajar con expertos en el campo y, sin embargo, un enfoque de ciencia de datos podría aportar un valor agregado casi siempre.

La ciencia se trata de recopilar información haciendo un modelo haciendo predicciones y verificándolas en nuevos datos. Esta es la esencia del aprendizaje automático supervisado, una rama de la ciencia de datos que estudia familias de modelos aplicables a muchos dominios problemáticos.

La mayoría de los campos de la ciencia se enfocan en explicar el mecanismo de algún sistema, usualmente usando otros mecanismos bien entendidos. Los modelos resultantes tienden a ser simples en el sentido humano con pocos parámetros. Estos modelos tienden a extrapolarse bien y transferirse relativamente bien (dentro de lo razonable), debido a su simplicidad.

En ciencia de datos modelamos sistemas complejos con una comprensión limitada del sistema, para bien o para mal no nos enfocamos en las relaciones causales, sino que encontramos correlaciones. Podemos modelar casi cualquier cosa con datos suficientes y con distribuciones estacionarias, lo hacemos bastante bien. Por supuesto, el mundo cambia y con modelos complejos que no entendemos podemos hacer excelentes declaraciones sobre la distribución de la muestra que estudiamos, pero nos resulta muy difícil generalizar con confianza. Parece que lo hacemos bastante bien en la práctica, pero hay un poco de agitación de la mano involucrada.

En ciencia de datos también estudiamos la metodología básica de la ciencia. Estudiamos estadísticas y problemas de muestreo, confianza, etc. Otros científicos usan estas herramientas. En muchos sentidos, la ciencia de datos es un nuevo giro en las estadísticas aplicadas.

Piensa en esto: si toda la ciencia usa las matemáticas, ¿qué son las matemáticas?

La respuesta es que las matemáticas se encuentran en una capa más abstracta que las matemáticas utilizadas en otras disciplinas. En otras palabras, las matemáticas estudian conceptos y métodos que con una ligera concreción pueden ser universalmente aplicables a todas las ciencias.

La ciencia de datos es similar desde esta perspectiva. Se concentra más en los métodos universales de recopilación y procesamiento de datos, que una vez diseñados, pueden agotarse para cualquier campo. Por supuesto, cuando se aplica a algún campo, se debe incorporar cierta experiencia de ese campo, de la misma manera que cuando se aplican las matemáticas. Pero el punto es que algunos detalles sobre el ‘kit de herramientas de datos’ se ocultan para otros, ya que los científicos de datos toman este trabajo, lo que libera a los usuarios y les permite concentrarse más en las características específicas de su propio campo.

La ciencia de datos , también conocida como ciencia basada en datos , es un campo interdisciplinario sobre métodos, procesos y sistemas científicos para extraer conocimiento o ideas de los datos .

-Wikipedia

Los datos son vida. Cualquier cosa sin datos es irrelevante para un científico o para las personas. Aprender de los datos es una habilidad en la que se analiza el uso de todo tipo de datos recopilados por varios dispositivos y se desarrolla una declaración o modelo de resultados.

Un científico de datos utiliza varios métodos matemáticos y científicos para extraer información significativa de los datos, se conoce como minería de datos o análisis de datos.

También vienen con un modelo que a veces puede tomar decisiones basadas en los datos pasados, que se conoce como construcción de modelos con aprendizaje automático.

Hay otro nivel más alto de aspecto de una ciencia de datos en el aprendizaje profundo y la visión por computadora, donde utilizan gran cantidad de datos para obtener inteligencia o inteligencia artificial.

Toda ciencia está produciendo datos, pero la ciencia de datos está consumiendo datos para encontrar el potencial central de los datos producidos.

More Interesting

¿Alguien podría hablarme sobre las universidades para el análisis de datos o la ciencia de datos en Europa o EE. UU. (Tiempo completo -2 años)?

¿Qué habilidades son necesarias para conseguir un trabajo en análisis de datos?

¿Habilidades para el autoaprendizaje de la ciencia / análisis de datos o las estadísticas de EM?

¿Qué tan difícil es ser admitido en el campo de entrenamiento de ciencia de datos de Insight?

¿Qué posibilidades futuras ve en la intersección de la ciencia de datos y las finanzas?

¿Los científicos de datos piensan que Hadoop tiene errores?

¿Es posible conseguir un trabajo en ciencia de datos o aprendizaje automático justo después de la graduación? ¿Si es así, cómo?

¿Cuáles son los consejos prácticos para trabajar con una gran cantidad de datos para el análisis en Excel?

¿Qué especialización en ciencia de datos es mejor, la de edX o Coursera?

¿Cómo se usa Tableau para la ciencia de datos?

¿Cuál es la diferencia entre analista de negocios, analista de datos, científico de datos, analista de inteligencia de negocios, analista de sistemas de negocios y gerente de producto?

¿Qué es el análisis de sentimientos de Twitter?

¿Cuáles son los nuevos recursos de big data?

Tengo una experiencia laboral de más de dos años en desarrollo, dispositivos móviles y web. Quiero hacer MS en DS. ¿Mi experiencia ayudaría en el proceso de selección?

¿Cuál es la diferencia entre el almacenamiento de datos, la minería de datos y el análisis de datos?