¿Soy solo yo, o es ‘ciencia de datos’ el peor nombre para un campo?

Data Science es un gran nombre y no tan bueno.

El malo:

Se podría decir que es semánticamente descuidado.

La mayoría de los científicos de datos no son realmente científicos en sentido estricto. No están publicando artículos en revistas revisadas por pares. No están empujando las fronteras del conocimiento. La mayor parte de lo que están haciendo es utilizar las últimas tecnologías para descubrir patrones ocultos en los datos que podrían proporcionar valor comercial. Eso no es exactamente ciencia.

El bueno:

Es sexy

Cuando los empresarios piensan en científicos de datos, piensan en geeks glorificados con gafas gruesas, doctorados en temas avanzados y habilidades matemáticas desde el techo. Unicornios, se llaman. El trabajo más sexy del siglo XXI. Y así.

Si hago una búsqueda de imágenes para “científico de datos”, obtengo esto:

Está bien. Estilo completo de Minority Report con un sentido de la moda impecable para arrancar. Me doy cuenta de que es solo una foto de archivo tonta, pero de alguna manera representa cómo se ven los científicos de datos en el mundo corporativo en este momento.

Por supuesto, nosotros que estamos trabajando en el campo somos completamente conscientes de que esta exageración es muy exagerada. El campo de la ciencia de datos es principalmente una continuación lógica de la inteligencia de negocios, la estadística y la investigación de operaciones.

Pero la exageración es genial, porque significa que los empresarios están cada vez más dispuestos a poner su fe y su dinero en la toma de decisiones basada en datos. Recuerde, en los negocios corporativos, la herramienta de toma de decisiones ha sido tradicionalmente la corazonada del ejecutivo de más alto rango en la sala.

Si hago una búsqueda de imágenes para “estadístico”, obtengo esto:

Eso es ridículamente injusto para los estadísticos, que actualmente utilizan herramientas informáticas modernas al igual que los científicos de datos, pero su reputación no es tan sexy.

Esto probablemente será impopular, pero estoy de acuerdo, es un nombre terrible (quizás no sea el peor nombre, hay tantos títulos de trabajo por ahí).

Semánticamente, por supuesto, toda la ciencia usa datos, por lo que la “ciencia de datos” es algo no descriptiva. Dicho esto, “datos” (en un sentido específico del dominio) es increíblemente importante para muchas industrias, por lo que usar la palabra “datos” con ese contexto tiene algún sentido.

El verdadero problema es que debido a que “científico” es bastante vago y también lo es “datos”, ¿qué significa realmente “ciencia de datos”? Diferentes personas te darán diferentes respuestas, lo cual no es una buena señal. Hay una gran cantidad de términos que describen trabajos / campos que generalmente tienen un sabor similar:

  • Análisis de negocio
  • Análisis de datos
  • Inteligencia de Negocio
  • Análisis cuantitativo
  • La investigación de operaciones
  • Ingeniero de aprendizaje automático
  • Científico investigador (por supuesto, esto solo está relacionado cuando es para aprendizaje automático)

No hay nada sobre cualquier posición de “ciencia de datos” que no pueda describirse también usando uno de estos numerosos términos, por lo que el nombre no agrega valor. Después de todos los argumentos y opiniones sobre lo que es un “científico de datos real”, en realidad creo que “analista cuantitativo” se entiende prácticamente como lo mismo en muchos casos, entonces, ¿por qué no podemos usar ese término? Google parece estar contento como la única compañía de tecnología de Silicon Valley que usa ese término, espero que se dé cuenta.

Sí, el término ciencia de datos es horrible. No sé lo que significa estudiar datos. Dado que una forma de pensar en los datos es el resultado de algo que se puede medir. Hay tantas técnicas y métodos que son más herramientas para responder preguntas sobre un dominio.

Prefiero el término análisis de datos que pone esta disciplina más en el campo de la lógica.

Es decir, uno está tratando de desarrollar, defender o desacreditar proposiciones utilizando dichas técnicas en combinación con “datos” o de una manera más cuantitativa.

¿Por qué este campo no es una ciencia?

  1. algunos conjuntos de datos no vuelven a ocurrir
  2. Realizar experimentos controlados con cualquier rigor difícil de hacer, si no imposible.
  3. mínimo si se hacen intentos para comprender verdaderamente los fenómenos subyacentes que generan los datos, es decir, no se realiza un verdadero modelado de primeros principios

probablemente hay otros.

En conclusión, pienso en este campo más como lógica que como un campo cuantitativo difícil.

Una rosa con cualquier otro nombre olería tan dulce ” – William Shakespeare

Supongo que eso lo resume …

Anteriormente eran analistas o estadísticos, etc.

Ahora la moda es Data Scientist.

Poco a poco, la tendencia emergente es el ingeniero de aprendizaje automático.

Bueno, el objetivo del trabajo sigue siendo el mismo (Analizar cosas para mejorar o lograr un objetivo), sin embargo, se ha reestructurado con diferentes técnicas para atender a diferentes dominios, de ahí el cambio de marca como nombres diferentes.

Primero, no soy un científico de datos y no quiero serlo. Sin embargo, generalmente son mis clientes favoritos, ya que soy alguien que ha creado servicios y herramientas para ellos a lo largo de los años.

He escuchado esta queja muchas veces, así que no eres solo tú. Sospecho que tengo en alta estima incluso a la mayoría de las personas pragmáticas racionales.

Sin embargo, no estoy de acuerdo.

Tomar una definición promedio de Google de la ciencia como la “actividad intelectual y práctica que abarca el estudio sistemático de la estructura y el comportamiento del mundo físico y natural a través de la observación y la experimentación” y agregar la especialización del dominio de datos significa algo único para mí.

No siempre hemos tenido personas especializadas en la actividad intelectual y práctica que abarca el estudio sistemático de la estructura y el comportamiento de todos los datos relacionados con una organización.

Siempre hemos tenido analistas de negocios o profesionales que entendieron muy bien lo que una organización hace muy bien, pero no pudieron hacer un modelo matemático para representarlo.

Sí, los estadísticos y actuarios han hecho cosas maravillosas con los números y hay cierta superposición con la ciencia de datos, pero no es lo mismo. Tienen restricciones sobre lo que se les permite pensar en la práctica.

Los científicos de datos solo están limitados si no se puede encontrar absolutamente ningún tipo de abstracción de datos. También conocido como “actividad intelectual y práctica que abarca el estudio sistemático”.

Las preguntas no están estrictamente relacionadas con el negocio, incluso cuando la organización se preocupa por los resultados financieros. Un modelo que explica los posibles impactos de los patrones climáticos en los estados de ánimo de la demografía es un estudio completamente válido, incluso si no muestran ningún valor comercial.

Todos los científicos usan datos en diversos grados, pero eso no es lo que hace que un científico sea único. Lo que define un dominio en la ciencia es el tipo de preguntas que hacen. Por qué realmente amo a los científicos de datos es que hacen las mejores preguntas. Sus preguntas son únicas y merecen su propio título y dominio en lo que a mí respecta.

No conozco el término Ciencia de datos, pero sí, el término Big Data seguramente va a cambiar después de unos años. A medida que más y más datos se vuelvan más inteligentes, el término se convertirá en Datos inteligentes.