¿Cuál es su título preferido para las personas que desarrollan información del producto con datos: científico de datos o analista?

Prefiero Data Scientist no por la sensualidad del título, sino porque es un puesto de trabajo que implica una gama más amplia de habilidades de análisis de datos y una comprensión más profunda de los algoritmos estadísticos. Supongo que si te llaman uno, significaría que tienes el arsenal completo de análisis y visualización de datos combinado con excelentes habilidades de comunicación técnico-empresarial y años de experiencia en la construcción de dichos productos y sistemas. Básicamente, Data Analyst es el rol junior y Data Scientist es el rol senior.

Creo que este enlace explica claramente la diferencia entre los dos: 3 carreras de datos decodificadas y lo que significa para usted

Analista de datos:

Los analistas de datos deben tener una comprensión básica de cinco competencias básicas: programación, estadísticas, aprendizaje automático, munging de datos y visualización de datos.

Los analistas de datos reciben instrucciones de profesionales de datos más experimentados en su organización. Sobre la base de esa orientación, adquieren, procesan y resumen datos.

Científico de datos:

… el trabajo de un científico de datos requiere habilidades más sofisticadas para abordar un mayor volumen y velocidad de datos.

Como tal, un científico de datos es alguien que puede hacer una investigación no dirigida y abordar problemas y preguntas abiertas. Los científicos de datos suelen tener títulos avanzados en un campo cuantitativo, como informática, física, estadística o matemáticas aplicadas, y tienen el conocimiento para inventar nuevos algoritmos para resolver problemas de datos .

Énfasis en la capacidad de hacer “investigación no dirigida” e “inventar nuevos algoritmos para resolver problemas de datos”. Eso no es algo que cualquiera pueda hacer. Requiere mucha experiencia en la lectura de numerosos documentos técnicos / revistas y la traducción de ecuaciones en código, sin mencionar la modificación del problema en cuestión. También tiene que mantenerse actualizado con los últimos avances sobre diversos temas como PNL, reconocimiento de imágenes y similares. También tiene que saber cómo llegar a un equilibrio entre rendimiento y practicidad, es decir, no siempre es práctico implementar en producción el algoritmo más preciso que existe. Creo que es exactamente por eso que se le llama un “científico” de datos. Definitivamente no es porque suene sexy. Por el contrario, conlleva muchas responsabilidades y numerosos ataques de síndrome de impostor.

Siempre querrás ser mejor, si no el mejor (excepto si eres un genio), en algo que haces, ¿verdad?

Mi percepción de las diferencias entre estos dos títulos es la siguiente.

Científico de datos

  • Utiliza el aprendizaje automático.
  • A menudo utiliza tecnologías de big data.
  • Escribe código a diario.

Analista de datos

  • Pasa más tiempo entendiendo el negocio.
  • Utiliza Excel como herramienta principal.
  • A menudo bien versado en economía empresarial.

Por supuesto, estas son generalizaciones que son siempre ciertas. Yo diría que la mayor diferencia es la parte de aprendizaje automático. Alguien que nunca toca ML no es un científico de datos en mi opinión. Creo que la mayoría de los analistas de datos no lo hacen.

Analista de datos. Solía ​​ser analista, y estoy de acuerdo con el título de “menos sexy”.

El “científico de datos” es bastante ambiguo y generalmente se reduce a una combinación de “ingeniero de aprendizaje automático”, “ingeniero de datos” y “analista”. Es muy común ver a las personas discutir sobre lo que hace a un científico de datos “real”, o “qué tipo” de científico de datos (que se puede responder con una de las 3 categorías que mencioné anteriormente).

Analista es un término común utilizado en muchas industrias y campos, pero creo que “analista de datos” especifica bastante bien la naturaleza más técnica, y es difícil de entender mal al menos en Silicon Valley.

Claro, “analista” no es tan genial como “científico”, pero en finanzas, las personas que hacen un trabajo técnico muy sofisticado que es mucho más complejo matemáticamente que la mayoría de las compañías de Silicon Valley también tienen el título de “analista”.

Si se supone que el título proporciona más detalles sobre el trabajo, desearía que las personas usen “analista de negocios” para un rol de analista menos técnico, “analista de datos” para un analista que sabe más de matemáticas y código, algo así como “investigador” o ” estadístico “para alguien que sabe mucho sobre optimización / estadísticas pero no implementa el código en producción, e” ingeniero de aprendizaje automático “para alguien que implementa código de producción. “Científico de datos” suena más específico y, para muchas personas, más senior y genial, pero es realmente ambiguo.

Analista de datos: (principalmente análisis de datos)

Cuando se trata del analista de datos, deben aprender sobre los detalles del negocio y encontrar factores / parámetros que mejorarán el negocio;

Por ejemplo :

a) Usarán fórmulas / estadísticas matemáticas para mejorar el resultado del negocio y encontrar los factores que ayudarán a lograr las metas y objetivos de los escenarios de usuarios comerciales.

b) Encontrar los patrones del futuro alcance comercial mediante la generación de nuevos ingresos de los productos o servicios con técnicas de análisis de datos factuales y el interés / semejanza de las personas hacia el producto o servicio en particular, por lo que cuando se trata del mercado venderán el producto en consecuencia, ya sea interés o probabilidad de las personas, así como mejorar la calidad del producto / servicio;

c) Intentarán recopilar los datos a través de encuestas o comentarios; Solo van a predecir y encontrarán los escenarios exactos del mundo real cerca de lo que sucederá en el futuro simplemente recopilando los datos y analizándolos; Los trucos matemáticos funcionarán aquí;

d) Pero aquí nunca implementarán nada en el producto / servicio;
Simplemente recopilan los datos de las personas y les brindan los detalles de entrada, así como también les dirán los mejores detalles posibles de resultado (salida) cuando hagan / mejoren su producto o servicio, será la tendencia más importante en el mercado futuro ;

Científico de datos: (Principalmente implementaciones)

Usando algoritmos de aprendizaje automático y / o tecnologías de big data que implementarán en sus productos / servicios,

Por ejemplo :

a) tomarán los requisitos de entrada de los analistas de datos sobre lo que han recopilado datos e información, así como cuáles fueron los resultados esperados;

b) Encontrarán cuáles fueron los mejores algoritmos de aprendizaje automático, que capacitarán a los modelos matemáticos / comerciales para que lleguen los resultados esperados;

c) Una vez que encuentren los mejores algoritmos de ML, intentarán probar con conjuntos de datos de muestra que van desde datos pequeños a grandes e intentarán con otras formas posibles; Una vez que los modelos de capacitación esperados funcionen bien, liberarán ese producto en el entorno de producción;

Los analistas de datos son principalmente personas que desarrollan información del producto con datos .

Los científicos de datos son principalmente personas que desarrollan modelos y productos de datos, que a su vez producen ideas.

Hay superposiciones, por lo que la diferenciación no es clara, pero los analistas tienden a ser usuarios de datos en lugar de constructores de modelos / productos.

Por lo tanto, en la medida en que los conocimientos se entreguen sin construir modelos y productos, el título apropiado para ‘personas que desarrollan conocimientos del producto’ probablemente sería analistas de datos. Si los modelos y productos entran en escena, sería un buen caso para usar el término científico de datos.

Al menos en mi opinión de cámara de eco, sesgada, geográficamente mal muestreada 🙂

Me encanta el título de “científico de datos”. Creo que describe con precisión la búsqueda de encontrar información de los datos de una manera que resuelva el problema.

Un analista, en mi opinión, tendría la tarea de encontrar algo accionable a partir de los datos, pero no se le exigirá que cree un sistema para hacerlo que sea repetible.

Un científico de datos trabaja en todo, desde obtener los datos, el proceso para detectar y limpiar anomalías, hacer resúmenes a partir de ellos y luego trabajar en los resúmenes hacia una inteligencia empresarial procesable.

Creo que es difícil decir que solo hay un título que desarrolle información sobre el producto. Creo que ambos derivan ideas, pero de diferentes maneras.

Como mencionó Hakon, el analista de datos busca principalmente patrones y conocimientos para responder preguntas relacionadas con el negocio. Dedican entre el 70 y el 80% de su tiempo a investigar los datos para ver si están trabajando con información valiosa. Desarrollan información sobre el producto al comprender las tendencias en los datos, limpiar los datos y realmente perfeccionar el producto en sí.

Por otro lado tienes datos científicos. Ellos son los que toman los datos limpios y crean / implementan algoritmos que mejorarán el negocio. Desarrollan una visión del producto con los datos al comprender las necesidades de la empresa y los clientes, y luego implementan una solución.

Creo que “científico de datos” es un término que se usa más como adjetivo que como sustantivo. El “analista de datos” se utiliza más como sustantivo que como adjetivo.

Se supone que existen diferencias sustanciales entre los analistas de datos y los científicos de datos. Pero el mercado está demasiado sobrevalorado ahora, y en esas situaciones los adjetivos se hacen cargo.

Recuerde que lo que define el valor de un profesional para su negocio es lo que hacen. Olvida el nombre, concéntrate en la descripción del trabajo.

Si necesita un nombre para eso, llámelos científicos de datos, ninjas de datos, gurús de números o incluso querida, si lo desea.

Pero, si están trayendo las buenas ideas, recompénselos bien.

En un entorno laboral, el gerente de contratación, el profesional de recursos humanos y el sistema de puestos de trabajo de la empresa otorgan los títulos de trabajo. Esto significa que el título del trabajo, científico de datos o analista de datos, tiene significado entre muchos trabajos en la empresa. Cada uno de ellos ofrece responsabilidades, un conjunto de habilidades básicas, un objetivo informado y un equipo de profesionales con estudios y capacitación similares. Generalmente tratan los mismos temas, temas, productos y servicios, tipos de personas y propósitos funcionales para la empresa. Si se prefiere la escala de educación y destreza según la clasificación, podría ser apropiado colocar un analista de datos en un conjunto de habilidades y educación menor que un científico de datos. También tiene sentido con un entorno de equipo, colaborar en la resolución de problemas y contribuir a la conclusión de que cada uno cumple funciones complementarias y complementarias. Luego, su trabajo contribuye a un equipo y amplifica todo su valor. La disputa sobre los títulos de trabajo es cruda, por lo general para las personas que buscan rangos ascendentes en una empresa, la caza furtiva entre empresas o la transferencia de su crédito a un título en el mercado. Tienen una ligera justificación para luchar por el título, pero también un fin práctico con un equipo, una empresa y una propuesta de valor para hacer el trabajo requerido, cumplir con los deberes y trabajar hacia los objetivos de la empresa. Pueden mejorar su contribución general a la disciplina, si también mantienen y desarrollan relaciones con instituciones académicas que capacitan a las personas en su conjunto de educación y habilidades, trabajan con profesionales en empresas que compiten o comparten suministros, o hacen investigación de mercado en su industria y en grandes países. cuestiones.

Para mí, mi preferencia es ‘Data Scientist’.

Hay un mejor caché asociado con el título de Data Scientist, que las personas valoran más y pagan más.

Pero, ¿qué hay en un nombre, realmente?

“Científico de datos”, aunque de mala gana.

Permítanme presentar esto diciendo que realmente no me gusta el término “científico de datos”. La estadística no es un campo particularmente nuevo, y durante mucho tiempo fue el dominio de científicos sociales académicos, economistas del gobierno, actuarios y ajustadores de riesgos de seguros sin que se volviera sexy o promocionado. Es solo con la entrada de las compañías de Internet cuando esta profesión bastante antigua y mohosa cambió de nombre y se convirtió en algo nuevo que en realidad no era muy nuevo. El lado CS inyectó muchos algoritmos nuevos y un enfoque renovado en métodos puramente predictivos en lugar de inferencia estadística, ya que muchos de los productos vivos no necesitan ninguna inferencia. Aunque muchos científicos de datos siguen realizando regresiones todo el día, lo cual no es algo muy nuevo en lo más mínimo.

Supongo que “científico de datos” podría interpretarse en el sentido de que la persona tiene una mayor capacidad de programación y tal vez podría escribir un código de calidad de producción. Sigo pensando que la mayoría de los científicos de datos no pueden escribir código de calidad de producción, y esto es mejor dejarlo en lo que se llamará ingeniero de datos (lo que podría ser una señal de que las estadísticas y el lado CS de las cosas están comenzando a dividirse una vez más, dado que el modelado de datos y la programación / gestión de datos realmente son conjuntos de habilidades separados en los que la habilidad en uno solo está algo correlacionada con la habilidad en el otro). La automatización de cosas como la selección de variables / modelos es probablemente algo relativamente nuevo y podría ser una característica distintiva de un científico de datos. Pero no es que los estadísticos de antaño no pudieran escribir código, simplemente no podían escribir código muy bien , en promedio.

También es por esta razón que odio el término prueba A / B, es un ensayo controlado aleatorio, o simplemente un antiguo experimento simple, y es otro ejemplo de algo antiguo que recibe un nuevo nombre completamente innecesario. Pero ese es otro tema.

Volviendo al tema en cuestión, por mucho que no me guste el término “científico de datos”, por razones prácticas de trabajo, es mejor que el término “analista de datos”. Porque mientras que “científico de datos” es probablemente un cambio de marca de las estadísticas sobrevalorado, “analista de datos” o, más ampliamente, un “analista” es un término que se ha diluido tan profundamente que casi no tiene valor en el mercado laboral cuando se aplica a una empresa desconocida (la situación en la que su título anterior puede contar para algo). En la actualidad, “analista” se utiliza para casi cualquier cosa, desde la persona de TI que responde los tickets e instala el software hasta los MBA de baja calidad que hacen gráficos circulares en 3-D para la cadena de supermercados local. Técnicamente hablando, desarrollar ideas del producto con datos sería un “análisis” en términos del tipo de trabajo que es, mientras que el término “ciencia” es probablemente un poco más amplio y no específico para el puesto (si alguno de estos trabajos califica o no como La ciencia es otro tema). Entonces, en términos de semántica pura, yo diría que “analista de datos” es un poco más correcto. Pero no quiero que la gente me confunda con un “analista” que llama fríamente a la gente para vender hipotecas por teléfono.

Yo creo que tampoco.

Dicha persona es un consumidor de información derivada de los datos. Tomarían los conocimientos de los datos y los combinarían con una comprensión del mercado, además de comprender cómo construir cosas. Probablemente sea más una persona de gran panorama que un científico de datos o analista de datos.

Yo diría que probablemente “Product Manager”, aunque sea altamente técnico.

Debido al requisito de originalidad y descubrimiento, creo que el título de científico de datos es actualmente más preciso. Este es probablemente un artefacto de la etapa inicial de este campo. Similar al cambio de las ciencias de la computación a los grados de ingeniería de software a medida que el campo maduró. ¡Los mejores deseos!

Realmente no hay diferencia entre un científico de datos y un analista de datos. El título no importa, lo que hace es lo que haces.

El título de su trabajo puede ser “Conserje”, pero aún puede hacer modelos predictivos.

Por otro lado, puede ser un científico de datos y no tener modelos predictivos en la descripción de su trabajo.

Entonces … En conclusión: el título del trabajo no importa.

More Interesting

¿Cómo definimos objetivos y resultados clave (OKR) para el equipo de ciencia de datos?

Por ejemplo, en el caso en que mi distribución de probabilidad previa del parámetro se base en una muestra grande (vs pequeña), y mis datos actuales son pequeños, ¿cómo toma en cuenta el tamaño de muestra la inferencia bayesiana?

¿Cuáles son los principios básicos del procesamiento del lenguaje natural?

Cómo extraer datos de Twitter fácilmente

DeZyre o Udacity Nanodegree: ¿Cuál recomendarías para un aspirante a científico de datos?

¿Cuáles son los efectos negativos de los grandes datos?

¿Qué ideas procesables ha recopilado Netflix del análisis de big data? ¿Cómo influye en la habitación del escritor?

¿Existen estudios de big data en las cadenas de suministro?

¿Cuál es el mejor instituto para aprender ciencia de datos en Hyderabad / Bangalore?

¿Cuál es el futuro del big data en India?

¿Qué es la optimización basada en sustitutos?

En el aprendizaje automático, si no sé mucho sobre la corrección de lo anterior, ¿puedo tratar de corregir el modelo a través de grandes cantidades de datos de entrenamiento?

¿Qué hace a un buen científico de datos? ¿Cómo superan los principales científicos de datos a otros generalistas (es decir, actuarios de P&C, analistas de negocios) en análisis predictivo?

¿Cuál es la diferencia entre estadística computacional y ciencia de datos?

¿Cuál es la diferencia entre los informes de datos y la integración de datos, en el análisis de datos?