¿Cuál es la diferencia entre un científico de datos y un analista de inteligencia de negocios?

Hay muchas buenas respuestas. Sin embargo, la mayoría son demasiado largos para ser útiles o demasiado obstinados. Muchos también están contaminados por el efecto Dunning-Kruger [1], por el cual las personas no calificadas sobreestiman erróneamente su habilidad.

Estoy calificado para responder esto porque trabajo y empleo a ambos tipos de personas en Perfect Price, una compañía de inteligencia artificial para la fijación de precios.

Los analistas de negocios abordan preguntas específicas en un plazo más corto, no para la producción. Los científicos de datos resuelven problemas mayores para la producción. Los científicos de datos están mejor pagados que los analistas de negocios porque el suyo es el rol de mayor valor más calificado, y hay menos personas calificadas para ese rol en el mercado. Un analista de negocios puede adquirir habilidades, obtener un doctorado, etc., y convertirse en un científico de datos, pero en general un rol de científico de datos requiere al menos una maestría en ciencias de la computación, física o matemáticas, porque el trabajo requiere habilidades profundas.

Eso es. Puede seguir leyendo para ver ejemplos y advertencias, pero esa es mi respuesta corta.

Un ejemplo, en caso de que necesites uno

Si fuera gerente de producto en Netflix y quisiera saber cómo funciona la búsqueda, podría pedirle a un analista de negocios que investigue. Podrían hacer mucho SQL, tal vez incluso usar aprendizaje automático, para analizar los datos sin procesar y descubrir áreas subóptimas. Digamos que descubren que nuestra búsqueda en español fue menos efectiva que en inglés, lo que resultó en una tasa de abandono del 1% mayor.

Un Data Scientist podría entonces trabajar en mejorar el algoritmo de búsqueda para la búsqueda en español que puede integrarse en nuestro sitio web y aplicaciones. El analista de negocios no podría tener la tarea de esto. Primero, no está calificado para trabajar en la plataforma de búsqueda principal. En segundo lugar, hay otras preguntas comerciales para analizar.

Si ese modelo de Data Scientist elimina la brecha de rendimiento y reduce la tasa de abandono de hispanohablantes en un 1%, suponiendo que los suscriptores de Netflix sean proporcionales a la población de los EE. UU. (17% son hispanos), ese equipo solo le ahorró a la compañía $ 13.6 millones por año. Si bien es un esfuerzo de equipo, el jugador de mayor valor en ese equipo, el Seph Curry, es el Científico de Datos. Pero todavía necesitan ese analista de negocios.

Una advertencia

A diferencia de ciertas profesiones, doctor, abogado, no hay reglas o costumbres sobre el título, y el significado de los títulos puede variar de una compañía a otra. Por ejemplo, la mayoría de las compañías tecnológicas tienen empleados con el título de “Director”. En Cisco, solo puede ser Director si dirige una unidad comercial de mil millones de dólares. La mayoría de las empresas no tienen ni siquiera una unidad comercial de mil millones de dólares. Entonces, no todos los roles de Director son iguales.

El mismo matiz se aplica con los títulos de datos. Varía de compañía a compañía. Lo anterior es una generalización. Esto puede ofender a algunas personas; Lo siento si lo hace. Espero que nuestros empleados (y posibles empleados) lo lean porque la claridad en el rol y la responsabilidad es clave para prosperar.

Y lo admitiré felizmente, por mi parte, no estoy calificado para ser un Científico de Datos, y eso está bien. Pero no me gustaría degradar a mi cofundador y más de 15 años de arduo trabajo de CTO en Microsoft, Twitter, Disney y Drawbridge, o ~ 7 años de doctorado, para sentirme mejor.

Notas al pie

[1] Efecto Dunning-Kruger – Wikipedia

Un científico de datos es una persona que tiene más conocimiento de programación que una persona de Estadística o Inteligencia de Negocios, pero menor que un desarrollador de Software, mientras que, por otro lado, tiene más conocimiento de Datos como algoritmos, estadísticas, matemáticas, etc., que un desarrollador de software, pero menor que un estadístico

Para un científico de datos, hay bastantes dominios en los que necesita tener manos. Algunos de ellos que son muy importantes son:

  • Lenguaje de programación: Java, C ++, Ruby, Python, R, Scala, Octave
  • Extracción de características: convolución, wavelets, análisis de series de tiempo, transformadas de Fourier, conocimiento de DSP
  • Estadísticas: prueba de Chi-cuadrado, valores p, prueba F, error estándar, AROC, curva ROC, prueba de hipótesis
  • Bases de datos: MySQL, MongoDB, Casandra, CouchDB, HDFS-Hadoop
  • Tecnologías: Django, Ruby-on-Rails, Groovy, Lift, Thrift, Avro, Protobufs, Hadoop / Mahout API, Node
  • Paquetes de minería de datos: Weka, Statistica QC miner, SAS, SPSS, Rapidminer
  • Algoritmos útiles: ANN, red bayesiana, SVM, modelado gráfico probabilístico, HMM, MCMC
  • Visualización: D3.js
  • Depuración: PDE, análisis numérico, multiplicadores de Lagrange, álgebra lineal, procesos estocásticos, cálculo vectorial
  • Y, por supuesto, el conocimiento de los negocios es imprescindible.

Mientras que para un ingeniero de BI, profundiza en la comprensión de los negocios más y proporciona análisis de datos ad hoc utilizando herramientas de BI como SAS, SPSS, herramientas de MS Office, Tableau, Pentaho. Su enfoque principal es proporcionar análisis de toma de decisiones de gestión de bases de datos utilizando las herramientas de plataforma.

Hola abdulaziz

La diferencia clave entre la ciencia de datos y la inteligencia de negocios es que la inteligencia de negocios informa principalmente sobre datos históricos (tendencias, patrones, series de tiempo, etc.) mientras que la ciencia de datos se enfoca principalmente en datos predictivos (es decir, análisis predictivo, pronóstico, y si el análisis y etc.)

Aquí hay un gran artículo (pegado a continuación) que puede ampliar su pregunta: http://www.itproportal.com/2016/…

Perspectiva

Los sistemas de BI están diseñados para mirar hacia atrás en base a datos reales de eventos reales. Data Science mira hacia adelante, interpretando la información para predecir lo que podría suceder en el futuro.

Atención

BI ofrece informes detallados, KPI y tendencias, pero no le dice cómo se verán estos datos en el futuro en forma de patrones y experimentación.

Proceso

Los sistemas de BI tradicionales tienden a ser estáticos y comparativos. No ofrecen espacio para la exploración y la experimentación en términos de cómo se recopilan y gestionan los datos.

Fuentes de datos

Debido a su naturaleza estática, las fuentes de datos de BI tienden a planificarse previamente y agregarse lentamente. La ciencia de datos ofrece un enfoque mucho más flexible, ya que significa que se pueden agregar fuentes de datos sobre la marcha, según sea necesario.

Transformar

También es clave cómo los datos ofrecen una diferencia para el negocio. BI le ayuda a responder las preguntas que conoce, mientras que Data Science lo ayuda a descubrir nuevas preguntas debido a la forma en que alienta a las empresas a aplicar sus conocimientos a los nuevos datos.

Almacenamiento

Como cualquier activo comercial, los datos deben ser flexibles. Los sistemas de BI tienden a almacenarse y aislarse, lo que significa que es difícil de implementar en todo el negocio. Data Science se puede distribuir en tiempo real.

Calidad de los datos

Cualquier análisis de datos es tan bueno como la calidad de los datos capturados. BI proporciona una versión única de la verdad, mientras que la ciencia de datos ofrece precisión, nivel de confianza y probabilidades mucho más amplias con sus hallazgos.

Propiedad de TI versus propiedad de la empresa

En el pasado, los sistemas de BI a menudo eran propiedad y operados por el departamento de TI, enviando inteligencia a los analistas que la interpretaban. Con Data Science, los analistas están a cargo. Las nuevas soluciones de Big Data están diseñadas para ser propiedad de analistas, que dedican poco de su tiempo al ‘mantenimiento de TI’ y la mayor parte de su tiempo analizando datos y haciendo predicciones sobre las cuales basar las decisiones comerciales.

Análisis

Un sistema de BI retrospectivo y prescriptivo es mucho menos probable que se coloque para hacer esto que un programa de Ciencia de datos predictivos.

Valor de negocio

El análisis de datos debe informar las decisiones comerciales en el mejor interés de la empresa, lo que significa demostrar valor aquí y ahora y predecirlo en el futuro. Data Science está mucho mejor ubicado para hacer esto que BI.

Mirando lo anterior, no debería sorprendernos que las compañías estén incrementando sus inversiones en estrategias de Big Data y plataformas de entrega, impulsadas por Data Science. Sin embargo, la inversión financiera es secundaria al cambio mental que se requiere para tener verdadero éxito con Big Data. Deben presentarse puntos de prueba y casos de uso para convencer a todos los interesados ​​clave para que cambien a la cultura basada en datos que es una base necesaria para una estrategia exitosa de Big Data Analytics, que es lo que veremos en nuestra publicación de blog final en estas series.

Creo que la pregunta ¿Los científicos de datos estarán a la altura de nuestras expectativas o los grandes datos serán una decepción? tiene algunas respuestas que son relevantes para esta pregunta.

Si bien hay muchas personas que discuten en ambos sentidos, generalmente encuentro que las siguientes diferencias son generalmente aceptadas:

  • Los científicos de datos trabajan con una combinación de herramientas de Big Data como Hadoop / Map-Reduce / Hive, NoSQL, MPP, bases de datos tradicionales y, básicamente, cualquier cosa que almacene / tenga datos. También tienden a tener un conjunto de habilidades tecnológicas más fuertes, ya que también son programadores, y también tienen habilidades matemáticas muy fuertes, particularmente en cosas como las estadísticas. También he visto que un científico de datos generalmente necesitaría saber cómo visualizar datos. El científico de datos también necesita tener una sólida comprensión del negocio, ya que normalmente trabajarían directamente con el negocio. Creo que este es un papel en el que, de manera realista, muy pocas personas podrían ocupar, incluso con una amplia capacitación.
  • Un analista de BI sería una persona que trabaja con herramientas de BI para realizar análisis. En términos generales, serían una persona que está algo educada en el almacenamiento de datos y comprende cómo se modela un esquema estelar. Esto les permite hacer cosas como realizar análisis ad-hoc a través de una herramienta de informes o usando SQL para crear los cuadros, gráficos, hojas de Excel, etc. que requieren los usuarios comerciales. También pueden servir como intermediarios entre las empresas y la TI al crear una nueva funcionalidad de BI. Básicamente trabajará más con la tecnología y los usuarios comerciales en lugar de tratar de desempeñar ese papel único.

Data Science es diferente al Business Analytics tradicional en algunas áreas clave. Por ejemplo, ciencia de datos …

  • utiliza análisis predictivos y prescriptivos para predecir lo que podría suceder usando probabilidades y niveles de confianza, no solo herramientas de informes para informar sobre lo que sucedió. Nota: cuando tratamos con datos históricos, existe un fuerte deseo y necesidad de que los datos sean 100% precisos. Si tiene resultados financieros incorrectos durante el último trimestre, es probable que la gente vaya a la cárcel. Sin embargo, la predicción del rendimiento para el próximo trimestre generalmente se mide en probabilidades y niveles de confianza (por ejemplo, “Hay un 95% de confianza de que nuestros ingresos vendrán en el próximo trimestre entre $ 200M a $ 212M).
  • se utiliza para tratar y mitigar la incertidumbre en los datos. Utiliza varias técnicas analíticas y de visualización para comprender dónde puede estar la incertidumbre en los datos, y luego utiliza técnicas de transformación de datos para dar masajes a los datos en una forma viable, no perfecta, pero nuevamente no es necesaria cuando se trata de probabilidades y no absolutas.
  • es capaz de crear transformaciones de datos según sea necesario (en comparación con el proceso tradicional de ETL) para poner los datos en un formato que pueda combinarse con otras fuentes de datos en busca de información sobre clientes, productos y operaciones.

Ref: ¿Analista de inteligencia de negocios o científico de datos? ¿Cual es la diferencia?

Espero que sea útil.

Muy a menudo la gente confunde con los siguientes roles laborales. Tiene que verificarse primero claramente. De lo contrario, vamos a dejar más graduados que vivan con la esperanza de triunfar en el mercado y luego descubriremos que su puesto de trabajo no es la opción correcta.

Programador de software de computadora:

Alguien que escribe código y programación. Pueden crear sitios web o cualquier herramienta que tenga alguna utilidad práctica.

Estadístico:

Alguien que tiene buen conocimiento en modelos estadísticos y probabilísticos. Uno que puede generar hipótesis y probarlas para cualquier conjunto de datos dado.

Matemático:

Alguien que tenga buenos conocimientos en observación empírica y que pueda desarrollar modelos y fórmulas basados ​​en patrones observados.

Lingüista:

Alguien que tiene buen conocimiento en la comprensión de la semántica y la sintaxis de los idiomas. Comprender las reglas de gramática y estructura en las que se forma el lenguaje.

Programador de aprendizaje automático:

Uno que es muy bueno en el desarrollo de algoritmos tanto de aprendizaje como estadísticos.

Programador de lenguaje natural:

Aplique las reglas semánticas y sintácticas y forme los patrones para identificar los patrones ocultos.

Ingeniero de Big Data:

Uno que procesa datos a gran escala a través de un enfoque distribuido o paralelo.

Ahora puedo explicar claramente la necesidad de que el científico de datos sea un experto en todo el campo mencionado anteriormente.

Estamos tratando con tres tipos diferentes de datos:

a) Estructurado

b) Desestructurado

c) semiestructurada

La mayor parte del problema de BI está estructurado en la naturaleza. Vas a analizar los datos de la hoja de Excel o del servidor mysql. Los problemas están relacionados principalmente con la predicción y el pronóstico. Por ejemplo: ¿Cuántos productos se pueden comprar en los próximos 2 meses? ¿Cuál es el ingreso de la empresa en 1 año? O simplemente visualización a veces para descubrir los patrones interesantes.

Pero un científico de datos tiene que ir una capa más allá para comprender los patrones ocultos de los datos no estructurados y semiestructurados también. Por ejemplo: en el texto no estructurado, se puede extraer mucha información vital para identificar la condición de los pacientes. IBM Watson está utilizando datos estructurados, semiestructurados y no estructurados para comprender las percepciones de los pacientes clínicos. Diría que aunque el científico de datos es alguien que debería tener un muy buen conocimiento en programación de aprendizaje automático, lingüística y modelos estadísticos. Además, los datos que estamos tratando tienen que ser agnósticos. Vea los videos de Ted sobre cómo el fundador de Kaggle pudo administrar una compañía que predice los conocimientos de los datos de resonancia magnética para biomarcadores de cáncer. Tiene muy poco conocimiento en el dominio médico. Pero ha logrado dirigir una empresa con éxito.

El ingeniero de Big Data no debe confundirse con el científico de datos. Big data es una herramienta. Una herramienta muy poderosa para manejar conjuntos de datos a gran escala. Si alguien afirma que tiene un modelo predictivo muy bueno y puede distribuir en varias máquinas, significa que puede distribuir en grandes grupos de hadoop o spark y luego ejecutar el modelo de clasificación. Significa que pueden construir un modelo de clasificación para miles de millones de filas en 2-3 horas y luego dar los resultados de inmediato. Alguien que puede construir una gran escala de grupos de redes gráficas de vías de cáncer e identificar la mutación potencial responsable del cáncer. Esa es la diferencia.

Trataré de mantener esto simple. (Especialmente para personas no técnicas)

Déjame explicarte con una simple analogía. Cuando un maestro de escuela enseña a los estudiantes, se basa en el contenido de los libros de texto para explicar la idea básica a los estudiantes. Entonces, el contenido del libro de texto es crucial para el proceso de pensamiento del estudiante. No puede ser vago y aleatorio. Tiene que estar bien pensado y, por lo tanto, requiere experiencia.

Pero el maestro también puede ser creativo y único al explicar conceptos a los estudiantes. Puede agregar su propio estilo y hacer las cosas. Su trabajo es usar el contenido de una manera para que los estudiantes lo entiendan.

En el ejemplo anterior, la persona que escribe el contenido del libro de texto (el que necesita experiencia y mucha investigación) es el Científico de Datos, el maestro que necesita enseñar el contenido (datos actuales) es el Analista de Negocios y los estudiantes son los clientes.

Hola,

La inteligencia empresarial y la ciencia de datos a menudo van de la mano porque ambos campos se centran en derivar información empresarial de los datos. Sin embargo, los científicos de datos son promocionados regularmente como los unicornios del análisis de big data.

Si bien muchas de las responsabilidades, técnicas y objetivos de los analistas y científicos de datos coinciden estrechamente, existen grandes diferencias entre los conjuntos de habilidades requeridos y los resultados esperados para cada trabajo.

Para que su negocio prospere, necesita saber qué está funcionando, qué no y cómo mejorar. ¿Eso es obvio, pero descubrir cómo hacerlo? Esa es una parte difícil.

Anteriormente, la inteligencia de negocios era algo que solo las empresas podían disfrutar porque el uso de software de análisis era costoso y requería construir centros de datos y contratar especialistas de TI, y también son costosos.

Sin embargo, el tiempo ha cambiado porque los datos aumentan cada día. En términos de volumen y variedad, y las empresas necesitan ciencia de datos para poder aprovechar las oportunidades de mercado más rápido que sus competidores. La inteligencia empresarial y la ciencia de datos son bestias distintivamente diferentes.

Ciencia de datos versus inteligencia empresarial

El uso de la ciencia de datos permite a las organizaciones dejar de ser retrospectivas y reactivas en su análisis de datos, y comenzar a ser predictivas, proactivas y empíricas. Pasar de la inteligencia empresarial tradicional (BI) a adoptar la ciencia de datos es un gran cambio y una parte fundamental para convertirse en una organización basada en datos. Al tomar una visión empírica de sus datos e implementar herramientas como las bases de datos Hadoop y NoSQL, una organización del sector público puede transformar sus operaciones por completo. Si eso significa quitarle presión al almacén de datos, y así reducir los costos; o impulsar mejoras en la eficiencia a través de recomendaciones para cambios en el proceso, la oportunidad es enorme.

Para sobrevivir y prosperar en el mercado cada vez más competitivo, así como para poder resolver problemas comerciales complejos, impulsar la innovación y el crecimiento, las empresas deben cambiar su enfoque de BI tradicional a la ciencia de datos. Data Science cambia el juego para prácticamente todas las industrias. Cuando se usa junto con el análisis predictivo, permite a las organizaciones obtener información en tiempo real y hacer predicciones futuras que aumentan la comprensión del comportamiento del cliente, mejoran la respuesta a los clientes y ofrecen una ventaja competitiva tangible. Para darle un poco de contexto, aquí hay 10 diferencias clave entre los dos:

Perspectiva

Los sistemas de BI están diseñados para mirar hacia atrás en base a datos reales de eventos reales. Data Science mira hacia adelante, interpretando la información para predecir lo que podría suceder en el futuro.

Atención

BI ofrece informes detallados, KPI y tendencias, pero no le dice cómo se verán estos datos en el futuro en forma de patrones y experimentación.

Proceso

Los sistemas de BI tradicionales tienden a ser estáticos y comparativos. No ofrecen espacio para la exploración y la experimentación en términos de cómo se recopilan y gestionan los datos.

Fuentes de datos

Debido a su naturaleza estática, las fuentes de datos de BI tienden a planificarse previamente y agregarse lentamente. La ciencia de datos ofrece un enfoque mucho más flexible, ya que significa que se pueden agregar fuentes de datos sobre la marcha, según sea necesario.

Transformar

También es clave cómo los datos ofrecen una diferencia para el negocio. BI le ayuda a responder las preguntas que conoce, mientras que Data Science lo ayuda a descubrir nuevas preguntas debido a la forma en que alienta a las empresas a aplicar sus conocimientos a los nuevos datos.

Almacenamiento

Como cualquier activo comercial, los datos deben ser flexibles. Los sistemas de BI tienden a almacenarse y ensuciarse, lo que significa que es difícil de implementar en todo el negocio. Data Science se puede distribuir en tiempo real.

Calidad de los datos

Cualquier análisis de datos es tan bueno como la calidad de los datos capturados. BI proporciona una versión única de la verdad, mientras que la ciencia de datos ofrece precisión, nivel de confianza y probabilidades mucho más amplias con sus hallazgos.

Propiedad de TI versus propiedad de la empresa

En el pasado, los sistemas de BI a menudo eran propiedad y operados por el departamento de TI, enviando inteligencia a los analistas que la interpretaban. Con Data Science, los analistas están a cargo. Las nuevas soluciones de Big Data están diseñadas para ser propiedad de analistas, que dedican poco de su tiempo al ‘mantenimiento de TI’ y la mayor parte de su tiempo analizando datos y haciendo predicciones sobre las cuales basar las decisiones comerciales.

Análisis

Un sistema de BI retrospectivo y prescriptivo es mucho menos probable que se coloque para hacer esto que un programa de Ciencia de datos predictivos.

Valor de negocio

El análisis de datos debe informar las decisiones comerciales en el mejor interés de la empresa, lo que significa demostrar valor aquí y ahora y predecirlo en el futuro. Data Science está mucho mejor ubicado para hacer esto que BI.

¡Intentaré hacer esto interesante para un espectador no técnico!

Business Intelligence Analyst es quien trae comestibles y verduras a la cocina. Él / ella se abastece de diferentes tiendas en diferentes ubicaciones. Los almacenan cuidadosamente en contenedores adecuados para que sea fácil de recuperar y finalmente traigan la porción suficiente de ellos a la cocina.

Los científicos de datos trabajan con estas porciones de comestibles y verduras en la cocina y cocinan algo realmente delicioso.

Ahora sobre la ligera superposición de estas profesiones:
Los científicos de datos pueden trabajar incluso sin los sistemas de Business Intelligence, pero imagina que si estás cocinando para toda la ciudad, es prácticamente imposible que lo obtengas tú mismo. Pero entonces, si es solo para ustedes dos, entonces probablemente puedan comprarlo usted mismo.
¡Y sí, también puedes consumir verduras / comestibles crudos sin la necesidad de un cocinero, solo que se vuelven más significativos con un cocinero maravilloso!

Línea de fondo:

Analista de Business Intelligence: más de informática – menos de matemáticas
Científico de datos: más de matemáticas – menos de informática

Si está tratando de responder QUÉ, DÓNDE, CUÁNTO, QUIÉN, CUÁNDO tipo de preguntas, entonces solo necesita un analista de Business Intelligence para reunir todos sus datos a partir de los cuales pueda comprender mejor su negocio. (Las matemáticas involucradas son muy básicas, generalmente limitadas a Suma, Promedio, Producto, Porcentajes, etc., mientras que el uso de BI, ETL, herramientas de base de datos es más)

Pero si sus preguntas son por qué, qué, qué, etc., que necesitan matemáticas y estadísticas de mayor nivel, entonces necesita un científico de datos.

A principios de este año, formé parte de un equipo de investigación que compiló el Informe de Habilidades y Salarios 2015 para la SIP (Instituto de Profesionales de Análisis de Australia). Intentaré responder a esta pregunta en general para proporcionar cierta intuición y luego compartir un poco de datos.

Pero primero, déjame poner un diagrama de Venn.

Mi bosque al azar te predice rodar los ojos. Pero ten paciencia conmigo.


Espero que muchos de los lectores de esta pregunta se hayan encontrado con el otro Venn de ciencia de datos de ‘habilidades de piratería’, ‘matemáticas y estadísticas’ y ‘experiencia sustantiva’.

Esa es una gran foto. El problema es que no te dice sobre los roles . Y con muchos científicos de datos de marca propia, se vuelve complicado. (El otro problema es, bueno, intente poner cualquier diagrama con ‘habilidades de piratería’ frente a los departamentos de TI en grandes empresas y hágame saber cómo le va).

Entonces uso este diagrama. Está tomado de un curso de maestría que estoy completando, y fue desarrollado por profesionales de la industria en el campo de la analítica. Pero lo más importante, tiene roles en las superposiciones 🙂

La respuesta a esta pregunta está en el Venn, pero primero también vale la pena ver los puntos en común.

Tanto los científicos de datos como los analistas de BI realizan visualizaciones.

Las herramientas son solo herramientas.

Los analistas de BI pueden ser parte de la implementación de una visualización (o algunos de ellos en un tablero) en un entorno de ‘producción’ más que los científicos de datos. Pero ciertamente ambos ‘hacen’ (conceptualizar, diseñar y construir) visualizaciones.

Tanto los científicos de datos como los analistas de BI trabajan con fuentes de datos.

Administrar datos es solo administrar datos.

Algunos pueden trabajar con tecnologías de almacenamiento de datos tradicionales, esquemas en estrella, tablas normalizadas y cubos de BI. Algunos pueden funcionar con tecnologías de almacenamiento distribuidas o basadas en la nube más modernas. Pero ambos trabajan con fuentes de datos.

Tanto los científicos de datos como los analistas de BI hacen programación.

La codificación es solo codificación.

Cargar una biblioteca de modelado en Python, escribir scripts o consultas SQL para realizar y verificar ETL, o crear una aplicación D3, por lo general, puede existir en partes muy diferentes de una tubería de proyecto de análisis. Pero todos requieren habilidades de programación.

Pero además de eso, se espera que los científicos de datos estén alfabetizados estadísticamente, realicen experimentos, interpreten datos con una mente en la causalidad y, con mayor frecuencia, modelen.

Esa es la principal distinción en mi mente, y la respuesta de alto nivel a esta pregunta. Estoy seguro de que los analistas de BI pueden hacer estas cosas si lo desean, y no dudo que muchos de ellos tengan la capacidad de hacerlo. Pero no serían responsables de ello.

La experimentación, la interpretación estadística, más la construcción, prueba y uso de modelos, ya sean estadísticos, de optimización, series temporales o aprendizaje automático, se sientan principalmente con los científicos de datos.


En segundo lugar, en el nivel más detallado, verá que estas declaraciones de alto nivel ocultan muchas excepciones. Esto también explica parcialmente la variabilidad de las respuestas a esta pregunta. A nivel de la industria, verá que la categorización está llena de frases como ‘más probable’, ‘más común’, etc.

Esta es la realidad subyacente. No hay absolutos en herramientas o habilidades. Pero esto da un poco más de sabor a las diferencias entre los roles de BI y científico de datos (al menos en el mercado australiano).


Puede descargar el documento aquí.

ps A los detalles de la pregunta, en mi humilde opinión, no es para nada sorprendente que haya muchas personas que cambien su marca en la ciencia de datos. Cuando elabora un paquete de sueldos más altos con un espacio incipiente que a menudo los reclutadores y las empresas contratantes no comprenden, existen oportunidades para que las personas se “intercambien” de manera oportunista. Es desafortunado ya que eso perjudica a la profesión, pero las cosas están madurando rápidamente y espero que las prácticas de contratación se endurezcan pronto.

Una gran diferencia entre un Científico de Datos y un Analista de BI es el objetivo final y cómo cada uno trabaja con datos para alcanzarlo.

Exploramos esta pregunta un poco más y encontramos las diferencias clave entre los cuatro profesionales de datos principales: ingeniero de datos, arquitecto de datos, analista de datos y científico de datos .

A continuación se muestra nuestro gráfico que muestra las diferencias clave en las responsabilidades y un breve resumen de la diferencia entre un Científico de Datos y un Analista de Datos. Puede encontrar el artículo completo que compara los roles y las habilidades requeridas (como los lenguajes de software) aquí: ¿Cuál es la diferencia entre los roles de la ciencia de datos?

Analista de datos: con una sólida formación en estadísticas y la capacidad de convertir datos de una forma cruda a un formato diferente (mezcla de datos), el analista de datos recopila, procesa y aplica algoritmos estadísticos a datos estructurados.

Científico de datos: la misión de un científico de datos es similar a la de un analista de datos: encontrar ideas procesables que sean clave para el crecimiento y la toma de decisiones de una empresa. Sin embargo, se necesita un rol de Científico de datos cuando el volumen y la velocidad de los datos de una empresa exceden un cierto nivel que requiere habilidades más sólidas para clasificar. Un científico de datos vadea datos no estructurados (big data) para identificar preguntas y extraer información crítica.

En realidad, estos son dos campos completamente diferentes con una tonelada de superposición. Alguien que es un científico de datos capacitado no está haciendo el trabajo de Business Intelligence y viceversa.

Aquí está la manera de entender la diferencia:

  • Un analista de inteligencia empresarial está tratando de comprender las tendencias que ya están disponibles en los datos y solo está modificando los datos para que sea más fácil visualizar lo que ya es aparente.
  • Un científico de datos está tratando de descubrir nuevas tendencias en los datos, y luego lo hace explícitamente disponible a través de varios algoritmos de limpieza y aprendizaje automático.

Si tengo un conjunto de datos, un desarrollador de Business Intelligence comprenderá qué datos están disponibles y desarrollará almacenes de datos y visualizaciones para exponer mejor esos datos. Un científico de datos comenzaría a realizar experimentos para crear nuevos conjuntos de datos, revelando tendencias que no se podrían descubrir con el análisis solo.

He leído la mayoría de las respuestas, algunas de ellas son realmente buenas. Me gustaría explicar la diferencia entre los dos de la manera más simple. Vamos a empezar.

Según Google, un científico de datos es una persona empleada para analizar e interpretar datos digitales complejos, como las estadísticas de uso de un sitio web, especialmente para ayudar a una empresa en la toma de decisiones.

En otras palabras, el científico de datos es un profesional que entiende los datos desde el punto de vista comercial. Es responsable de recopilar, analizar e interpretar grandes cantidades de datos para ayudar a las empresas a tomar decisiones empresariales precisas y rápidas. Para un científico de datos, hay dominios multidisciplinarios en los que necesita estar bien versado. Algunos de ellos incluyen: lenguaje de programación, extracción de características, paquetes de minería de datos, tecnologías (Django, Ruby-on-Rails, Thrift, Avro, Protobufs, Hadoop / Mahout API, Node), visualización, depuración, extracción de características y estadísticas.

Por otro lado, un analista de negocios es una persona que tiene una buena comprensión de la inteligencia de negocios y proporciona análisis de datos ad hoc utilizando herramientas de BI como Qlikview, Tableau y MSBI.

Espero que encuentre útil esta respuesta. Para cualquier consulta relacionada con esta publicación, puede comentar a continuación. Gracias por ahorrar tu valioso tiempo.

Las respuestas publicadas hasta ahora son geniales. Para ellos, agregaría que “bajo el capó” hay una diferencia significativa, pero tendrá que mirar de cerca para ver.

Los científicos de datos son científicos . Los analistas de BI son analistas . Y no, eso no significa que uno use una bata blanca de laboratorio y el otro un traje. 🙂 Es un problema de mentalidad.

Los científicos quieren entender por qué . Los analistas quieren obtener la “respuesta correcta” . Los científicos son intrínsecamente curiosos. Los analistas de BI se centran en obtener información procesable en las manos del cliente lo antes posible y no les importan los matices de los métodos subyacentes, a menos que vayan a arruinar la respuesta.

Ambos deben centrarse en el problema comercial en cuestión. Un científico de datos que se ve tan atrapado en los detalles matemáticos y de la informática que pierden el rastro de la aplicación es de poca utilidad.

En pocas palabras: los analistas de BI ven la limpieza de datos / disputas / munging como un mal necesario antes de llegar al problema. Los científicos de datos se dan cuenta de que la mezcla de datos ES el problema.

¿Tener sentido?

[¿Cuál es la diferencia entre un científico de datos y un analista de inteligencia de negocios?]

Gracias por el A2A …

En mi opinión, sobre todo una palabra: estadísticas. El científico de datos también puede tener habilidades de programación más mejoradas, o al menos diferentes. Ambos se beneficiarían de un buen conocimiento del dominio comercial, ambos tendrían que comprender los datos y cómo obtenerlos de una variedad de lugares. El analista de BI podría tener mejores habilidades para presentar información para la audiencia empresarial, pero en general no estarían construyendo modelos estadísticos o utilizando técnicas como el aprendizaje automático.

Para obtener más información sobre esta distinción y muchas otras cosas relacionadas, consulte el Diccionario de datos y análisis.

Un científico de datos a menudo se preocupa en gran medida por la infraestructura de datos. Un buen ejemplo de esto es escribir e implementar un sistema de detección de fraude en tiempo real. No solo tiene consideraciones de modelado estadístico, sino también consideraciones prácticas de rendimiento. Muchas personas, cuando piensan en científicos de datos, solo consideran el modelado. En realidad, mucho tiene que ver con hacer compensaciones prácticas y comprender la infraestructura de datos. Sin mencionar la limpieza y el mantenimiento de los datos.

Un analista de negocios está más enfocado en obtener información relevante “empresarial” que la alta dirección y los ejecutivos estarán interesados ​​en la comprensión estratégica. Esto puede incluir pronósticos, modelado de ingresos, informes mensuales, análisis ad hoc, etc. El trabajo de un analista de negocios es menos técnico pero requiere más contacto de un consultor con una narración limpia, hojas de cálculo organizadas y diapositivas concisas.

Finalmente, alguien en una posición de importancia necesita comprender las implicaciones del trabajo del analista de negocios. Quizás se esté estudiando un asunto específico de importancia. El trabajo del analista de negocios es responder cualquier inquietud lo mejor que pueda. Pero a menudo las respuestas son vagas y abiertas (“¿por qué no estamos obteniendo tantas cuentas como solíamos hacerlo?”), Lo que requiere creatividad.

Compare esto con el papel del científico de datos de implementar el sistema de detección de fraude en tiempo real. En su mayor parte, todos ya entienden lo que está haciendo. Solo confían en él y su equipo para hacer un buen trabajo.

Mientras tanto, un director de análisis debe tener una comprensión profunda de las necesidades y preocupaciones de datos y análisis de cada ejecutivo. El puesto requiere mucho más trabajo en red y se cruza con la estrategia.

El analista de negocios generalmente tiene una visión y responsabilidad más amplia que el científico de datos, cuyo trabajo es más técnico.

Un ser humano puede analizar visualmente entre 4 y 6 variables en un modelo particular (visualización de datos), mientras que el aprendizaje automático puede analizar entre cientos y miles de variables. Los analistas de BI crean visualizaciones, mientras que los científicos de datos crean y ejecutan modelos de aprendizaje automático. Las visualizaciones de datos son buenas para encontrar tendencias entre algunas variables, el aprendizaje automático (ciencia de datos) es ideal para encontrar correlaciones entre cientos o miles de variables.

La parte de la ciencia es primero ser un científico de datos, y la ciencia generalmente implica hacer grandes preguntas. Para los chicos de BI, los trabajos se orientan principalmente a identificar, analizar e informar tendencias de datos históricos.

En general, la línea entre los dos es bastante borrosa en diferentes configuraciones.

Existen estas 4 diferencias principales entre BI y ciencia de datos, supongo:
1- Fuentes de datos: mientras que el analista de BI usa solo datos estructurados de la base de datos interna, el científico de datos puede usar conjuntos de datos no estructurados internos y externos, como el texto de los tweets.

2- Tecnología: BI usará bases de datos relacionales, almacenes de datos y OLAP, el científico de datos usará Hadoop, MapReduce, etc.

3- Comunicación de resultados: el chico de BI usará informes pero el científico de datos
la mayoría de las veces usa diapositivas para presentar mejor los resultados a los gerentes que quizás no entiendan bien de qué está hablando.

4- Habilidades y experiencia: BI se basa en gran medida en TI, mientras que la ciencia de datos se centra más en estadísticas y matemáticas

Business Intelligence se refiere a un conjunto de métodos y técnicas que utilizan las organizaciones para la toma de decisiones tácticas y estratégicas. Aprovecha las tecnologías que se centran en conteos, estadísticas y objetivos comerciales para mejorar el rendimiento comercial.

El software de inteligencia empresarial (BI) es un

Colección de tecnologías de apoyo a la decisión para la empresa dirigida a

permitiendo a los trabajadores del conocimiento, como ejecutivos, gerentes y analistas, hacer

decisiones mejores y más rápidas. Las últimas dos décadas han visto un crecimiento explosivo,

tanto en la cantidad de productos y servicios ofrecidos como en la adopción de

Estas tecnologías por industria. Este crecimiento ha sido impulsado por la disminución

costo de adquirir y almacenar grandes cantidades de datos derivados de fuentes

tales como transacciones de clientes en banca, venta minorista y comercio electrónico,

Etiquetas RFID para seguimiento de inventario, correo electrónico y registros de consultas para sitios web, blogs,

y reseñas de productos. Las empresas de hoy recogen datos con una granularidad más fina,

que por lo tanto es de un volumen mucho mayor.

Las empresas están aprovechando sus datos

activo agresivamente mediante la implementación y la experimentación con datos más sofisticados

Técnicas de análisis para impulsar las decisiones comerciales y ofrecer una nueva funcionalidad.

tales como ofertas y servicios personalizados para clientes. Hoy es dificil

para encontrar una empresa exitosa que no haya aprovechado la tecnología de BI para su

negocio. Por ejemplo, la tecnología de BI se utiliza en la fabricación de pedidos de cursos de inteligencia empresarial de Intellipaat

envío y atención al cliente, en el comercio minorista para el perfil del usuario dirigido a los supermercados

cupones durante el pago, en servicios financieros para análisis de reclamos y fraude

detección, en transporte para gestión de flotas, en telecomunicaciones para

identificando razones para la pérdida de clientes, en utilidades para análisis de uso de energía,

y atención médica para el análisis de resultados …

los

los datos sobre los que se realizan las tareas de BI generalmente se cargan en un repositorio

llamado el almacén de datos que es administrado por uno o más datos

Servidores de almacén. Una opción popular de motores para almacenar y consultar

los datos del almacén son sistemas de gestión de bases de datos relacionales (RDBMS). Sobre el pasado

dos décadas, varias estructuras de datos, optimizaciones y procesamiento de consultas

Se han desarrollado técnicas principalmente para ejecutar consultas SQL complejas sobre

grandes volúmenes de datos, un requisito clave para BI. Un ejemplo de tal ad hoc

La consulta SQL es: busque clientes que hayan realizado un pedido durante el último trimestre

cuya cantidad excede la cantidad promedio de la orden en al menos un 50%. Datos grandes

los almacenes suelen implementar motores RDBMS paralelos para que las consultas SQL puedan ser

ejecutado sobre grandes volúmenes de datos con baja latencia.

More Interesting

Tengo una experiencia laboral de más de dos años en desarrollo, dispositivos móviles y web. Quiero hacer MS en DS. ¿Mi experiencia ayudaría en el proceso de selección?

Soy muy bueno en probabilidad, estadística y matemática aplicada, ¿cómo obtengo un trabajo de ciencia de datos de nivel de entrada?

¿Cuál es la correlación entre PNL, IA, aprendizaje automático, big data y ciencia de datos? ¿Existe una jerarquía o algo en común entre estos? ¿Cómo se relacionan estos problemas con el mundo real?

¿De qué trata el libro Big Data Baseball?

Cómo manejar grandes cantidades de datos generados a partir de varias fuentes de datos

¿Cuál es la diferencia entre un desarrollador de BI y un desarrollador de Big Data?

¿Cuál es la diferencia entre el análisis de datos con Python y el análisis de datos con Python en Apache Spark?

¿Cuál es la forma más eficiente de comparar datos EEG e identificar tendencias?

Cómo proteger todos los datos de mi computadora para que cualquier persona sin la clave de acceso no pueda ver ni eliminar nada

¿Cuál es el alcance futuro del almacenamiento de datos y la minería de datos? ¿Desde dónde puedo comenzar a aprender estos dos campos emergentes?

Cómo encontrar un buen formato para big data

¿Qué lo motivó a convertirse en gerente de ciencia de datos en lugar de permanecer en el papel de un científico de datos senior?

¿Cómo es ser un científico de datos en Publicis?

¿Cuál es la mejor manera de aprender analítica de personas?

¿Cuáles son algunos ejemplos de cómo se aplica la ciencia de datos en la inversión?