¿Cuál es la diferencia entre trabajar en análisis y ciencia de datos?

La respuesta corta es que no hay diferencia y que una organización competente tendrá cierto equilibrio de ambos. Ambas son aplicaciones de interpretación humana de datos informáticos. La diferencia esencial es que el “análisis de datos” es cualquier cosa que su contador promedio reconocerá en una hoja de cálculo, en el contexto de lo que se presenta en una hoja de cálculo. Es decir cuentas, porcentajes, tendencias. Mientras que la ciencia de datos da un paso más allá hacia medidas más sofisticadas como correlaciones, intervalos de confianza, momentos. También con la ciencia de datos, es más probable que uno se involucre con la predicción y diseñe algunos subconjuntos representativamente significativos de los datos completos.

Así que tomemos un ejemplo de hamburguesa.
Una cadena de comida rápida en California contrató a mi empleador anterior para que pusiera una aplicación analítica sobre sus datos de punto de venta. Nadie antes de ese momento tenía nada más que una comprensión muy amplia de cuánto dinero ganaban diariamente sus 400 tiendas impares. Los nuevos datos de POS utilizaron códigos de producto, y ahora sabíamos hasta cada recibo, cuánto dinero gastaba cada cliente en cada producto en el menú. Recuentos simples por tiempo. Esto le dijo a la cadena qué períodos del día vendían qué comida y cuánto. Luego hicieron algunos cálculos matemáticos simples para calcular la eficiencia de sus cocineros y cajeros y descubrieron que estaban contratando personal y turnos en el momento equivocado. Entonces, solo contando, descubrieron que debían realizar un turno de cuatro horas de 10 a.m. a 2 p.m. en lugar de uno de 8 a.m. a mediodía porque romper el turno al comienzo de la ‘hora del almuerzo’ estaba mal. No hubo una hora de almuerzo, hubo un almuerzo de cuatro horas con un pico alrededor de las 12:20 pm.

Cambiaron sus patrones de personal, aumentaron la moral de los empleados y la satisfacción del cliente simplemente siguiendo lo que los * datos * decían sobre los tiempos de compra de los clientes, en lugar de las ideas estándar sobre lo que es la hora del almuerzo. Lo mismo con el desayuno, lo mismo con la cena, lo mismo con la noche. Eso es analítica.

Ahora tome el mismo conjunto de datos y ejecute correlaciones en qué partes se venden con qué hamburguesas. (No hicieron esto). Y descubriría que, por ejemplo, las personas que ordenaron tacos casi nunca pidieron papas fritas con ellos. Entonces eso reorganizaría lo que venden como un ‘combo de comida’. Luego, cuando alguien ordena un taco en el camino, un aviso en tiempo real podría decirle al cajero que sugiera un lado de taquitos o salsa extra.

Mi experiencia me dice que el grueso del valor a extraer de los datos está operativo. Es decir que los recuentos por tiempo son muy valiosos, al igual que agregar dimensiones y atributos a datos simples. Pero cuando desea comenzar la predicción, necesita herramientas más sofisticadas que la simple agregación. La recompensa está en el análisis, refinando que la recompensa está en el modelo predictivo. Pero sí, siempre necesita la intuición de los gerentes que operan el negocio para comprometerse (o no) con las proyecciones de su computadora. Ahí radica el arte de la inteligencia empresarial, que es conocer el equilibrio correcto de datos informáticos frente al conocimiento humano para aplicarlo a un problema empresarial. [1]

La parte más importante del trabajo de un científico de datos, en mi opinión, es comprender las restricciones matemáticas de los datos para determinar cuánto se puede confiar y cuál es un tamaño de muestra adecuado para considerar dadas las posibilidades de seguir su salida. En otras palabras, se trata de un tipo especializado de inferencia. Ahora que la tecnología y la metodología han hecho que sea menos costoso agregar cantidades masivas de datos, los estadísticos y los científicos de datos deben decirnos cuánto arriesgamos al depender de esos datos, o si no tenemos suficiente para tomar las decisiones adecuadas. [2]

Notas al pie

[1] Los cuatro pilares de la inteligencia empresarial

[2] Barreras al valor agregado en el análisis de datos

Data Science se ocupa de datos estructurados y no estructurados. En principio, todo lo que se relaciona con la limpieza, preparación y análisis de datos se encuentra dentro del alcance de Data Science. Existen diferentes términos asociados con la ciencia de datos.

  1. Data Analytics se trata de automatizar los conocimientos sobre un conjunto de datos y supone el uso de consultas y procedimientos de agregación de datos. Puede representar varias dependencias entre variables de entrada, pero también puede usar técnicas y herramientas de minería de datos para descubrir patrones ocultos en el conjunto de datos bajo análisis. Por ejemplo, no se pueden descubrir automáticamente asociaciones no obvias entre compras de usuarios.
  2. El análisis de datos representa actividades humanas destinadas a obtener una idea de un conjunto de datos. Un analista puede usar algunas herramientas de análisis de datos para obtener los resultados deseados, pero en principio, el análisis de datos se puede realizar sin un procesamiento de datos especial. Por ejemplo, un operador de Forex puede confiar en su experiencia para abrir o cerrar una posición comercial.

El análisis de datos aprovecha los activos de datos para proporcionar información operativa diaria. Todo, desde contar los activos hasta predecir el inventario. Luego, la ciencia de datos busca explotar la inmensidad de la información y el análisis para proporcionar decisiones procesables que tengan un impacto significativo en la estrategia.

Junto con la tecnología relativamente nueva de Big Data está el nuevo científico de datos de títulos de trabajo. Si bien no está vinculado exclusivamente a los proyectos de Big Data, el rol del científico de datos los complementa debido a la mayor amplitud y profundidad de los datos que se examinan, en comparación con los roles tradicionales …

Puede visitar este enlace: Ciencia de datos, R, Mahout – Clases de capacitación de cursos combinados en línea | Data Science, R, Mahout – Cursos de cursos combinados en línea Un científico de datos representa una evolución desde el rol comercial o analista de datos. La capacitación formal es similar, con una base sólida típicamente en informática y aplicaciones, modelado, estadísticas, análisis y matemáticas.

. Lo que distingue al científico de datos es la perspicacia empresarial fuerte, junto con la capacidad de comunicar los hallazgos a los líderes empresariales y de TI de una manera que puede influir en la forma en que una organización aborda un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

El rol del científico de datos ha sido descrito como “analista en parte, artista en parte”. Un científico de datos es alguien que es inquisitivo, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y aportar cambios a una organización “.

Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente, por ejemplo, un sistema CRM, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Un científico de datos no solo recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

Los científicos de datos son inquisitivos: exploran, hacen preguntas, hacen análisis de “qué pasaría si”, cuestionan los supuestos y procesos existentes

Los datos se duplican cada dos años, y todos han oído hablar de los números de crecimiento absurdos indicados en los informes. En este contexto, el resultado inevitable es la aparición del Data Scientist. Un científico de datos necesita analizar grandes cantidades de datos y proyectar el mapa tecnológico para hacer posible la transición de datos a ideas. El alcance del trabajo de un científico de datos incluye la identificación de las fuentes de datos, la calidad de los datos, las correlaciones entre los puntos de datos y la difusión a los usuarios de la información.

Por el momento, el papel de un científico de datos lo desempeña una combinación de personas en el equipo de BI, como el arquitecto del almacén de datos, el analista de negocios y otros de esa clase. A medida que la situación evoluciona, el científico de datos trabajará por encima de estos profesionales para descubrir nuevas tendencias y asociaciones que puedan estar más allá del ámbito de los modelos actuales y los problemas comerciales. El analista de negocios trabajaría en los datos que ha recopilado el científico de datos. James Kobielus, un analista senior de Forrester, en su negocio, llega a comparar el trabajo de un científico de datos con el trabajo de científicos en ciencias naturales y ciencias sociales, afirmando que necesitarían datos de observación y datos experimentales para trabajar con. “Históricamente ( los científicos de datos ) han tenido que contentarse con meros ejemplos”. Con el surgimiento de una carrera de pleno derecho, esto pronto cambiará.

Las discusiones sobre quién está calificado exactamente para ser un científico de datos no difieren demasiado del debate que se sostuvo anteriormente sobre si, sin embargo, al principio, los expertos de la industria han indicado que un científico de datos debe tener una maestría en matemáticas o estadísticas. Mientras tanto, el CTO del grupo en Shoppers Stop dice: “Hay una escasez de profesionales a los que se les puede llamar científicos de datos. Por el momento, quien tiene pasión por trabajar con datos está llenando el vacío ”.

Un científico de datos trabajará en el desarrollo de nuevos algoritmos y presentará nuevos patrones e ideas sobre los datos que de otro modo permanecerían ocultos. “Junto con las estadísticas, un científico de datos puede tener una calificación en economía, y definitivamente necesita una docena o más de experiencia trabajando con diez a quince herramientas de BI”, dice Chuck Hollis, vicepresidente de marketing global y CTO, EMC.

un proveedor de servicios de análisis y ciencia de decisiones dice: “Los científicos de datos también incursionarán en psicología experimental, antropología y ciencias sociales”. Con la necesidad de establecer centros de excelencia de BI (CoE), los análisis se institucionalizarán.

Hola:

Aquí están mis 2 centavos … Algunas compañías no diferencian entre un científico de datos y un profesional de análisis y usan estos términos indistintamente para definir a los miembros de su equipo. Por otro lado, un número significativo de empresas tienen esta diferenciación. En general, aquí están los factores que, en mi opinión, pueden separar los dos

Sin embargo, para tener éxito, ya sea como científico de datos o profesional de Business Analytics, las siguientes son las habilidades necesarias:

  • Amor por los números y las cosas cuantitativas.
  • Grit para seguir aprendiendo
  • Amor por la codificación y la programación.
  • Enfoque de pensamiento estructurado
  • Pasión por resolver problemas
  • Buen conocimiento de conceptos estadísticos.

Aquí están mis 10 punteros principales para garantizar un éxito duradero en cualquier campo.

  • Aprende tanto como sea posible. Pase de 4 a 5 horas cada semana en el aprendizaje y el desarrollo y conozca lo último en la industria
  • Desafío del status quo. Nunca suponga que lo que se está haciendo está siguiendo el enfoque más efectivo
  • Cree que eres igual a todos los demás en la jerarquía. No tengas miedo de decir lo que piensas
  • Concéntrese en la innovación y salga con la tierra rompiendo ideas en lugar de hacer el negocio como de costumbre.
  • Concéntrese en desarrollar excelentes habilidades de comunicación y habilidades blandas, ya que esta es una de las mayores brechas que he visto en los profesionales de análisis
  • No te conviertas en un pony de un solo truco. trate de obtener exposición en diferentes industrias y diferentes áreas funcionales.
  • Participe en competiciones y eventos como Kaggle, para saber cuál es su posición frente a su grupo de compañeros.
  • Intente escribir libros blancos y blogs sobre su experiencia en el tema.
  • Desarrollar experiencia en el dominio ya que sin ese análisis no es efectivo.
  • Finalmente, mantenga siempre una visibilidad clara de su fortaleza y oportunidades y de cualquier punto ciego. Busque activamente comentarios de su grupo de pares y sus superiores.

Espero que esto ayude.

¡Aclamaciones!

Gracias por sus votos a favor de antemano. Me mantienen en marcha! ¡Gracias!

Descargo de responsabilidad: Las opiniones expresadas aquí son únicamente las del escritor en su capacidad privada.

La diferencia entre la ciencia de datos y el análisis de datos [1]

Ciencia de datos y análisis de datos: las personas que trabajan en el campo de la tecnología u otras industrias relacionadas probablemente escuchan estos términos todo el tiempo, a menudo de manera intercambiable. Sin embargo, aunque pueden parecer similares, los términos son a menudo bastante diferentes y tienen implicaciones diferentes para los negocios. Saber cómo usar los términos correctamente puede tener un gran impacto en la forma en que se administra una empresa, especialmente a medida que la cantidad de datos disponibles crece y se convierte en una parte importante de nuestra vida cotidiana.

Ciencia de los datos

Al igual que la ciencia es un término amplio que incluye una serie de especialidades y énfasis, la ciencia de datos es un término amplio para una variedad de modelos y métodos para obtener información. Bajo el paraguas de la ciencia de datos se encuentra el método científico, las matemáticas, las estadísticas y otras herramientas que se utilizan para analizar y manipular datos. Si se trata de una herramienta o un proceso realizado con los datos para analizarlos u obtener algún tipo de información, probablemente pertenezca a la ciencia de los datos.

La práctica de la ciencia de datos se reduce a conectar información y puntos de datos para encontrar conexiones que puedan ser útiles para el negocio. La ciencia de datos profundiza en el mundo de lo desconocido al tratar de encontrar nuevos patrones e ideas. En lugar de verificar una hipótesis, como lo que generalmente se hace con el análisis de datos, la ciencia de datos intenta construir conexiones y planificar para el futuro. La ciencia de datos a menudo mueve a una organización de la indagación a las ideas al proporcionar una nueva perspectiva de los datos y de cómo está todo conectado que anteriormente no se veía ni se conocía.

Análisis de datos

Si la ciencia de datos es la casa que posee las herramientas y los métodos, el análisis de datos es una sala específica en esa casa. Está relacionado y es similar a la ciencia de datos, pero más específico y concentrado. El análisis de datos generalmente está más enfocado que la ciencia de datos porque, en lugar de solo buscar conexiones entre datos, los analistas de datos tienen un objetivo específico en tener en cuenta que están clasificando los datos para buscar formas de soporte. El análisis de datos a menudo se automatiza para proporcionar información en ciertas áreas.

El análisis de datos implica el peinado a través de los datos para encontrar pepitas de grandeza que puedan usarse para ayudar a alcanzar los objetivos de una organización. Esencialmente, la analítica clasifica los datos en cosas que las organizaciones saben que saben o no saben y que pueden usarse para medir eventos en el pasado, presente o futuro. El análisis de datos a menudo mueve los datos de los conocimientos al impacto al conectar tendencias y patrones con los verdaderos objetivos de la compañía y tiende a estar un poco más enfocado en el negocio y la estrategia.

Por qué es importante

Las diferencias aparentemente matizadas entre la ciencia de datos y el análisis de datos pueden tener un gran impacto en una empresa. Para comenzar, los científicos de datos y los analistas de datos realizan tareas diferentes y, a menudo, tienen antecedentes diferentes, por lo que poder usar los términos correctamente ayuda a las empresas a contratar a las personas adecuadas para las tareas que tienen en mente. El análisis de datos y la ciencia de datos se pueden usar para encontrar diferentes cosas, y si bien ambas son útiles para las empresas,

Notas al pie

[1] La diferencia entre ciencia de datos y análisis de datos

Data Analytics es un lugar fácil en comparación con la ciencia de datos.

Veamos las diferencias entre ellos y los roles y habilidades de ambos para que pueda tener una idea clara sobre el rol de trabajo del científico y analista de datos.

Científico de datos vs analista de datos según la definición

  • Un rol de Data Scientist es predecir el futuro basado en patrones pasados. Mientras que el analista de datos encuentra información significativa de los datos.
  • El papel del científico de datos es generar su propia pregunta. Pero el analista de datos encuentra las respuestas a otros grupos de preguntas.
  • Como los científicos de datos tienen lo que si. Pero los analistas de datos son los que hacen el análisis diario
  • El científico de datos aborda problemas comerciales. También ofrece una predicción precisa del valor del negocio una vez resuelto. Mientras que Data Analyst solo aborda problemas de negocios
  • El científico de datos utiliza el aprendizaje automático para extraer información. Pero Data Analyst utiliza una herramienta R / SAS para extraer información.
  • El papel del científico de datos es explorar y examinar la información. Explora información de muchas fuentes desconectadas. Pero Data Analyst explora y examina datos de una sola fuente.
  • La predicción de Data Scientist es muy alta. Puede ser preciso hasta el 90%. Pero, los analistas de datos no predicen. Solo resuelven la pregunta dada por el negocio.
  • A Los científicos de datos formularán preguntas. Formulan esas preguntas cuyas soluciones pueden beneficiar al negocio. Pero Data Analyst solo resuelve las preguntas dadas por las empresas.
  • Un científico de datos debe tener un sólido conocimiento en modelos estadísticos y aprendizaje automático. El analista de datos necesita un conocimiento sólido en SAS / R

Analista de datos vs Científico de datos según las responsabilidades

a) Responsabilidades de un científico de datos

  • Limpieza y procesamiento de datos.
  • Predicción del problema empresarial. Sus roles son dar resultados futuros de ese negocio.
  • Desarrollar modelos de aprendizaje automático y métodos analíticos.
  • Encuentre nuevas preguntas comerciales que luego puedan agregar valor al negocio.
  • Minería de datos utilizando métodos de vanguardia.
  • Presentar resultados de manera clara y hacer el análisis ad-hoc.

b) Responsabilidades del analista de datos

  • Identifique cualquier problema de calidad de datos en la adquisición de datos.
  • Resolviendo problemas de negocios. Al mapear y luego rastrear los datos.
  • Un analista de datos debe coordinarse con los ingenieros para recopilar nuevos datos.
  • Realizar análisis estadísticos de datos comerciales.
  • Documentar los tipos y la estructura de los datos comerciales.

4.3. Analista de datos versus roles de científico de datos basados ​​en conjuntos de habilidades

a) Roles de Data Scientist según sus habilidades

  • Las creatividades de datos
  • Desarrolladores de datos
  • Investigadores de datos
  • Los empresarios de datos

b) Roles de analista de datos según sus habilidades

  • Administradores de bases de datos
  • Operaciones
  • Los arquitectos de datos
  • A analistas de datos

4.4. Data Scientist vs Data Analyst – Salario

Las estadísticas a continuación muestran el salario de Data Scientist vs Data Analyst-

Para saber más, consulte el siguiente enlace:

Data Science vs Data Analytics

Mi equipo pasó por ambos desde su nacimiento, déjenme intentar resumir las diferencias.

Game Analytics

Nuestro objetivo era crear paneles para usuarios comerciales y ejecutar algunos análisis descriptivos que no eran posibles de reproducir con las herramientas de BI. Sentí un par de cosas como parte del espectro de la ciencia de datos, como las pruebas A / B y algunos modelos de datos, pero ninguno fue particularmente científico y hubo algunos problemas en nuestra metodología.

En pocas palabras, estábamos enfocados en mostrar el pasado para que informara el futuro.

Game Analytics y Data Science

Todavía ofrecemos los servicios de análisis de juegos a usuarios comerciales. Nuestras pruebas A / B han cambiado considerablemente. Queremos que sea una plataforma de Ensayos controlados aleatoriamente. Esto implica muchos cambios, especialmente en metodología y know-how. Nuestro modelado ahora está más enfocado en modelos predictivos y prescriptivos. También incluimos cualquier aplicación automatizada o interactiva en una categoría genérica de “producto de datos”.

En pocas palabras, estamos enfocados en usar datos para tomar o informar decisiones.

Espero que esto ayude.

El análisis de datos generalmente no implica estadísticas inferenciales, regresiones, modelado y / o aprendizaje automático. Tampoco implica programación.

Sin embargo, si eres un buen pensador crítico con algunas herramientas sólidas de segmentación / filtrado y visualización, la analítica puede recorrer un largo camino para encontrar respuestas confiables, sin las anteriores, a preguntas de investigación más simples. Eso es especialmente cierto si su conjunto de datos comprende a toda su población.

Espero que ayude.

-Jude C.

Normalmente, se espera que un científico de datos formule las preguntas que ayudarán a un negocio y luego proceda a resolverlas, mientras que un equipo de negocios responde a un analista de datos y busca una solución con esa guía.

Se espera que ambos roles escriban consultas, trabajen con equipos de ingeniería para obtener los datos correctos, realicen un intercambio de datos (obtener los datos en el formato correcto, conveniente para el análisis / interpretación) y obtener información de los datos. Sin embargo, en la mayoría de los casos, no se espera que un analista de datos cree modelos estadísticos o sea práctico en aprendizaje automático y programación avanzada. En cambio, un analista de datos generalmente trabaja en SQL estructurado más simple o bases de datos similares o con otras herramientas / paquetes de BI.

El papel del científico de datos también requiere fuertes habilidades de visualización de datos y la capacidad de convertir datos en una historia de negocios. Normalmente no se espera que un analista de datos transforme los datos y el análisis en un escenario comercial y una hoja de ruta.

Puede encontrar el resto de las respuestas aquí: Analista de datos versus Científico de datos: ¿cuál es la diferencia?

En muchos casos no hay mucho, y en otros es la profundidad y amplitud del trabajo.

Con frecuencia, las posiciones analíticas son simplemente trabajos de ciencia de datos con un título diferente. Puede ser que se adapte a las necesidades del departamento, puede ser una industria o un nombre de dominio.

Pero la mayoría de las veces, cuando veo esto, se hace para posicionar un trabajo más calificado en un nivel salarial más bajo de lo que normalmente vería para una publicación de un científico de datos. Sin embargo, para algunas personas con trayectorias de habilidades no tradicionales (incluido yo mismo), fue una excelente manera de obtener entrevistas y experiencia laboral para los roles de científico de datos sin un doctorado y un fondo de ciencias duras.

Por otra parte, muchas posiciones de análisis de datos que veo publicadas buscan personas para hacer el análisis de las cosas fuera de los repositorios de datos SQL y NoSQL preparados o trabajar con datos de Adobe Analytics o Google Analytics. Los trabajos a menudo requieren conjuntos de habilidades analíticas muy específicas, pruebas A / B, análisis SEO y análisis estadístico tradicional y métodos predictivos simples, pero no son tan algorítmicos y matemáticamente rigurosos como los trabajos de científicos de datos completos.

Como la mayoría de las cosas en el mundo del análisis de datos, no existe un conjunto de programas, idiomas, habilidades, necesidades educativas y tareas que pueda aplicar definitivamente a todas las situaciones de una etiqueta dada, ya sea análisis de datos o ciencia de datos.

Si está buscando hacer análisis web y de marketing exclusivamente, tendrá un camino menos complicado (y más rápido) para mejorar su habilidad, que si espera trabajar como un generalista de ciencia de datos. Esto es particularmente cierto si ya tiene conocimiento de dominio en el área en la que trabajará.

Data Analytics es un proceso en el que se examinan los datos para sacar conclusiones perspicaces. Esto ayuda a las empresas a tomar decisiones que resultarán rentables, las técnicas utilizadas en Analytics son las mismas que las utilizadas en Business Analytics e Business Intelligence. En Data Analytics buscará respuestas específicas; es decir, habrá una hipótesis de prueba para la que tratará de encontrar detalles.

Para un análisis de datos preciso, se necesitan varias herramientas. Encontré que la visualización de datos con Tableau es un buen lugar para comenzar, y no hace falta decir que Python o R son lenguajes de programación importantes para conocer. Estos idiomas le permitirán realizar análisis de datos sin interrupciones.

La minería de datos como su nombre sugiere datos de “minas” utilizando componentes de inteligencia artificial, estadísticas tradicionales, etc. La minería de datos, a diferencia de Data Analytics, se realiza sin ninguna hipótesis. Data Mining no tiene como objetivo responder preguntas específicas.

Diferencia entre análisis de datos y minería de datos

La principal diferencia que podemos observar es que Data Analytics busca respuestas específicas con una hipótesis específica, mientras que Data Mining no tiene una respuesta específica que cumplir.

Data Analytics tiene un gran alcance en Business Analytics e Business Intelligence. Data Mining, por otro lado, utiliza técnicas, tanto matemáticas como científicas para encontrar patrones y tendencias.

Espero que esto ayude.

Sí, hay una diferencia entre ambos roles, ya que uno se considera como analista base y el otro se considera como analizar los datos con mayor profundidad y crear estrategias para las empresas.

Estas son algunas de las principales diferencias entre los dos perfiles de trabajo:

El analista de datos es el que trabaja en las preguntas dadas por el equipo de negocios y busca las soluciones dentro de la guía / plantilla proporcionada, mientras que se espera que Data Scientist analice los datos / trabajo y presente una solución / estrategia que ayude al negocio a realice los cambios según sea necesario.

Los científicos de datos usan software de aprendizaje automático para su trabajo, mientras que los analistas usan Excel, SAS, R, etc. para su trabajo.

El científico de datos es uno que tiene una mejor comprensión de las estadísticas, modelos, mientras que el analista tiene una buena comprensión de Excel y otro software básico.

Además, se pueden encontrar muchas otras diferencias, ya que en los salarios hay una gran brecha entre los roles, los sistemas que usan también son realmente diferentes, etc.

Mientras escribía esta respuesta, me encontré con uno de los blogs https://www.a-leap.com/pages/dat … que realmente explica las diferencias entre estos dos roles con más profundidad.

Espero que mi respuesta aclare algunas dudas sobre estos dos roles.

Gracias

Ellos son muy similares. Como el campo es nuevo y no muchos han practicado, no está bien definido. El campo continuará los establecidos en las ciencias cuantitativas. Su definición será clara en unas pocas décadas.

Por ahora, la ciencia de datos es más modelado computacional y asesoramiento de datos con los tomadores de decisiones. Se utiliza en empresas que desarrollan una infraestructura de datos. El análisis de datos es la supervisión del rendimiento utilizando datos de la empresa. Está más cerca de los análisis de casos y la evaluación para los tomadores de decisiones. Ambos trabajan en estrecha colaboración con los datos.

Ciencia de los datos: Al tratar con datos no estructurados y estructurados, Data Science es un campo que comprende todo lo relacionado con la limpieza, preparación y análisis de datos.

Data Science es la combinación de estadísticas, matemáticas, programación, resolución de problemas, captura de datos de maneras ingeniosas, la capacidad de ver las cosas de manera diferente y la actividad de limpiar, preparar y alinear los datos.

En términos simples, es el paraguas de las técnicas utilizadas al tratar de extraer conocimientos e información de los datos.

Análisis de datos: la ciencia de examinar datos sin procesar con el propósito de sacar conclusiones sobre esa información.

El análisis de datos implica la aplicación de un proceso algorítmico o mecánico para derivar ideas. Por ejemplo, ejecutar una serie de conjuntos de datos para buscar correlaciones significativas entre sí.

Se utiliza en una serie de industrias para permitir a las organizaciones y empresas tomar mejores decisiones, así como verificar y refutar las teorías o modelos existentes.

El enfoque de Data Analytics radica en la inferencia, que es el proceso de derivar conclusiones que se basan únicamente en lo que el investigador ya sabe.

Pidió responder

El análisis de datos y la ciencia de datos están separados, pero interrelacionados entre sí.

El análisis de datos proporciona observaciones operativas sobre problemas que sabemos que sabemos o sabemos que no sabemos. Por ejemplo, describe cuantitativamente las características principales de una recopilación de datos. Analytics está progresando en más y más aplicaciones y se ha desarrollado hasta el punto en el que realmente puede prescribir acciones apropiadas e inapropiadas para industrias y unidades de negocios específicas.

Mientras que la ciencia de datos es proporcionar información estratégica estratégica sobre el mundo donde no sabemos lo que no sabemos. Poco a poco se hizo evidente que los científicos de datos deben exhibir las habilidades necesarias para convertir el conocimiento científico sobre los datos en usos.

Hoy en día, los científicos de datos se entrenan bien o quizás se entrenan demasiado en el camino azul, pero el camino verde a menudo los elude, principalmente porque no se enseña como ciencia en las universidades. Sin embargo, la vía verde es una ciencia y se puede aprender por completo (consulte la Semana de datos a decisiones de Aryng, una semana para una educación práctica completa sobre análisis empresarial y análisis predictivo, con seguimiento verde y azul). A menos que las ideas vean la luz del día para transformarse en una decisión, es una pérdida total de recursos y tiempo. Por lo tanto, a menos que la analítica impulse el impacto comercial, no es analítica, solo son estadísticas, es solo ciencia de datos.

Hoy, me encontré con este artículo de Forbes, lo leí una vez para comprender la ciencia y el análisis de datos en detalle: ¿Ciencia o análisis de datos?

Imarticus Learning y Cognizant ofrecieron un seminario web conjunto sobre las diferencias clave entre Data Analytics y Data Science.

En este seminario web, Imarticus Learning y Cognizant Data Science continuaron reforzando la importancia de Data Analytics. La Harvard Business Review etiquetó a Data Analytics como el “trabajo más sexy del siglo XXI”. McKinsey afirmó que más de 190,000 puestos de Data Scientist quedarían vacantes para el año 2018. Además, según informes de la industria, los Data Scientists ganan casi el doble del salario en comparación con sus contrapartes en marketing, desarrollo empresarial, investigación y finanzas. Si bien Data Science se centra más en el análisis predictivo y prescriptivo, Data Analytics se centra en el análisis descriptivo y de diagnóstico.

Imarticus Learning tiene una serie de programas de análisis de datos que abarcan varias plataformas, como R, SAS y Hadoop. Para obtener más información, visite el sitio web en http://www.imarticus.org. Estos programas se pueden consumir en línea en sus instalaciones o en sus aulas en todo el país.

Big Data se refiere a todos los datos que se generan en todo el mundo a una velocidad sin precedentes. Estos datos pueden ser estructurados o no estructurados. Las empresas comerciales de hoy deben una gran parte de su éxito a una economía que está firmemente orientada al conocimiento. Los datos impulsan a las organizaciones modernas del mundo y, por lo tanto, dar sentido a estos datos y desentrañar los diversos patrones y revelar conexiones invisibles dentro del vasto mar de datos se vuelve crítico y un esfuerzo enormemente gratificante. Mejores datos conducen a una mejor toma de decisiones y una mejor forma de crear estrategias para las organizaciones, independientemente de su tamaño, geografía, participación en el mercado, segmentación de clientes y otras categorizaciones. Las empresas más exitosas del mañana serán las que puedan dar sentido a todos esos datos a volúmenes y velocidades extremadamente altas para capturar mercados y bases de clientes más nuevos.

Big Data tiene ciertas características y, por lo tanto, se define utilizando 4V, a saber:

Volumen: la cantidad de datos que las empresas pueden recopilar es realmente enorme y, por lo tanto, el volumen de datos se convierte en un factor crítico en el análisis de Big Data.

Velocidad: la velocidad a la que se generan nuevos datos, todo gracias a nuestra dependencia de Internet, los sensores y los datos de máquina a máquina también es importante para analizar Big Data de manera oportuna.

Variedad: los datos que se generan son completamente heterogéneos en el sentido de que podrían estar en varios formatos como video, texto, base de datos, datos numéricos, sensores, etc., y por lo tanto, comprender el tipo de Big Data es un factor clave para desbloquear su valor.

Veracidad: saber si los datos disponibles provienen de una fuente confiable es de suma importancia antes de descifrar e implementar Big Data para las necesidades comerciales.

Aquí hay una breve explicación de cómo exactamente las empresas están utilizando Big Data:

Una vez que el Big Data se convierte en pepitas de información, se vuelve bastante sencillo para la mayoría de las empresas comerciales en el sentido de que ahora saben lo que quieren sus clientes, cuáles son los productos que se mueven rápidamente, cuáles son las expectativas de los usuarios del cliente servicio, cómo acelerar el tiempo de comercialización, formas de reducir costos y métodos para construir economías de escala de una manera altamente eficiente. Por lo tanto, Big Data conduce claramente a grandes beneficios para las organizaciones y, por lo tanto, naturalmente, existe un gran interés en todo el mundo.

Data Analytics es análisis para personas. Data Science es análisis para máquinas.

Crédito a Michael Li: la pregunta que debe hacerse antes de contratar a un científico de datos

En resumen, el analista de datos es aquel que organiza los datos en un formato e informes adecuados. Con el advenimiento de Big Data, se espera que conozcan algunas herramientas nuevas para trabajar en él. Data Scientist es el que probablemente necesita tener las habilidades de analista de datos además de modelar los datos utilizando el conocimiento de las estadísticas y la probabilidad de que la máquina descubra alertas o actos basados ​​en esos modelos que brindan automáticamente una nueva utilidad comercial o general. Debo mencionar que ya hay algunas buenas respuestas.

Puede hacer análisis de datos sin ciencia de datos. Pero no puede hacer ciencia de datos sin análisis de datos.

More Interesting

¿Qué estudios serían los más útiles para nuevas empresas durante las próximas décadas, informática o ciencia de datos?

Incluso utilizando un conjunto de validación, ¿no estamos tratando de maximizar los resultados en el conjunto de prueba? ¿Y al final sobreajustando?

¿Cuál es la diferencia exacta entre Big Data, Data Science y Data Analytics?

¿Qué es una certificación para un analista de big data?

¿De dónde puedo aprender XGBoost? Quiero aprenderlo desde cero y no solo la implementación.

¿Qué es una aplicación futurista y significativa de la ciencia de datos en marketing?

¿Cómo debo trabajar en las estadísticas requeridas para el diseño experimental y el análisis de datos (datos neuronales / datos de comportamiento) en el primer año de posgrado?

¿Por qué los tutoriales de regresión lineal en los sitios web de aprendizaje de ciencia de datos no discuten la necesidad de satisfacer supuestos de regresión como la linealidad o la homocedasticidad? ¿Las suposiciones de verificación rara vez se hacen en la práctica?

¿Cuál es su experiencia con la combinación de datos?

¿Cuáles son las nuevas tecnologías de big data?

¿Cuál es la utilidad de Big Data?

¿El análisis de datos es diferente del análisis de datos?

¿Por qué hay muchos módulos en el ecosistema hadoop en lugar de un solo módulo?

¿Qué se sigue investigando en bosques aleatorios?

¿Cómo se pueden combinar las técnicas de minería de texto con los sistemas de recuperación de información?