Eso no es realmente una decisión o ninguno. Hay superposiciones. Como se ha señalado, ambos también son esencialmente términos de marketing, pero FWIW, aquí están mis definiciones, tomadas de: Diccionario de datos y análisis
Un conjunto de tecnologías de código abierto (agrupadas en torno a la plataforma Apache Hadoop) que aprovechan múltiples servidores básicos para distribuir la carga de almacenar y procesar conjuntos de datos muy grandes (como los creados por Internet de las cosas) y proporcionar una gama de herramientas y software que admiten análisis estadísticos avanzados. Estos servidores pueden ser locales o basados en la nube con seguridad asociada. Las tecnologías de Big Data son particularmente expertas en el manejo de datos no estructurados.
- ¿Por qué Java no se considera apropiado para ML / ciencia de datos / aprendizaje profundo?
- ¿Puedo duplicar los mismos datos para una tarea de clasificación en términos de aumento de datos?
- ¿Cuál es una excelente manera de aprender a usar las funciones en paquetes como Ggplot2 y Pandas en R y Python?
- Cómo recuperar la ecuación de predicción de R
- ¿Cuáles son algunas aplicaciones impresionantes de big data y machine learning?
Ver también: ¿Alguna tecnología crece o solo alcanza la mayoría de edad?
Científico de datos
Alguien experto en explotar datos en muchos formatos, desde archivos planos hasta almacenes de datos y lagos de datos. Dichos individuos poseen las mismas capacidades en las tecnologías de datos (como Big Data) y cómo obtener beneficios de estas a través del modelado estadístico. Los científicos de datos a menudo son científicos reales caídos.
Ver también: Saber lo que no sabes