Al definirlos claramente, las ambigüedades entre estos términos disminuirán. En la práctica, hay una superposición en la forma en que diferentes personas ven estos términos, por lo que seguramente se utilizarán para referirse a lo incorrecto, especialmente porque áreas como la ciencia de datos y la IA todavía están siendo “definidas”, especialmente por expertos e investigadores. en el campo.
- Big Data: la recopilación y el procesamiento de grandes cantidades de datos (grandes volúmenes) de diversas fuentes y de diferentes tipos (gran variedad), a grandes velocidades (alta velocidad)
- Análisis de datos: El área amplia de negocios que se ocupa del uso de datos para construir ayudas para la toma de decisiones, que ayudan a las decisiones continuas que los gerentes de negocios toman regularmente.
- Ciencia de datos: el desarrollo y uso de modelos estadísticos y matemáticos, algoritmos y visualizaciones para ayudar a explicar datos de diferentes tipos, ya sean estructurados o no, utilizando estadísticas, aprendizaje automático, IA u otros enfoques. Los profesionales de la ciencia de datos en la industria a menudo usan grandes conjuntos de datos y algoritmos especializados para construir y probar sus modelos.
- Minería de datos: el acto de extraer información de conjuntos de datos grandes o pequeños, generalmente mediante el uso de un conjunto de consultas estructuradas. Los mineros de datos en la industria son más consumidores de algoritmos que desarrolladores de algoritmos. Generalmente trabajan con analistas de negocios para definir alcances claros para los análisis. La minería de datos a menudo se asocia con la minería de texto y el descubrimiento de patrones en el análisis de texto, pero esto puede no ser siempre el caso. Si bien la minería de datos a menudo se usa para describir el análisis de datos en bases de datos con diseños ordenados y estructurados (tablas relacionales), la ciencia de datos no depende de la disponibilidad de datos estructurados.
- Inteligencia empresarial: un conjunto de herramientas y enfoques que permiten a los gerentes gestionar procesos basados en los datos recopilados y almacenados de los procesos en los llamados almacenes de datos. En general, paneles que utilizan una combinación de consultas, visualizaciones e informes destinados a fines comerciales específicos.
- Econometría: una rama de la estadística destinada específicamente al estudio de la economía mediante el entrelazado de teoría, inferencia estadística y análisis de datos de diversos tipos. Si bien utiliza principios y prácticas de estadística, la rama de estudio / investigación enfatiza específicamente en economía.
- Estadísticas: un campo de estudio, investigación y trabajo que abarca estadísticas descriptivas e inferenciales. La estadística descriptiva busca describir datos usando medidas de muestra, mientras que la estadística inferencial busca establecer y probar hipótesis (teorías) sobre los datos y las relaciones entre ellos. La ingeniería estadística es un área relacionada donde los modelos estadísticos se construyen a partir de datos, basados en enfoques deductivos e inductivos. Los desarrollos en este sentido incluyen ANOVA y DOE. Un cisma más en el campo de las estadísticas es la diferencia de enfoques frequentista-bayesiano.
- Aprendizaje automático: el proceso de crear modelos estadísticos para informar la toma de decisiones complejas para una variedad de propósitos, como la predicción o los valores futuros de datos variables basados en datos disponibles (regresión), clasificación de puntos de datos o agrupación de puntos de datos. ML abarca el desarrollo de modelos estadísticos para convertir conjuntos de datos complejos en representaciones más simples y aproximadas de las relaciones entre factores y respuestas, y también implica validación cruzada y optimización de hiperparámetros para comprender si los resultados son buenos y mejorar los modelos.
- Inteligencia artificial: un conjunto de enfoques que abarca enfoques de aprendizaje estadístico y redes neuronales, para simular el comportamiento de sistemas expertos que utilizan enfoques de aprendizaje supervisados (donde los datos y los objetivos se proporcionan explícitamente) y sin supervisión (donde se descubren patrones). AI tiene más que ver con la coincidencia de patrones y el reconocimiento de patrones que ML. La IA utiliza enfoques bayesianos para el aprendizaje automático como un segway a redes neuronales complejas, como redes neuronales profundas o redes neuronales recurrentes que se utilizan para construir modelos complejos del mundo.
- Modelado matemático: un término general muy amplio que significa la construcción y validación de modelos basados en variables (explícitas e implícitas) y que podría abarcar no solo modelos estadísticos basados en enfoques de álgebra lineal sino ecuaciones diferenciales, ecuaciones diferenciales parciales, teoría de grupos y mucho más, mucho más. Los modelos pueden describir escenarios reales o imaginarios, pero generalmente están destinados a abordar y describir algunos problemas del mundo real y su comportamiento. Los modelos se ven como abstracciones del mundo real o escenarios lógicos / hipotéticos y el análisis se realiza en base a suposiciones o aproximaciones.
Otras definiciones relacionadas:
- Ciencia de la información: Ciencia de la información (no debe confundirse con la ciencia de datos)
- Teoría de la información: https://en.wikipedia.org/wiki/In…
Referencias y enlaces útiles:
- ¿Vale la pena que un desarrollador de pila completa aprenda ciencia de datos?
- ¿Qué curso de ciencia de datos es mejor para un principiante, el nanodegree analista de datos de Udacity o el curso de ciencia de datos?
- ¿Cómo vender legalmente los datos disponibles públicamente desde aplicaciones móviles en Internet? ¿Cómo aumento el valor de los servicios de datos?
- ¿Qué es la piratería de datos en relación con la ciencia de datos?
- ¿Cuáles son algunos de los métodos que hacen los científicos para analizar datos?
- Ciencia de datos y estadísticas (GA Tech): http://www2.isye.gatech.edu/~jef…
- Modelado matemático: http://www.maths.bris.ac.uk/~mad…