¿Cuál es la diferencia entre ciencia de datos, análisis de datos, minería de datos, aprendizaje automático, inteligencia artificial y big data?

Estos términos pueden correlacionarse como:

“ La ciencia de datos ayuda a descubrir información útil de Big Data para un análisis de datos eficiente con la ayuda de algoritmos de inteligencia artificial y aprendizaje automático / minería de datos . ”

¿Cómo debe medirse el rendimiento de un equipo de ciencia de datos como una unidad? Por ejemplo, si lideraba el equipo de ciencia de datos de LinkedIn, ¿cómo debería evaluar mi desempeño el CEO?
¿Cuál es el mejor área de ciencia de datos para estudiar?
¿Cómo pueden las tecnologías de Big Data mejorar la inversión de impacto social?
¿Big Data contiene programación?
¿Cuáles de los cursos de Machine Learning tienen las mejores tareas y están disponibles en la web?

Definiciones individuales de todos los términos:

Data Science es un campo que abarca todo lo relacionado con la limpieza, preparación y análisis de datos. Es un estudio para predecir el futuro basado en patrones pasados. Implica estimar lo desconocido mientras genera sus propias preguntas.

El análisis de datos es descubrir percepciones significativas de los datos. Implica mirar lo conocido desde nuevas perspectivas y encontrar respuestas a un conjunto dado de preguntas a partir de datos.

El aprendizaje automático es aprender algunas tareas de la experiencia pasada para mejorar el rendimiento. Implica el estudio de algoritmos que pueden extraer información automáticamente.

La minería de datos es un área que ha tomado gran parte de su inspiración y técnicas del aprendizaje automático. Lo lleva a cabo una persona, en una situación específica, en un conjunto de datos particular, con un objetivo en mente. Por lo general, el objetivo es descubrir o generar algunas ideas preliminares en un área donde realmente solo había un pequeño conocimiento de antemano, o ser capaz de predecir observaciones futuras con precisión. Las técnicas comunes de minería de datos incluirían análisis de conglomerados, árboles de clasificación y regresión, y redes neuronales.

La inteligencia artificial es el estudio de cómo crear agentes inteligentes. En la práctica, es cómo programar una computadora para que se comporte y realice una tarea como agente inteligente.

Big data son activos de información de gran volumen y alta velocidad y / o gran variedad que exigen formas rentables e innovadoras de procesamiento de información que permitan una mejor comprensión, toma de decisiones y automatización de procesos. El análisis de Big Data encuentra información que ayuda a las organizaciones a tomar mejores decisiones comerciales.

PD: Fuente de la imagen: IA de enlace visual, aprendizaje automático, aprendizaje profundo, Big Data y ciencia de datos

Análisis deAprendizaje automáticoBig DataCiencia de datosdatosInteligencia ArtificialMinería de

¿Para qué se usa la minería de datos en Facebook y Google?

¿Puedes trabajar remotamente como científico de datos?

¿Cómo y de qué sitios web y libros puedo aprender en profundidad los conceptos de ciencia de datos para prepararme para el nivel de entrevista?

¿El aumento de Big Data obstaculizará el progreso de la investigación matemática?

¿Qué se necesita para que un antiguo agente de Wall Street consiga un trabajo en ciencia de datos? ¿Es un certificado de aprendizaje automático de Coursera más un proyecto de Kaggle?

Es 2017. ¿Por qué el WiFi a bordo sigue siendo tan increíblemente malo?

Aquí hay una definición simple para cada uno.

Data Science intenta extraer conocimiento y conocimientos de los datos en cualquier formato, ya sea estructurado o no estructurado, y aquí es donde es similar a la minería de datos.

Además, utiliza técnicas de varios otros campos para lograr esto. Campos como Matemáticas, Estadística, Ciencias de la computación (estructuras de datos y algoritmos y aquí es donde se correlaciona con el aprendizaje automático) y Ciencias de la información (aquí es donde la toma de decisiones se lleva a cabo a través de la comunicación de resultados, visualización e informes)

El proceso de ciencia de datos

El análisis de datos también conocido como análisis de datos es un subdominio de la ciencia de datos porque utiliza casi el mismo proceso con algunas exclusiones. Para ilustrar, cuando se realiza un análisis de datos, los procesos tomados son: inspección, limpieza, transformación y modelado de datos para encontrar información útil que sugiera conclusiones para apoyar la toma de decisiones.

Por lo tanto, la minería de datos es una técnica de análisis de datos, pero se utiliza para un propósito diferente. No se utiliza para fines descriptivos en absoluto, se utiliza para el descubrimiento del conocimiento, para fines de modelado y predictivos.

Sin embargo, aunque puede usarse en casi cualquier lugar, es un término reservado para grandes conjuntos de datos (Big data) y los métodos de Data Science se pueden aplicar en el proceso. Pero, el objetivo de la minería de datos es extraer información y transformarla en una forma de estructura comprensible para su uso posterior. Es decir, estos datos podrían estar desestructurados sin forma (como cuando se procesa un raspado web porque podría ser muy crudo), características, categorías, patrones de datos o simplemente no hay nada que podamos saber de él porque aún no son datos limpios. .

Ahora, “Big Data”, el término en sí lo dice todo. ¡Es grande, quiero decir realmente GRANDE!

Después de 2002, comenzó el comienzo de la era digital y, por lo tanto, todo, desde películas, música, servidor de computadora y datos de cuadros, cinta digital, todo lo que se nos ocurra se puede convertir digitalmente ahora. Es por eso que se inventó el término big data porque se trata de grandes cantidades de datos que no son más fáciles de manejar o manejar para cualquier plataforma de software.

Por lo tanto, los grandes datos deben tener las siguientes características para ser considerados grandes datos: volumen (tamaño), variedad (más de una forma o naturaleza), velocidad (la velocidad a la que se procesan y adquieren los datos debe ser rápida. Esto se debe a la gran demanda de datos hoy en día).

Y para conocer las diferencias entre ML e IA, que es, con mucho, un tema más complejo, asegúrese de leer aquí.

¿Hay alguna diferencia entre la inteligencia artificial y el aprendizaje automático?

Pero, en general, Data Science es un campo interdisciplinario que usa matemáticas, estadísticas e informática.

Por lo tanto, no podría realizar ningún DS sin alguna forma de ML y no podría realizar ninguna IA (subcampos CS) sin ningún ML.

Manfred Tijerino

AI:

La inteligencia artificial es la simulación de procesos de inteligencia humana por máquinas, especialmente sistemas informáticos. Estos procesos incluyen el aprendizaje (la adquisición de información y las reglas para usar la información), el razonamiento (el uso de las reglas para llegar a conclusiones aproximadas o definitivas) y la autocorrección. Las aplicaciones particulares de IA incluyen sistemas expertos, reconocimiento de voz y visión artificial.

Aprendizaje automático :

El aprendizaje automático es un tipo de inteligencia artificial (IA) que permite que las aplicaciones de software sean más precisas para predecir resultados sin ser programadas explícitamente. La premisa básica del aprendizaje automático es construir algoritmos que puedan recibir datos de entrada y utilizar análisis estadísticos para predecir un valor de salida dentro de un rango aceptable.

Big Data:

Big data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan una empresa en el día a día. Los grandes datos se pueden analizar para obtener información que conduzca a mejores decisiones y movimientos estratégicos de negocios.

La importancia de los grandes datos no gira en torno a la cantidad de datos que tiene, sino a lo que hace con ellos. Puede tomar datos de cualquier fuente y analizarlos para encontrar respuestas que permitan 1) reducciones de costos, 2) reducciones de tiempo, 3) desarrollo de nuevos productos y ofertas optimizadas, y 4) toma de decisiones inteligente.

Cuando combina big data con análisis de alta potencia, puede realizar tareas relacionadas con el negocio, tales como:

Determinar las causas raíz de fallas, problemas y defectos en tiempo casi real.
Generación de cupones en el punto de venta en función de los hábitos de compra del cliente.
Recalculando carteras de riesgo enteras en minutos.
Detectar comportamientos fraudulentos antes de que afecten a su organización.

El análisis de datos, la minería de datos, el aprendizaje automático y el modelado matemático son herramientas: medios hacia un fin.

Los mejores cursos en línea de aprendizaje automático

Machine Learning AZ ™: Python práctico y R en ciencia de datos
Bootcamp de ciencia de datos y aprendizaje automático con R
Aprendizaje automático para ciencia de datos

Los mejores cursos en línea de inteligencia artificial

Inteligencia Artificial AZ ™: Aprenda a construir una IA
Inteligencia artificial: aprendizaje automático con Python
IA avanzada: aprendizaje de refuerzo profundo en Python

Los mejores cursos en línea de ciencia de datos

Data Science AZ ™: ejercicios de ciencia de datos de la vida real incluidos
Ciencia de datos: aprendizaje profundo en Python
Ciencia de datos: aprendizaje profundo práctico en Theano + TensorFlow

Eze Precious Nwachinemere

Honestamente, Data Science incluye todos los campos resaltados en su pregunta. Si lee la posición del rol de Data Science en Facebook, Google o Tesla, esos son los principales requisitos para aplicar. Si quieres llamarte a ti mismo un Científico de Datos, entonces es mejor que tengas todas esas habilidades.

De ninguna manera, puede implementar el aprendizaje automático sin conocer la minería de datos.

Manfred Tijerino

Mire el video para comprender la diferencia exacta

Eze Precious Nwachinemere

More Interesting

¿Cuáles son las diferentes formas en que los datos se pueden enviar al HDFS?

¿Vale la pena cambiar el perfil a Big Data después de 8 años de experiencia en TI en mainframes, SQL, Unix?

¿Cómo se aplica la ciencia de datos a la robótica?

He seguido el MOOC de ciencia de datos de la Universidad John Hopkins. ¿A dónde debería ir desde aquí para obtener más información sobre Data Sciences y convertirme en un Junior Data Scientist?

¿Cómo puede un servicio de coincidencia de datos ayudarlo a obtener una ventaja competitiva?

Si tuviera que configurar un programa de aprendizaje de ciencias de datos de 3 meses para principiantes, ¿cuál sería el mejor programa y la línea de tiempo?

Cómo mostrar que dos conjuntos de datos tienen distribuciones diferentes