¿Qué es la ciencia de datos, big data y machine learning?

Data Science es la extracción de conocimiento de grandes volúmenes de datos estructurados o no estructurados, [1] [2] que es una continuación de la minería de datos de campo y el análisis predictivo, también conocido como descubrimiento de conocimiento y minería de datos (KDD).
Big data es un término amplio para conjuntos de datos tan grandes o complejos que las aplicaciones tradicionales de procesamiento de datos son inadecuadas. Los desafíos incluyen análisis, captura, conservación de datos, búsqueda, uso compartido, almacenamiento, transferencia, visualización y privacidad de la información. El término a menudo se refiere simplemente al uso de análisis predictivos u otros métodos avanzados determinados para extraer valor de los datos, y rara vez a un tamaño particular de conjunto de datos. Big data generalmente incluye conjuntos de datos con tamaños más allá de la capacidad de las herramientas de software comúnmente utilizadas para capturar, seleccionar, administrar y procesar datos dentro de un tiempo transcurrido tolerable. [14] El “tamaño” de Big Data es un objetivo en constante movimiento, a partir de 2012, desde unas pocas docenas de terabytes hasta muchos petabytes de datos.
Visualización de ediciones diarias de Wikipedia creadas por IBM. Con varios terabytes de tamaño, el texto y las imágenes de Wikipedia son un ejemplo de big data.

El aprendizaje automático es un campo que explora la construcción y el estudio de algoritmos que pueden aprender y hacer predicciones sobre los datos [2]. Tales algoritmos operan construyendo un modelo a partir de entradas de ejemplo para hacer predicciones o decisiones basadas en datos, [3] en lugar de seguir instrucciones estrictamente estáticas del programa.

Desde

  • Computación Cognitiva e Inteligencia Artificial
  • Analítica e Inteligencia de Negocios

Aquí están las definiciones:

  • Aprendizaje automático: dar a las computadoras la capacidad de aprender sin ser programado explícitamente; un método de análisis de datos que automatiza la construcción de modelos analíticos; usando algoritmos que aprenden iterativamente de los datos para encontrar información oculta sin ser programados explícitamente dónde buscar
  • Ciencia de datos: un campo interdisciplinario sobre métodos, procesos y sistemas científicos para extraer información de los datos en varias formas, estructuradas o no estructuradas; un concepto para unificar estadísticas, análisis de datos y sus métodos relacionados con el fin de comprender y analizar fenómenos reales con datos; Emplea técnicas y teorías extraídas de muchos campos dentro de las áreas amplias de matemáticas, estadística, ciencias de la información y ciencias de la computación, en particular del aprendizaje automático, clasificación, análisis de conglomerados, minería de datos, bases de datos y visualización.
  • Big data: conjuntos de datos extremadamente grandes que pueden analizarse computacionalmente para revelar patrones, tendencias y asociaciones, especialmente en relación con el comportamiento y las interacciones humanas.

Gracias por el A2A. Hay mucho contenido en Quora sobre lo que estas cosas:

¿Qué es la ciencia de datos?
¿Qué es el aprendizaje automático?
¿Qué es big data?

La ciencia de datos es la aplicación lógica de datos para generar información significativa. Es un análisis exploratorio de datos en tiempo real que utiliza tecnología y habilidades específicas y relacionadas para mejorar la claridad y dar la dirección correcta a los datos de su empresa. De hecho, es un tema importante en la actualidad cuando tenemos grandes cantidades de datos estructurados y no estructurados para tratar de manera regular.

Me gustaría compartir un enlace para comprender mejor la ciencia de datos.

Big Data : Big data es un término que describe el gran volumen de datos, tanto estructurados como no estructurados, que inundan una empresa en el día a día. Pero no es la cantidad de datos lo que importa. Lo que las organizaciones hacen con los datos es lo que importa. Los grandes datos se pueden analizar para obtener información que conduzca a mejores decisiones y movimientos estratégicos de negocios.

Me gustaría compartir un video para comprender mejor los big data.

Aprendizaje automático: el aprendizaje automático es un método de análisis de datos que automatiza la creación de modelos analíticos. Mediante el uso de algoritmos que aprenden de manera iterativa de los datos, el aprendizaje automático permite a las computadoras encontrar información oculta sin tener que programar explícitamente dónde buscar.

La ciencia de datos es un campo que extrae valor de datos grandes o complejos utilizando herramientas como el modelado estadístico / inferencia y sus extensiones a algoritmos de aprendizaje automático. Aquí hay una descripción general rápida de la taxonomía y ejemplos de cómo se usa en la industria: https://www.slideshare.net/Colle

Data Science proporciona soluciones de ciencia de datos y consultoría para desbloquear el valor de sus datos.

Big data es un activo de información de gran volumen, alta velocidad y alta variedad que demanda rentable.

El aprendizaje automático es el estudio de algoritmos informáticos que mejoran automáticamente a través de la experiencia y ha sido fundamental para la investigación de IA.

Si alguna cantera sobre detalles de aprendizaje en línea viene insanlytics.