Data Science es la extracción de conocimiento de grandes volúmenes de datos estructurados o no estructurados, [1] [2] que es una continuación de la minería de datos de campo y el análisis predictivo, también conocido como descubrimiento de conocimiento y minería de datos (KDD).
Big data es un término amplio para conjuntos de datos tan grandes o complejos que las aplicaciones tradicionales de procesamiento de datos son inadecuadas. Los desafíos incluyen análisis, captura, conservación de datos, búsqueda, uso compartido, almacenamiento, transferencia, visualización y privacidad de la información. El término a menudo se refiere simplemente al uso de análisis predictivos u otros métodos avanzados determinados para extraer valor de los datos, y rara vez a un tamaño particular de conjunto de datos. Big data generalmente incluye conjuntos de datos con tamaños más allá de la capacidad de las herramientas de software comúnmente utilizadas para capturar, seleccionar, administrar y procesar datos dentro de un tiempo transcurrido tolerable. [14] El “tamaño” de Big Data es un objetivo en constante movimiento, a partir de 2012, desde unas pocas docenas de terabytes hasta muchos petabytes de datos.
Visualización de ediciones diarias de Wikipedia creadas por IBM. Con varios terabytes de tamaño, el texto y las imágenes de Wikipedia son un ejemplo de big data.
El aprendizaje automático es un campo que explora la construcción y el estudio de algoritmos que pueden aprender y hacer predicciones sobre los datos [2]. Tales algoritmos operan construyendo un modelo a partir de entradas de ejemplo para hacer predicciones o decisiones basadas en datos, [3] en lugar de seguir instrucciones estrictamente estáticas del programa.
- ¿Qué evento específico podría llevar a una computadora a ser consciente de sí misma?
- ¿Existe un teorema en el aprendizaje automático que establezca que algunos entornos son mucho mejores para el aprendizaje que otros?
- ¿Qué piensas sobre el auge del aprendizaje automático?
- ¿Hay alguna relación entre las máquinas de Turing, la integridad de Godel y los teoremas de incompletitud?
- ¿Cuál es el problema más importante actualmente sin resolver que cree que será posible resolver para 2021?