No estoy realmente seguro de qué es la compresión de datos.
Datos mineros es más una palabra general para obtener información útil de conjuntos de datos. La compresión de datos se puede ver desde dos puntos de vista. Desde el punto de vista de “computadora y disco”, está reduciendo el tamaño de sus archivos. A partir de datos estadísticos, preferiría utilizar la reducción de la dimensionalidad de los datos. Por ejemplo, los métodos factoriales son una forma de reducir la dimensionalidad de un conjunto de datos. Está buscando algunos factores que resumen la información de su conjunto de datos. “pocos” significa menos factores que las variables originales en el conjunto de datos.
También puede ver la construcción de modelos como un método de compresión, de alguna manera. Por ejemplo, si su interés principal es solo predecir una variable a partir de otras variables, si descubre que solo necesita unas pocas variables, no necesita hacer frente a todas las variables disponibles, solo a las más predictivas.
- ¿Podría evitar usar una tecnología distribuida en el trabajo en un solo nodo y pasar entrevistas de ciencia de datos?
- ¿Cuáles son las perspectivas de trabajo después de hacer una maestría en ciencia de datos / análisis de datos en Irlanda?
- ¿Qué clases debo tomar en Oxford para convertirme en científico de datos?
- ¿Qué controles / auto revisión aplica para la visualización de datos?
- ¿Qué debo saber antes de aprender el análisis de big data?
Mi respuesta es muy insatisfactoria, pero puede ayudar a comenzar la discusión.