Trataré de responder esto según mi comprensión y conocimiento. Entonces las sugerencias / correcciones son bienvenidas.
Almacenamiento de datos
Es una actividad que resulta en la integración de datos de múltiples fuentes y su almacenamiento de tal manera que los mismos datos unificados sirven a diferentes departamentos de una organización / empresa.
Incluye las siguientes actividades:
1. Extracción de datos de diferentes fuentes.
2. Transformando datos según la necesidad
3. Carga en un modelo plano / jerárquico con fines informativos.
Minería de datos
Es una actividad interdisciplinaria que consiste en examinar grandes conjuntos de datos ya existentes y descubrir patrones desde diferentes perspectivas y resumirlos en información útil.
Las actividades involucradas son de naturaleza diversa y a menudo provienen del dominio de los sistemas de Inteligencia Artificial, Aprendizaje Automático, Estadística y Base de Datos.
No tenemos un objetivo predefinido en este caso de análisis.
- Cómo convertirse en un científico de datos en la NASA
- ¿Cuáles son algunos libros que debe tener un científico de datos?
- ¿Cuáles son las similitudes y diferencias fundamentales entre un actuario / ciencias actuariales y un científico de datos / ciencia de datos?
- ¿Cómo será utilizada la ciencia de datos por las empresas de realidad virtual y AR?
- En la selección de características, ¿debemos eliminar siempre todas las características que tienen una alta covarianza entre ellas?
Análisis de datos
Es el proceso de examinar conjuntos de datos para sacar conclusiones sobre la información que contienen, cada vez más con la ayuda de sistemas y software especializados.
Las actividades involucradas son principalmente diseñar un modelo para el análisis y ejecutar el conjunto de datos sobre el modelo para predicciones y otros resultados.
En este caso, tenemos ciertos objetivos que controlan el diseño de nuestro modelo analítico.