El procesamiento analítico en línea (OLAP) generalmente se compara con el procesamiento transaccional en línea (OLTP) y es una forma de almacenar datos para que pueda usarse para mejores consultas analíticas. La mayor diferencia en OLAP es que los datos se almacenan en lo que comúnmente se conoce como un cubo OLAP. Sin embargo, en OLTP, los datos se almacenan en tablas y utilizan un sistema de base de datos relacional.
Lo que OLAP hace es preprocesar todas las formas en que alguien puede analizar los datos para que cuando alguien los use, el proceso sea muy rápido .
OLAP proporciona datos de resumen y genera cálculos enriquecidos. Por ejemplo, OLAP responde preguntas como “¿Cómo se comparan las ventas de fondos mutuos en América del Norte para este trimestre con las ventas de hace un año? ¿Qué podemos predecir para las ventas del próximo trimestre? ¿Cuál es la tendencia medida por el cambio porcentual?”
- ¿EsProc puede reemplazar SQL?
- ¿Cómo se conectan Hadoop y Machine Learning?
- Cómo escanear un diccionario antiguo de manera que pueda indexar el contenido
- ¿Cómo se aplica el big data al marketing de películas?
- ¿Qué es la "ciencia" en ciencia de datos? ¿Se trata exclusivamente de la ciencia de monetizar grandes datos, o también hay un aspecto de no negocios?
Ventajas de OLAP
- Rendimiento de consulta rápido debido al almacenamiento optimizado, indexación multidimensional y almacenamiento en caché.
- Menor tamaño de datos en el disco en comparación con los datos almacenados en la base de datos relacional debido a las técnicas de compresión.
- Cálculo automatizado de agregados de datos de nivel superior.
- Es muy compacto para conjuntos de datos de baja dimensión.
- Los modelos de matriz proporcionan indexación natural.
- Extracción efectiva de datos lograda mediante la preestructuración de datos agregados.
Desventajas de OLAP
- En algunas soluciones OLAP, el paso de procesamiento (carga de datos) puede ser bastante largo, especialmente en grandes volúmenes de datos. Esto generalmente se soluciona haciendo solo un procesamiento incremental, es decir, procesando solo los datos que han cambiado (generalmente datos nuevos) en lugar de reprocesar todo el conjunto de datos.
- Algunas metodologías OLAP introducen redundancia de datos.
Fuentes / leer más:
Procesamiento analítico en línea
Olap.com
Descubrimiento de conocimiento y minería de datos
Base de datos relacional
OLAP y minería de datos