¿Cuáles son las características clave de OLAP y las herramientas de minería de datos y cómo se puede usar para ayudar al descubrimiento del conocimiento?

El procesamiento analítico en línea (OLAP) generalmente se compara con el procesamiento transaccional en línea (OLTP) y es una forma de almacenar datos para que pueda usarse para mejores consultas analíticas. La mayor diferencia en OLAP es que los datos se almacenan en lo que comúnmente se conoce como un cubo OLAP. Sin embargo, en OLTP, los datos se almacenan en tablas y utilizan un sistema de base de datos relacional.

Lo que OLAP hace es preprocesar todas las formas en que alguien puede analizar los datos para que cuando alguien los use, el proceso sea muy rápido .

OLAP proporciona datos de resumen y genera cálculos enriquecidos. Por ejemplo, OLAP responde preguntas como “¿Cómo se comparan las ventas de fondos mutuos en América del Norte para este trimestre con las ventas de hace un año? ¿Qué podemos predecir para las ventas del próximo trimestre? ¿Cuál es la tendencia medida por el cambio porcentual?”

Ventajas de OLAP

  • Rendimiento de consulta rápido debido al almacenamiento optimizado, indexación multidimensional y almacenamiento en caché.
  • Menor tamaño de datos en el disco en comparación con los datos almacenados en la base de datos relacional debido a las técnicas de compresión.
  • Cálculo automatizado de agregados de datos de nivel superior.
  • Es muy compacto para conjuntos de datos de baja dimensión.
  • Los modelos de matriz proporcionan indexación natural.
  • Extracción efectiva de datos lograda mediante la preestructuración de datos agregados.

Desventajas de OLAP

  • En algunas soluciones OLAP, el paso de procesamiento (carga de datos) puede ser bastante largo, especialmente en grandes volúmenes de datos. Esto generalmente se soluciona haciendo solo un procesamiento incremental, es decir, procesando solo los datos que han cambiado (generalmente datos nuevos) en lugar de reprocesar todo el conjunto de datos.
  • Algunas metodologías OLAP introducen redundancia de datos.

Fuentes / leer más:

Procesamiento analítico en línea

Olap.com

Descubrimiento de conocimiento y minería de datos

Base de datos relacional

OLAP y minería de datos

¿Es esta una pregunta de prueba o tarea?

OLAP proporciona formas de analizar sus datos de manera eficiente en su conjunto al tiempo que compensa las características o el rendimiento de las transacciones. Para diferentes personas, esto significa agregaciones en columnas, cubos o roll ups e índices extensos. Al final, estas mejoras analíticas rara vez son generales y a menudo tienen que adaptarse al problema en cuestión. Los casos más generales en los que las estadísticas se calculan regularmente y se pueden combinar y probar fácilmente se pueden utilizar para encontrar tendencias, agrupaciones y valores atípicos. Todos estos son descubrimientos de conocimientos básicos y representan gran parte de la fruta de bajo perfil.

Se dejan ejemplos relevantes como ejercicio para el alumno.