¿Cuáles son los beneficios de los diferentes tipos de esquemas en el contexto del almacenamiento de datos?

El mayor beneficio tangible proviene de separar hechos y dimensiones, la capa de presentación, en su propio esquema. Eso significa que puede otorgar a los usuarios acceso solo a ese esquema, y ​​solo verán los resultados finales de su procesamiento.

De lo contrario, los esquemas separados son solo ayudantes, para mantener su DW ordenado.

Nuestro producto (Ajilius) usa cuatro esquemas en una implementación estándar. El esquema de “carga” es nuestra zona de aterrizaje, el primer punto de ingestión de datos. El esquema de “etapa” es donde realizamos todas las transformaciones. El esquema “dw” es la capa de presentación descrita anteriormente, y el esquema “vistas” es donde creamos vistas amigables con BI sobre las tablas de hechos y dimensiones. Podríamos vivir sin ellos, pero hace que sea más fácil trabajar con herramientas de base de datos que usan una vista de árbol de base de datos-> esquemas-> tablas.

Algunas personas de DW usarían una variante de puesta en escena adicional para tablas de puesta en escena persistentes. Lo hemos considerado, pero no hemos visto el valor en nuestro flujo de trabajo.

Los más comunes son:

  1. Esquema de estrella: en este esquema, cada una de las dimensiones se conecta individualmente a la tabla de hechos en el centro, dándole un diagrama similar a una estrella. Una diferencia importante es que NO está normalizado ( normalización del proceso de organización de las columnas (medidas) y tablas de una base de datos relacional para reducir la redundancia y mejorar la integridad). Como no están normalizados, es más fácil escribir consultas (debe escribir menos líneas de INNER JOIN para explorar las dimensiones ).
  • Este tipo de tabla generalmente se prefiere cuando hay filas menores en las dimensiones.

2. Esquema de copo de nieve: una tabla de hechos conectada a muchas dimensiones, pero algunas dimensiones están vinculadas entre sí o normalizadas para mejorar la eficiencia de la consulta y reducir la redundancia de datos (menos redundancia = más fácil de mantener y cambiar los datos) . Obtiene el nombre debido a que las dimensiones están conectadas entre sí de una manera intrincada. La principal diferencia aquí es que está normalizado . Esto se hace para garantizar la integridad de los datos y reducir la redundancia. Como resultado, la consulta de datos requiere mucho más tiempo y es más tediosa en comparación con Star Schema. Una ventaja adicional que tiene sobre un esquema en estrella es que requiere menos espacio de almacenamiento .

  • Se prefiere el esquema de copo de nieve cuando hay demasiadas filas en las dimensiones.

More Interesting

¿Cuáles son las aplicaciones de los procesos estocásticos, particularmente en ciencia de datos y aprendizaje automático?

¿Flipkart tiene un grupo de ciencia de datos cautivo o algo similar? ¿Flipkart emplea 'Data Scientists'?

¿Hay algún curso de análisis (en el Reino Unido o en línea) que se especialice en interpretar análisis y datos para darme información comercial significativa?

¿Cuál es el mejor instituto de capacitación en ciencia de datos en NCR?

¿Cuáles son algunos de los mejores recursos / estudios de caso sobre análisis de datos / prácticas de segmentación de clientes / métricas en las startups?

¿Está garantizado el entusiasmo por la ciencia de datos? Si es así, ¿por qué?

¿Cuál es la diferencia entre el curso de MSc Business Analytics y MSc Data Science en UCL? ¿Cuál es más adecuado para convertirse en un científico de datos?

¿Qué hace el signo at (@) en el lenguaje de programación R?

¿Cuál es la diferencia entre datos sin procesar y procesados?

¿Vender información de los datos de usuario extraídos es tan malo (o ilegal) como vender los datos de usuario en sí?

¿Habrá escasez de especialistas en aprendizaje automático?

¿Cuáles son las perspectivas de trabajo después de hacer una maestría en ciencia de datos / análisis de datos en Irlanda?

¿Cuál es la diferencia entre el análisis empresarial y la ciencia de datos?

En ajedrez, ¿por qué es tan ventajoso jugar al blanco?

¿Cuáles son las mejores consultoras de ciencia de datos?