Primero decida si es un sistema de procesamiento de transacciones (OLTP) o un sistema de inteligencia empresarial. Luego, participe en el modelado de relaciones entre entidades. En un sistema de transacciones, comience con la tercera forma normal e introduzca la desnormalización solo cuando aparezcan problemas de rendimiento de lectura. Para BI, desea aplanar las principales entidades que reportan intereses.
Básicamente, desea una tabla para cada tipo de entidad que tenga un significado de dominio. Solo usted puede decidir esto, pero una buena manera de hacerlo es escuchar cómo hablan los expertos en la materia, escribir las declaraciones simples que hacen sobre el dominio y hacer el juego “circule los sustantivos”. Los sustantivos que usan generalmente se convierten en tablas. Luego debe encontrar las relaciones “tiene un” entre las cosas y decidir si son de uno a muchos o de muchos a muchos. Estos últimos requieren una tabla de mapeo.
Otra decisión de la que la gente no habla mucho es lo que yo llamo el nivel de abstracción. Hay diferentes opciones para tratar las relaciones “es un”. Si intenta exprimir familias de entidades en menos tablas, está aumentando la abstracción. Si la estructura de datos de su dominio tiene características gráficas, podría modelar esto como nodo y borde, sería un modelo muy abstracto, ya que un nodo podría tener muchos subtipos diferentes. O podría dividir los diferentes tipos de nodos en su dominio y modelarlos como entidades y tablas separadas para obtener un modelo menos abstracto. Las abstracciones crean modelos flexibles que necesitan cambiar menos pero son más difíciles de usar y comprender.
- ¿Por qué las personas almacenan grandes datos utilizando buffers de protocolo (o equivalente)?
- ¿Cuáles son algunos de los procedimientos / metodologías estadísticas comúnmente utilizados en las pruebas A / B?
- ¿Cuáles son las principales herramientas de ciencia de datos utilizadas por las organizaciones líderes?
- ¿Cuál es el salario de un desarrollador de Big Data Hadoop?
- ¿Cómo es ser un científico de datos en McKinsey?
Si vamos demasiado lejos en la otra dirección, podemos fallar en establecer relaciones en el nivel apropiado de abstracción y terminar repitiéndonos. Por ejemplo, tanto las personas como las empresas tienen direcciones. Entonces, a veces hacemos un objeto de “fiesta” para que los conceptos generales reutilizables como dirección y números de teléfono se puedan vincular con una sola clave externa.