En resumen, los modelos conceptuales suelen estar en un nivel más alto de abstracción y carecen de detalles como campos / columnas. Se muestran enlaces (relaciones) pero se pueden omitir claves. Los modelos conceptuales son útiles para hablar a un alto nivel sobre las entidades comerciales y cómo se relacionan entre sí. Estos modelos pueden incluir información de cardinalidad que especifica reglas comerciales como “un pedido tiene de una a 100 líneas de pedido”, “un pedido tiene un destinatario”, etc.
Pasar a un modelo lógico inicialmente requiere la identificación de campos / columnas, claves candidatas, asociación de relaciones de claves foráneas y restricciones iniciales no procedimentales sobre cardinalidad, tipos de datos, rangos, nulidad, campos obligatorios, etc. El nivel de detalle sobre las restricciones entre lógicas y los modelos físicos son borrosos. Con las herramientas de diseño modernas, es común especificarlas al principio del proceso, ya que la mayoría de las herramientas permiten (o incluso requieren) esta información para crear los diagramas del modelo.
- Como aspirante a científico de datos, ¿qué lenguaje de programación debo aprender entre Python, R, C # y Java, dado que no tengo experiencia previa en programación? Tengo una licenciatura en economía y estadística y una maestría en administración.
- ¿Por qué las empresas solicitan habilidades de ingeniería de datos cuando reclutan científicos de datos, es decir, matemáticos?
- ¿Qué son los datos de alta dimensión en Big Data?
- ¿Se puede utilizar el aprendizaje automático para explicar las tendencias de datos históricos?
- ¿Cuál es el mejor esquema de partición de disco para un Hadoop DataNode? ¿Es una pequeña partición RAID5 una mejor opción, o tal vez el sistema operativo debería coexistir en la primera partición DataNode, para evitar problemas de espacio en disco?