¿Existe alguna mejor práctica o técnica para modelar bases de datos / conjuntos de datos para big data y / o aprendizaje automático? La tecnología cambia la vida futura

En el modelo relacional, … los datos se dividen en pequeños fragmentos … que están conectados entre sí por relaciones … Al dividir los datos en partes más pequeñas, … se garantiza la precisión al hacer la entrada de datos … un proceso único … y luego reutilizar el datos … conectándolo con otras piezas … Usando este proceso, … una gran colección de datos no organizados se simplifica … en sus unidades más pequeñas … y luego se relaciona con muchas otras unidades pequeñas … para recrear el panorama general … en un formato más organizado. … El modelo relacional proporciona una forma simple … y flexible de describir datos … [1]

Estos son algunos cursos que pueden ayudarlo:

https://stackoverflow.com/questi…

Tutorial sobre modelado de datos, almacenamiento de datos e inteligencia empresarial.

Aprendizaje de modelado de datos – Udemy

Introducción al modelado de datos.

En ingeniería de software, el modelado de datos es el proceso de crear un modelo de datos para un sistema de información. Esto se realiza mediante la aplicación de técnicas formales de modelado de datos.

También hay muchas herramientas que pueden ayudarte con el modelado. Algunos de ellos son gratuitos, otros no. Le enumeraré algunos de los que he encontrado más útiles.

SQLDbm

SqlDBM inicialmente comenzó con soporte incorporado para el servidor SQL de Microsoft solamente.

Pero, por supuesto, debido a la gran cantidad de solicitudes de soporte de MySQL de nuestros usuarios, hemos estado trabajando duro para expandir nuestro producto.

Y ahora, estamos muy orgullosos de anunciar que SqlDBM ofrece soporte para MySQL , una de las bases de datos de código abierto más populares del mundo.

Ahora puede modelar y diseñar su / s base de datos MySQL directamente en SqlDBM. Y, por supuesto, puede aprovechar y adaptar las funciones de SqlDBM en su base de datos MySQL, como áreas temáticas, relaciones, diagramas, modos de visualización, etc.

SQLDBM le ofrece una manera fácil y conveniente de diseñar su base de datos absolutamente en cualquier lugar en cualquier navegador, trabajando sin necesidad de ningún motor de base de datos adicional o herramientas o aplicaciones de modelado de bases de datos. Use SQLDBM para diseñar y administrar bases de datos grandes y pequeñas y modelos de datos sobre la marcha. Todo mientras incorpora las reglas y objetos necesarios de la base de datos, como claves de la base de datos, esquemas, índices, restricciones de columna y relaciones.

Precio: gratis

PowerDesigner

PowerDesigner es posiblemente la herramienta de modelado de datos líder de la industria. Sus características incluyen: modelos totalmente integrados, diferentes técnicas de modelado que se adaptan a una audiencia centrada en TI y no centrada en TI. También admite un potente repositorio de metadatos y varios formatos de salida. Tiene una interfaz de usuario agradable y pulida con documentación de ayuda fácil de leer que ayuda al usuario a resolver rápidamente problemas ad hoc.

Precio: $ 2,000

‌‌ ER / Studio

ER / Studio es una herramienta de modelado de datos intuitiva que admite entornos únicos y multiplataforma, con integración nativa para plataformas de grandes datos como MongoDB y Hadoop Hive. Puede enviar y revertir modelos de ingeniería, incluye una función de comparación y combinación y puede crear informes en varios formatos (XML, PNG, JPEG). Las funciones integradas automatizan las tareas de rutina y son compatibles con las plataformas de bases de datos populares. ER / Studio es una gran herramienta con la que es fácil comenzar a trabajar debido a su diseño intuitivo y buen soporte al usuario.

Precio: $ 1,500 hasta $ 7,500

Realmente depende de ti. Para diseñar o rediseñar una base de datos de cualquier complejidad, la herramienta de modelado Entidad-Relación se vuelve esencial. Las herramientas especializadas que han dominado la industria durante mucho tiempo son caras y se instalan en una estación de trabajo.

Notas al pie

[1] Introducción al modelado de datos

Análisis deAprendizaje automáticoBig DataCiencia de datosdatosMinería de