¿En qué se diferencia la minería de datos de los sistemas de bases de datos?

Espero tener la pregunta detrás de tu pregunta.

Las bases de datos se crearon para procesar transacciones, todos los sistemas de bases de datos son muy buenos para insertar, actualizar y eliminar registros, así como para realizar procesos transaccionales, confirmar y deshacer, etc.

Las bases de datos nunca se crearon teniendo en cuenta las tareas analíticas o de descubrimiento, se pueden usar para eso, pero ese nunca fue el trabajo real de una base de datos.

La minería de datos, el análisis y muchas otras “nuevas disciplinas” se basan en la fragmentación de datos para descubrir cosas, patrones, ideas, cosas útiles que podemos aprender de los datos. Si bien puede usar una base de datos para que las nuevas herramientas, como las bases de datos sin sql y los algoritmos de aprendizaje automático, sean mejores opciones.

Me gustaría enfatizar que la respuesta popular “las bases de datos se utilizan para almacenar cosas” no es, en mi opinión, una buena. Almacenar cosas nunca es el objetivo de un sistema, sino una forma de manejar datos para hacer algo. Esa es la idea clave de qué hacer con los datos, además de colocarlos en algún lugar, y allí es donde las bases de datos y la minería de datos difieren.

La minería de datos es un tipo de tarea, mientras que un sistema de base de datos es una instalación de software. La minería de datos puede o no involucrar algún tipo de sistema de base de datos; Los proyectos de minería de datos a menudo involucran varios sistemas de bases de datos (que pueden ser SQL, NoSQL o ambos), así como el análisis de archivos individuales utilizando varios tipos de software (que no son de base de datos).

Los sistemas de bases de datos se utilizan para todo tipo de acceso a datos, de los cuales la minería de datos es solo un tipo.

Como regla general, la minería de datos está más en el “espectro de soporte de decisiones” de las aplicaciones de datos que en el “espectro de procesamiento de transacciones”, que está en el “extremo opuesto” de lo que se hace con los sistemas de bases de datos.