¿Cuál es el historial de la base de datos?

La primera base de datos es el archivo plano, generalmente leído / escrito con acceso exclusivo por un solo proceso. Más tarde, los sistemas compartidos que permitieron mantener bloqueos mediante diferentes procesos permitieron el acceso coordinado a un archivo, generalmente ordenado en una clave particular, y nació la base de datos ISAM. Luego, nacieron procesos completos diseñados simplemente para administrar colecciones de dichos archivos (ahora llamados tablas). Luego, personas muy inteligentes (como Codd) comenzaron a pensar en la coherencia y el acceso concurrente y el álgebra relacional, QUEL, SQL y, finalmente, nació el cálculo relacional, luego nació el control de concurrencia de múltiples vistas. La base de datos relacional finalmente surgió como la herramienta principal para mantener conjuntos consistentes de tablas en un entorno estructurado que se puede administrar, respaldar, etc. Recientemente, muchas personas estúpidas trataron de solucionar los “problemas” de la base de datos relacional al deshacerse de muchos de las características más destacadas de la base de datos, y “NoSQL” nació. ¡Nunca conocí un sistema NoSQL que me importara, ya que cuido mis datos!

¿Cuáles son las mejores bibliotecas y paquetes de Python para la ciencia de datos?

¿Qué son los análisis de big data?

Cómo detectar patrones de respuesta de opción múltiple en R

¿Cuál es la mejor manera de comenzar una carrera en ciencias de datos después de completar un título en ciencias físicas?

¿Cómo explicaría la respuesta a esta pregunta de matemáticas a alguien con poco conocimiento de las matemáticas?

¿Cuál es la diferencia entre análisis prescriptivo y ciencia de datos?

Bueno, gracias por A2A.

Un breve historial de la base de datos 🙁 no tan largo)

Antiguo a moderno: los orígenes se remontan a bibliotecas, registros gubernamentales, comerciales y médicos. Hay una larga historia de almacenamiento, indexación y recuperación de información. No ignore esta historia, generalmente hay algo que aprender de estas personas y su éxito y fracaso. Muchas cosas en línea (y hay muchas) no garantizan la calidad de los datos o la técnica de búsqueda. Los buenos principios de diseño se remontan y ahora se sabe mucho sobre cómo hacer buenos diseños que conduzcan a una mejor confiabilidad y rendimiento.

Década de 1960: las computadoras se vuelven rentables para las empresas privadas junto con la creciente capacidad de almacenamiento de las computadoras. Se desarrollaron dos modelos de datos principales: modelo de red (CODASYL) y jerárquico (IMS). El acceso a la base de datos es a través de operaciones de puntero de bajo nivel que vinculan registros. Los detalles de almacenamiento dependían del tipo de datos a almacenar. Por lo tanto, agregar un campo adicional a su base de datos requiere reescribir el esquema de acceso / modificación subyacente. Se hizo hincapié en los registros que se procesarán, no en la estructura general del sistema. Un usuario necesitaría conocer la estructura física de la base de datos para consultar información. Un gran éxito comercial fue el sistema SABRE de IBM y American Airlines.

1970-72: EF Codd propuso un modelo relacional para bases de datos en un documento histórico sobre cómo pensar en las bases de datos. Desconecta el esquema (organización lógica) de una base de datos de los métodos de almacenamiento físico. Este sistema ha sido estándar desde entonces.

Década de 1970: varios campos de defensores discuten sobre los méritos de estos sistemas competitivos, mientras que la teoría de las bases de datos conduce a proyectos de investigación convencionales. Se desarrollaron dos prototipos principales para sistemas relacionales durante 1974-77. Estos proporcionan un buen ejemplo de cómo la teoría conduce a las mejores prácticas.

Ingres: Desarrollado en UCB. Esto finalmente llevó a Ingres Corp., Sybase, MS SQL Server, Britton-Lee, Wang’s PACE. Este sistema utilizaba QUEL como lenguaje de consulta.

Sistema R: desarrollado en IBM San José y conducido a SQL / DS y DB2 de IBM, Oracle, Allbase de HP, SQL sin interrupción de Tandem. Este sistema utiliza SEQUEL como lenguaje de consulta.

El término Sistema de gestión de bases de datos relacionales (RDBMS) se acuñó durante este período.

1976: P. Chen propuso el modelo Entity-Relationship (ER) para el diseño de la base de datos, lo que proporciona otra visión importante de los modelos de datos conceptuales. Tal modelado de nivel superior permite al diseñador concentrarse en el uso de datos en lugar de la estructura de tabla lógica.

Principios de la década de 1980: la comercialización de sistemas relacionales comienza como un auge en la compra de computadoras que alimenta el mercado de DB para los negocios.

Mediados de la década de 1980: SQL (lenguaje de consulta estructurado) se convierte en “estándar intergaláctico”. DB2 se convierte en el producto estrella de IBM. Los modelos jerárquicos y de red se desvanecen en el fondo, esencialmente sin desarrollo de estos sistemas hoy en día, pero algunos sistemas heredados todavía están en uso. El desarrollo de la PC de IBM da lugar a muchas empresas y productos de DB como RIM, RBASE 5000, PARADOX, OS / 2 Database Manager, Dbase III, IV (más tarde Foxbase, incluso más tarde Visual FoxPro), Watcom SQL.

Principios de la década de 1990: comienza una sacudida de la industria con menos empresas sobrevivientes que ofrecen productos cada vez más complejos a precios más altos. Gran parte del desarrollo durante este período se centra en las herramientas del cliente para el desarrollo de aplicaciones, tales como PowerBuilder (Sybase), Oracle Developer, VB (Microsoft), etc. El modelo cliente-servidor para la informática se convierte en la norma para futuras decisiones comerciales. Desarrollo de herramientas de productividad personal como Excel / Access (MS) y ODBC. Esto también marca el comienzo de los prototipos de los Sistemas de gestión de bases de datos de objetos (ODBMS).

Mediados de los 90: Kaboom! Aparece Internet / WWW utilizable. Se produce una lucha loca para permitir el acceso remoto a los sistemas informáticos con datos heredados. El frenesí cliente-servidor llega al escritorio de los usuarios promedio con poca paciencia para la complejidad, mientras que Web / DB crece exponencialmente.

Finales de la década de 1990: la gran inversión en compañías de Internet alimenta el auge del mercado de herramientas para conectores Web / Internet / DB. Active Server Pages, Front Page, Java Servlets, JDBC, Enterprise Java Beans, ColdFusion, Dream Weaver, Oracle Developer 2000, etc. son ejemplos de tales ofertas. La solución de código abierto entra en línea con el uso generalizado de gcc, cgi, Apache, MySQL, etc. El procesamiento de transacciones en línea (OLTP) y el procesamiento analítico en línea (OLAP) llegan a la mayoría de edad con muchos comerciantes que utilizan la tecnología de punto de venta (POS) en un diariamente.

Principios del siglo XXI: Continúa el declive de la industria de Internet en general, pero el crecimiento sólido de las aplicaciones DB. Aparecen aplicaciones más interactivas con el uso de PDA, transacciones POS, consolidación de proveedores, etc. Tres compañías principales (occidentales) predominan en el gran mercado de bases de datos: IBM (compra Informix), Microsoft y Oracle.

Tendencias futuras: Aparecen sistemas enormes (terabytes) y requerirán nuevos medios de manejo y análisis de datos. Grandes bases de datos científicas, como datos de proyectos genómicos, geológicos, de seguridad nacional y de exploración espacial. El análisis de Clickstream está sucediendo ahora. La minería de datos, el almacenamiento de datos y los data marts son una técnica de uso común en la actualidad. Más de esto en el futuro sin duda. Compras inteligentes / personalizadas utilizando el historial de compras, la hora del día, etc.

Los sucesores de SQL (y quizás RDBMS) surgirán en el futuro. La mayoría de los intentos de estandarizar sucesores de SQL no han tenido éxito. SQL92, SQL2, SQL3 todavía tienen poca potencia y es difícil acordar más extensiones. Lo más probable es que esto sea superado por XML y otras técnicas emergentes. XML con Java para bases de datos es el elemento secundario actual de la “próxima gran cosa”. Consulte mañana para ver qué más son las noticias.

El uso de bases de datos móviles es un producto que ahora está llegando al mercado de varias maneras. El procesamiento de transacciones distribuidas se está convirtiendo en la norma para la planificación empresarial en muchos ámbitos.

Probablemente habrá una sacudida continua en el mercado RDBMS. Linux con Apache que admite mySQL (o incluso Oracle) en hardware relativamente barato es una amenaza importante para los sistemas heredados de alto costo de Oracle y DB2, por lo que estos han comenzado proyectos preventivos para mantener a sus clientes.

Todo orientado a objetos, incluidas las bases de datos, parece estar siempre a punto de barrer todo lo que tiene delante. Se proponen y aceptan estándares de Object Database Management Group (ODMG) y tal vez algo se derive de eso.

Justin Swanhart

More Interesting

¿Hay algún programa de capacitación en ciencia de datos para empleados de H1B que trabajan en otro dominio?

¿Cuál es la diferencia entre CART y los árboles de regresión potenciados?

¿Es aconsejable doble especialización en matemáticas y ciencia de datos si quiero investigar en inteligencia artificial y neurociencia?

¿Qué tipo de preguntas de prueba A / B debo esperar en una entrevista con un científico de datos y cómo debo prepararme para esas preguntas?

¿Vale la pena tomar una clase de teoría de probabilidad de nivel de posgrado para una ciencia de datos o una carrera cuantitativa, y hay algo profesional que uno no podría hacer sin ella?

¿Cuál es el plan de estudios típico para un programa de pregrado en ciencia de datos?

¿Por qué es importante la minería de datos?

En el aprendizaje automático, ¿por qué utilizamos un tercio de los datos para las pruebas y dos tercios para la capacitación? ¿Es sentido común o hay una razón científica?

¿Debo seguir escribiendo aplicaciones móviles o ciencia de datos?

¿Dónde puedo obtener datos de los trenes locales de Mumbai para hacer un análisis de datos en ellos?