- Según las tendencias de la lista de correo de DBWorld , el tema de investigación más candente en la actualidad son las bases de datos distribuidas (escala tera y escala peta): http://www.cs.wisc.edu/dbworld/
- Consulte también el programa de la conferencia VLDB : http://www.vldb2010.org/accept.htm y CIDR : http://www.cidrdb.org/cidr2011/p…
- Consulte los documentos de Google Research sobre sistemas distribuidos: http://research.google.com/pubs/… y Recuperación de información: http://research.google.com/pubs/… y ¿Cuáles son los documentos de Google Research más interesantes?
- Consulte las publicaciones recientes de Microsoft (empresa) en el campo: http://research.microsoft.com/en… y la lista de las principales conferencias: http: //academic.research.microso…
- Recomiendo el blog de investigación de Daniel Abadi para algunos temas y tendencias emergentes: http://dbmsmusings.blogspot.com/ y sus publicaciones: http://cs-www.cs.yale.edu/homes/… también vea Quora Respuesta del usuario a ¿Cuáles son los mejores y perspicaces blogs sobre datos, incluida la forma en que las empresas utilizan los datos?
- Bases de datos comerciales y almacenes de datos como Amazon Dynamo http://en.wikipedia.org/wiki/Dyn…), Google Bigtable (http://en.wikipedia.org/wiki/Big…) y Google Percolator (http: / /research.google.com/pubs/…), kdb + de KX systems (http://kx.com/Products/kdb+.php), C-store de Vertica (empresa) (http://en.wikipedia.org / wiki / Mic …), Times Ten (http://www.oracle.com/timesten/i…) e implementaciones de código abierto como Redis, Cassandra (base de datos), HBase, MongoDB, Riak, MonetDB , Scalaris, H-store (http: // hstore .cs.brown.edu /) Vale la pena explorar en profundidad. Ver también http://en.wikipedia.org/wiki/Dis…
- La reciente explosión de datos (http://en.wikipedia.org/wiki/Big…) condujo a una revisión importante de la aplicabilidad del modelo relacional en ciertos dominios donde sus restricciones son excesivamente limitantes (ver http://en.wikipedia.org/ wiki / NoSQL). Para obtener una buena descripción general de las bases de datos no relacionales emergentes y los almacenes de valores clave, consulte Varley. Sin relación: las bendiciones mixtas de las bases de datos no relacionales : http://ianvarley.com/UT/MR/Varle…, tesis de Abadi, ejecución de consultas en sistemas de bases de datos orientados a columnas : http: //cs-www.cs.yale .edu / homes / … y Meijer & Bierman, un modelo correlacional de datos para grandes bancos de datos compartidos : http://queue.acm.org/detail.cfm?…
- Las bases de datos de gráficos (http://scholar.google.com/schola…) son extremadamente importantes en las redes sociales en línea modernas y en muchos otros dominios, este es un tema de investigación activa (por ejemplo, ver Neo4j , HyperGraphDB , InfiniteGraph ), http: //www.graph-database.org/, http://nosql-database.org/
- Consulte Microsoft Trinity , una base de datos de gráficos sobre la nube de memoria distribuida: http://research.microsoft.com/en… y Google Pregel , un sistema para el procesamiento de gráficos a gran escala: http://portal.acm.org/citation.c …
- Los sistemas de bases de datos especializados y el almacenamiento de datos en bioinformática podrían ser un buen tema para la investigación aplicada, por ejemplo, ver Atlas : http://www.biomedcentral.com/147… y el ecosistema Bowtie : http: //bowtie-bio.sourceforge.ne…
- Echa un vistazo a algunos trabajos interesantes realizados por Luis Gravano en búsqueda estructurada y extracción de información de la “web oculta”: http://www.cs.columbia.edu/~grav…
- Dado que los costos de la memoria de acceso aleatorio disminuyen continuamente, el tema de las bases de datos de memoria principal probablemente atraerá cada vez más atención (consulte http://en.wikipedia.org/wiki/In-…). Echa un vistazo a Memcached, Hazelcast, Membase, MemSQL, FastDB, SciDB y RAMCloud: http://fiz.stanford.edu:8081/display/ramcloud/Home
- Druida: una tienda OLAP distribuida en memoria: http://metamarketsgroup.com/blog…
- Google Snappy , http://code.google.com/p/snappy/, una biblioteca de compresión / descompresión utilizada en BigTable.
- Heroku Doozer : http://xph.us/2011/04/13/introdu… y http://blog.golang.org/2011/04/g…
- LevelDB : una biblioteca de base de datos de clave / valor rápida y ligera: http://code.google.com/p/leveldb/
- Otro traductor de SQL a MapReduce: http://www.cse.ohio-state.edu/hp…
- La proliferación de 10 Gigabit Ethernet, Infiniband / RDMA y otras tecnologías de computación de alto rendimiento en la corriente principal puede requerir repensar algunos supuestos básicos en el diseño de la base de datos (consulte ¿Cuándo superará 10 gigabit Ethernet a 1 gigabit Ethernet en la implementación? Y es hora de baja latencia : http : //www.matt-welsh.blogspot.c…)
- RethinkDB (http://www.rethinkdb.com/blog/) está haciendo un trabajo interesante en bases de datos basadas en unidades de estado sólido, es posible que desee comprobarlo
- También creo que faltan algunos productos especializados integrados, o están sobredimensionados, no escalables y / o caros: 1) un motor de análisis db + estrechamente integrado, por ejemplo, para EEG o series de tiempo financieras 2) un marco de mensajes + db estrechamente integrado optimizado para ETL realmente rápido
- Como consejo general, trataría de evitar temas demasiado especializados en favor de la construcción de un sistema de base de datos para un determinado dominio del mundo real (por ejemplo, vea ¿Cómo comparten los científicos los datos y el código?). También vea Patterson, “Cómo tener una mala carrera en la academia”: http://www.cs.berkeley.edu/~patt…
- Relacionado: ¿Cuál es la mejor literatura sobre el diseño de plataformas de bases de datos? ¿Por qué?