¿Cuál es el tema digno de investigación en un dominio de computación en la nube, específicamente relacionado con el almacenamiento de datos?

Un área que creo que podría ser de interés es mejorar la portabilidad de grandes almacenes de datos en la nube.

La mayoría de los proveedores de servicios en la nube le proporcionarán una máquina virtual con una cierta cantidad de CPU, RAM, espacio en el disco duro, etc. En general, estas máquinas tienen especificaciones bastante ligeras en comparación con las máquinas físicas típicas, ya que habrá muchas máquinas virtuales ejecutándose en un servidor único

Una gran ventaja de esta configuración es que las máquinas virtuales son portátiles . Puede redistribuirlos entre diferentes hosts físicos, lo que significa que puede estar constantemente actualizando y reparando su hardware físico sin tener que bajar su hardware virtual.

Desafortunadamente, eso también significa que los discos duros virtuales en las máquinas virtuales deben mantenerse a un tamaño razonable: 40 GB a 80 GB es típico. Existe un mayor almacenamiento en la nube, pero desde el punto de vista de las máquinas virtuales, generalmente se monta como almacenamiento remoto.

Entonces, la pregunta es: ¿cuáles son algunas buenas técnicas para permitir discos duros más grandes (1 TB, por ejemplo) en máquinas virtuales, mientras se mantiene la capacidad de moverlos entre hosts físicos de manera eficiente? Y, por supuesto, sería bueno si una “unidad” de 1 TB que está solo un 5% llena fuera veinte veces más fácil de mover que la misma unidad 100% llena.

Para el almacenamiento de datos, las principales áreas de investigación que conozco son:

  • Compresión (puede ser realmente complicado cuando los datos vienen cifrados y hay muchos)
  • Desduplicación de datos (es realmente parte de la compresión)
  • Persistencia y tolerancia a fallas
  • Latencia (Integrar cintas magnéticas que pueden tomar minutos de tiempo de búsqueda en un sistema de baja latencia es difícil, pero son muy baratas)
  • Como dijo Jordan Dimov, el almacenamiento definido por software (es una buena manera de implementar todas las ideas anteriores)

El área más caliente en este momento es algo llamado Almacenamiento definido por software ( http://en.m.wikipedia.org/wiki/S …). Es posible que desee analizar el trabajo que IBM está haciendo en esta área ( http://venturebeat.com/2015/02/1 …)

More Interesting

¿Cómo es investigar en el Instituto Nacional de Informática (NII) de Japón?

¿Está bien enviar un correo a un autor pidiéndole que me proporcione el código fuente de su trabajo?

¿Cuáles son las desventajas de la inferencia de tipos?

¿Cuáles son algunos algoritmos de alineación de secuencia?

¿Cuáles son los documentos más influyentes en el mundo del big data? ¿Por qué?

¿Cuáles son las ideas que puedo investigar?

Investigación: ¿Cuáles son los temas en los que se está llevando a cabo una investigación innovadora actualmente?

¿Qué es una metaclase?

¿En qué se diferencia la investigación de IA en India de la investigación de IA en EE. UU. O China?

¿Recomendaría ITU sobre Fast para alguien que quiera publicar en su licenciatura? ¿Qué hay de NUST?

Voy a ir a la universidad pronto y tengo muchas ganas de hacer una investigación de pregrado de CS, pero todos los trabajos de investigación que he intentado leer están muy por encima de mi cabeza. ¿Esto es normal?

¿Es común que un estudiante graduado descubra un nuevo teorema?

¿Cuáles son los proyectos más interesantes en Facebook AI Research (FAIR)?

¿Cuáles son los 5 mayores problemas en informática?

¿Qué se necesita para ser admitido en una de las mejores escuelas de EE. UU. (MIT, CMU, Berkeley o Stanford) para obtener una maestría de CS? CGPA de alrededor de 3, con considerable experiencia en investigación (4 publicaciones internacionales + una pasantía de investigación en IIT KGP). Pasante como ingeniero de software.