¿Cuáles son algunos problemas interesantes y no resueltos en sistemas distribuidos?

Me he estado haciendo esta misma pregunta, pero desde una perspectiva más amplia de problemas de investigación interesantes que pueden tener un gran impacto en cómo construimos sistemas distribuidos a gran escala.

Encontré una publicación interesante de Roar Nybø que enlaza con dos artículos sobre este tema:
La respuesta de Roar Nybø a ¿Cuáles son los problemas no resueltos de la informática?

En el documento “Hacia una agenda de investigación de computación en la nube”, dos investigadores bien conocidos en sistemas distribuidos (Birman, van Renesse) discuten la relevancia de la agenda de investigación de sistemas distribuidos frente a la aparición de la computación en la nube como el paradigma dominante para la próxima generación de sistemas distribuidos. Mencionan, por ejemplo, el problema del fracaso bizantino.
http://www.cs.cornell.edu/projec…

De estas lecturas, he llegado a una breve lista de problemas relevantes:

  1. Una mejor comprensión de las restricciones de consistencia en el almacenamiento de datos replicados a gran escala, más allá del teorema de CAP. En particular, comprenda cómo modelar e implementar diferentes requisitos de consistencia que van desde la consistencia fuerte tradicional hasta el enfoque de “mejor esfuerzo” ahora prevaleciente que no puede garantizar la consistencia
  2. Algoritmo de coordinación alternativo con requisitos menos exigentes para bloquear ese 2FC y Paxos, pero que aún puede ofrecer algunas garantías sólidas. Un ejemplo en esa dirección es el algoritmo ZAB utilizado por Apache Zookeeper.
  3. Métodos y herramientas formales prácticos para validar sistemas a gran escala con patrones de interacción complejos. Hay un gran artículo, “El imperativo declarativo” que explica por qué esto es importante y cómo pueden ayudar modelos como la programación lógica.

Ocho problemas abiertos en Computación Distribuida:

http://cs.yale.edu/homes/aspnes/