Sí, creo que el mercado está listo, aunque puedo estar sesgado :), desde que fundé una startup en el espacio, utilizando DHTFS, un sistema de archivos basado en DHT, para crear un motor de búsqueda y descubrimiento distribuido.
Definitivamente es cierto, como se mencionó en las respuestas anteriores, que dicho sistema debería resolver un problema real que las personas tienen y hacerlo realmente bien.
Creo que una nube P2P es ideal para búsquedas y descubrimientos sociales y en tiempo real.
- ¿Cuánto costaría (o cuántas horas hombre tomaría) desarrollar un software de contabilidad personalizado basado en la nube?
- ¿Existe algún almacenamiento en la nube que ofrezca 1 TB o más de almacenamiento gratuito en la nube?
- ¿Qué se puede considerar como middleware en un sistema distribuido?
- ¿Por qué Facebook no crea una plataforma de computación en la nube para competir con Amazon, Microsoft, IBM, Oracle y Google?
- ¿Puedo guardarme en la nube después de morir?
Considere MapReduce, un paradigma muy interesante y popular para la computación distribuida. MapReduce tiene mucho que ver con llevar el cálculo a los datos, es decir, hacer el cálculo en los nodos (mapa) y luego agregar los resultados a través de la red (reducir).
Ahora está muy claro que los datos de atención del usuario (en lo que hacen clic) son muy valiosos para la búsqueda y el descubrimiento, sin embargo, un modelo centralizado se basa en cargar todo eso en una sola ubicación y luego hacer un supuesto MapReduce local. Claramente, MapReduce podría hacerse a través de la red, sin cargas centralizadas.
Además del argumento de eficiencia planteado aquí, es aún más importante considerar los problemas de privacidad. Cargar cantidades masivas de datos de atención del usuario en una ubicación centralizada no es algo que hará que los usuarios sean cálidos y confusos 🙂 como estamos viendo cada vez más.
En una nube P2P, no hay un hermano mayor que vigile a nadie, todo el cómputo y el almacenamiento de datos se realiza en la nube, fragmentado en muchas, muchas pequeñas piezas encriptadas al igual que BitTorrent.
En cuanto al ancho de banda y el almacenamiento, los costos han bajado mucho, pero no son gratuitos. Considere hacer un análisis o experimento de datos web de tamaño decente (algo de lo que los ingenieros de Google se enorgullecen), por supuesto, puede hacer un rastreo y obtenerlo de manera directa, pero, por ejemplo, mil millones de páginas (cientos de TB) costarían decenas de miles de dólares en rastreo solo más una cantidad similar para el almacenamiento.
Dichos costos son responsabilidad de grandes corporaciones o startups bastante bien financiadas. Pero definitivamente sería una provincia de incluso una nube P2P de tamaño moderado, digamos cientos (miles) de usuarios (suponiendo, por ejemplo, 10 GB de disco y 100 MB de RAM por usuario).
La búsqueda y descubrimiento social es solo un ejemplo de cómo aprovechar una nube totalmente distribuida. Hay muchos otros, siempre que la nube sea rápida (<1 segundo de respuesta, <0,5 segundos para la búsqueda de DHT) y lo suficientemente robusta (alta redundancia).