Sí. Es muy posible integrar Hadoop con otros sistemas de archivos.
Tus resultados variarán. Por ejemplo, ya hay integraciones de sistemas de archivos para S3 que probablemente harían que Swift funcione bien. La integración de S3 funciona razonablemente bien, pero la falta de coincidencia de impedancia entre Hadoop y S3 hace que el rendimiento sea un poco decepcionante.
Además, existe el sistema MapR que es Hadoop y muchos componentes del ecosistema de código abierto combinados en un paquete completamente probado con un sistema de archivos más avanzado. El uso de MapR FS conlleva una serie de ventajas significativas, ya que obtiene una operación altamente escalable y totalmente de lectura y escritura.
- ¿Cómo debería ser un currículum para un candidato que desea obtener una maestría en computación en la nube?
- ¿Qué es un buen tutorial sobre cómo comenzar a usar Cloud Datastore de Google?
- ¿Cuáles son los fundamentos básicos de la informática?
- Según el costo cada vez menor del almacenamiento de datos en la nube, ¿cuántos datos podría cargar por día sin tener que aumentar la cantidad que paga?
- ¿Cuáles son los costos de ejecutar aplicaciones web Java basadas en Java / Tomcat en la nube en comparación con otros lenguajes / plataformas como los frameworks Ruby / RoR o PHP / PHP?
Es probable que Ceph se pueda usar en un nivel similar a S3. Ceph en su núcleo es un almacén de objetos y no está diseñado para funcionar en los niveles de rendimiento y escalabilidad necesarios para Hadoop. Es probable que esto genere frustración si espera que Ceph satisfaga todas las necesidades de su sistema de archivos para un clúster Hadoop. Por otro lado, dar acceso a un sistema de archivos Ceph para programas Hadoop es probablemente relativamente fácil.