Vanilla Hadoop no está realmente diseñado para la tenencia múltiple. El mayor reconocimiento que Hadoop da a la tenencia múltiple es el planificador de capacidad, e incluso está diseñado para un número relativamente pequeño de inquilinos (por ejemplo, varios departamentos en una sola organización que contribuyen con un conjunto de nodos a un clúster). Hadoop generalmente tiene muy pocas protecciones contra la contención de recursos y seguridad insuficiente para ser una plataforma robusta de múltiples inquilinos.
Amazon Elastic MapReduce (EMR) logra la tenencia múltiple a través de la virtualización. En EMR, un clúster virtual de Hadoop se crea dinámicamente a pedido y se conserva solo durante el tiempo que sea necesario (de forma predeterminada, solo durante la duración de un solo trabajo M / R). La persistencia de datos generalmente se logra mediante un mecanismo de almacenamiento externo de AWS (IE S3 o EBS).
- ¿Cómo verificamos la corrección de un algoritmo?
- Si una computadora toma el control total del control del tráfico aéreo, ¿cómo será el algoritmo? ¿Cómo manejará los aterrizajes de emergencia y cómo manejará una pista paralela?
- ¿La informática es solo sobre programación y algoritmos?
- ¿Los programadores escriben programas en 1s y 0s?
- Si los algoritmos avanzados y las estructuras de datos nunca se utilizan en la industria, ¿por qué aprenderlos?