¿Por qué no hay soluciones a pedido de Hadoop para múltiples inquilinos?

Vanilla Hadoop no está realmente diseñado para la tenencia múltiple. El mayor reconocimiento que Hadoop da a la tenencia múltiple es el planificador de capacidad, e incluso está diseñado para un número relativamente pequeño de inquilinos (por ejemplo, varios departamentos en una sola organización que contribuyen con un conjunto de nodos a un clúster). Hadoop generalmente tiene muy pocas protecciones contra la contención de recursos y seguridad insuficiente para ser una plataforma robusta de múltiples inquilinos.

Amazon Elastic MapReduce (EMR) logra la tenencia múltiple a través de la virtualización. En EMR, un clúster virtual de Hadoop se crea dinámicamente a pedido y se conserva solo durante el tiempo que sea necesario (de forma predeterminada, solo durante la duración de un solo trabajo M / R). La persistencia de datos generalmente se logra mediante un mecanismo de almacenamiento externo de AWS (IE S3 o EBS).

¿Te refieres a esto?
AWS | Amazon Elastic MapReduce (EMR) | Hadoop MapReduce en la nube

Probablemente docenas de servicios como ese, cientos. Amazon es solo uno de los más conocidos.

A2A

Creo que hay muchas empresas disponibles sobre el concepto.

Qubole – Big Data como servicio
Amazon ya está allí