¿Cuáles son las ventajas y desventajas de usar la distribución Secure Hadoop?

Al decir “Hadoop seguro”, supongo que se refiere a activar las diversas características de seguridad que están presentes en algunas de las distribuciones más recientes y, en particular, en el soporte de Kerberos.

La seguridad solo es buena como el proceso y las prácticas a su alrededor. Si todos usan el mismo inicio de sesión para acceder a los recursos de Hadoop, la seguridad realmente no te ayudará mucho. Pero en un verdadero sistema multiinquilino, las características de seguridad ofrecen algunas protecciones que pueden no ser completamente obvias:

  • Obviamente existe la protección contra la intención maliciosa. Si bien no es una solución completa, un poquito ayuda …
  • Las posibilidades son buenas, la persona que realizó la acción es la que realmente lo hizo. Antes de tener autenticación, cualquiera podía hacerse pasar por otra persona. Para configuraciones grandes, no es inusual que alguien “tome prestada” la identidad de otra persona porque solo necesita hacer “esta cosa”. No está destinado a ser malicioso, pero hace que la administración del sistema sea mucho más difícil cuando “esa única cosa” impacta negativamente en un recurso (¡compartido!).
  • Con la autenticación, obtienes autorización. Esto es importante para cosas como las ACL en las colas, la eliminación de trabajos, etc. Los usuarios abusarán (¡y lo harán!) De estas características si creen que su trabajo se ejecutará X minutos más rápido. El administrador del sistema no puede estar mirándolo todo el tiempo …
  • “las buenas cercas son buenas vecinas” … activando la función que obliga a ejecutar las tareas, ya que el usuario que envió permite protegerse contra los usuarios que usan demasiado de un recurso dado. También evita que los usuarios sobrescriban las configuraciones de Hadoop a nivel de sistema.

Esos son solo algunos de los aspectos más destacados. Hay muchas otras cosas menores, pero el resumen es este:

tl; dr

Las características de seguridad tratan más de proteger a los usuarios de otros usuarios que de reducir la intención maliciosa. Hace esto, pero todavía hay suficientes agujeros en los que alguien malicioso probablemente pueda entrar.