¿Cuáles son los principales desafíos en la gestión de un entorno OpenStack?

En mi opinión, los siguientes son los principales desafíos de la gestión de un entorno de taladro abierto:

  1. Los entornos de OpenStack incluyen tantos componentes y todos hacen que trabajar juntos sea una tarea desalentadora, y aún es un software que está madurando.
  2. Tendrá miles o cientos de miles de máquinas virtuales y necesitará tener un proceso de CI / CD automatizado completo y bien establecido para la gestión del software, de lo contrario, la gestión del entorno sería muy difícil. (Esto podría ser un desafío común para todos los entornos de nube)
  3. Falta de recursos técnicos para Openstack: a pesar de que está aumentando rápidamente, todavía hay escasez de recursos técnicos, que comprende la complejidad del entorno de Openstack.
  4. Openstack es un software que está madurando y en constante evolución y necesita tener recursos para mantenerse al día con los cambios y las migraciones.

Sin dudas, está gestionando actualizaciones / mejoras. Como se señaló anteriormente, OpenStack se compone de muchos servicios que dependen unos de otros para que la implementación funcione. Se han desarrollado herramientas para manejar esto, pero es suficiente decir que todavía no es una tarea fácil.

Estamos probando y observando muy de cerca “Stackanetes” desarrollado por nuestro socio CoreOS. Si no has visto este video, échale un vistazo:

Hola patricio

Desafío principal IMO es administrar SDN (Redes definidas por software) dentro de OpenStack (basado en espacios de nombres del kernel), como vlan, vxlan, túneles gre, OVS (openVswitch), etc. Si algo falla en la red de OpenStack, es bastante difícil resolverlo. . Sin embargo, los registros de Neutron y Nova pueden ser muy útiles.

Gracias por A2A.

Mi trabajo diario implica administrar el entorno OpenStack para mi empresa, donde lo usamos como nube privada. Anteriormente estábamos usando La Habana, sin soluciones de alta disponibilidad implementadas, por lo que éramos propensos a fallas. Ahora, la solución que he implementado, confirma a dos capas de HA. Entonces, tengo tres controladores, cada uno con MariaDB con galera y rabbitmq en HA, además de varias copias de los mismos servicios que se ejecutan detrás de dos nodos haproxy en HA usando keepalived.

Con el nodo de red, tengo l3-agent y dhcp-agent en HA. Entonces, si pierdo un par de controladores o uno de los nodos de la red, todavía estoy listo. Por lo tanto, casi la mayoría de los dolores de cabeza de mantener un OpenStack Cluster en funcionamiento desaparecieron para mí.

Pero, aún tenemos muchos desafíos, eso viene del backend que estamos usando para Glance, Cinder y Nova. Estamos usando Ceph para eso, y si Ceph se comporta de manera anormal, tenemos el peor momento por delante. Los mensajes perdidos y atascados en rabbitmq, básicamente detienen todas las operaciones de OpenStack y una pequeña inconsistencia en la base de datos causa muchos problemas.

La parte más importante es mantener su lanzamiento con upstream. Todavía no he implementado la integración continua, pero estoy planeando hacerlo en un futuro cercano. Confío en los scripts de Puppet escritos por mí (yo mismo he escrito un conjunto completo de scripts) para mantener los cambios de configuración y desplegar nuevos nodos si algo falla. Actualizar a una nueva versión en producción también es uno de los dolores de cabeza, ya que tienes que hacer pruebas paralelas. Estoy corriendo en Kilo, pero este verano me toparé con Mitaka. A ver si todo va bien.

Aparte de eso, hay algunos problemas triviales como que VNC no funciona, algunos problemas de firewall, el cliente dhcp no funciona, pero todos pueden solucionarse con pocas habilidades de depuración y un profundo conocimiento de los componentes internos de OpenStack.