Depende de cuál sea su aplicación, qué contención de recursos esté viendo actualmente. La recomendación requiere diagnósticos y la pregunta tiene información mínima para hacer uno. Aquí hay algunas recomendaciones especulativas basadas en suposiciones, elija una bajo su propio riesgo.
¿Vas a necesitar la instancia todo el tiempo, todo el tiempo? La mayoría de los algoritmos de ML no son en tiempo real y requieren trabajar en una ventana dada, por ejemplo, por hora, diariamente, etc. en un conjunto de datos. Una instancia reservada y dedicada sería muy costosa para usted a menos que realmente la esté usando todo el tiempo. Busque formas de obtener instancias cuando las necesite y elimínelas cuando haya terminado. Una vez tuvimos una carga de trabajo que necesitaba calcular las recomendaciones de los usuarios cuando se recibió el nuevo contenido, aferrarse a Elastic Map Reduce clusters por la eternidad no tenía sentido, cuando se recibió el contenido, el modelo ML se ejecutó utilizando un Cluster que se inició, las recomendaciones generadas y clúster terminado para ahorrar costos.
Suponiendo que es una base de datos relacional que tiene en líneas de MySQL, PostgreSQL, SQL Server, ¿es la contención de recursos para usted en las lecturas? ¿Ha considerado agregar réplicas de lectura a su instancia existente sin muchos cambios en la arquitectura de la aplicación? Es posible que pueda escalar sus cargas de trabajo.
- Computación en la nube: ¿Existe un mercado para las nubes de nicho?
- ¿Cuál es el pronóstico del mercado de servicios de broker en la nube?
- Cómo determinar qué permisos de AWS / EC2 son necesarios para un proceso / script
- ¿Qué está familiarizado con los términos comunes que se utilizan principalmente en la computación en la nube?
- ¿Cuáles son las principales diferencias entre Google Compute Engine y Amazon Web Services?
Suponiendo que la contención es para el almacenamiento en disco, pero el conjunto de trabajo es constante o constante o podría mantenerlo dentro de los límites, ¿ha considerado instancias respaldadas por EBS con Elastic Storage?
Suponiendo que la contención es para el rendimiento, ¿cómo escalaría cuando la instancia más grande se vuelva pequeña cuando aumenten sus cargas de trabajo? Como se sugiere en una de las respuestas a continuación, escalar en lugar de escalar, usar una solución basada en escalar, puede estar usando una base de datos sin SQL, escalar el cálculo si es necesario usando algo como Dynamo DB o cualquier otro No SQL DB (estoy sesgado hacia Dynamo DB personalmente debido a un paradigma completamente administrado que proporciona).
Esta podría ser la recomendación más arriesgada si no se realiza correctamente, si sus aplicaciones han incorporado supuestos sobre las características del nodo único, por ejemplo, tiene una base de datos relacional que le ofrece uniones complicadas y procesamiento de datos en el nodo único, si no diseña si su carga de trabajo es adecuada para escalar, podría obstaculizar su experiencia de aplicación con una base de datos difícil de administrar que no rinde si sigue adelante con una elección incorrecta.
Esto no debe socavarse, pero si ha revisado su aplicación para rediseñarla de una manera más eficiente, esto no mitigaría la necesidad inmediata de escalar sino ayudarlo a construir una aplicación sólida que reduzca su rampa en el uso de recursos.