Mi experiencia ha sido en gran medida con modelos que tratan con texto, por lo que puede que no se aplique a los modelos que toman imágenes / video como entrada ( aunque a menudo se cita a Yann Le Cun usando su computadora portátil para hacer una demostración de un convnet en acción Yann LeCun – The nuevo portátil Gigabyte P35w v2 se ve … )
- En el caso de los modelos de aprendizaje basados en texto, puede ser mejor comenzar con una sola máquina: múltiples núcleos, con suficiente memoria y espacio en disco necesarios para probar primero un modelo, aunque solo sea con un pequeño subconjunto de datos.
- Esto puede ser fácil ya que nos ayuda a iterar rápidamente en diferentes modelos y ajustar hiperparámetros, etc.
- Luego, para la capacitación / prueba a gran escala, uno podría optar por una implementación distribuida del modelo.
- Este enfoque ha funcionado para el texto; quizás alguien que ha trabajado en imágenes / video puede tener un enfoque diferente. En el caso del texto, es posible ejecutar el tren y probar en una máquina con suficientes núcleos (<= 40), memoria (256 GB) y espacio en disco (TB) para 1–2 TB de datos para algunos modelos (las RNN requieren GPU) ) Dicha máquina no cuesta un brazo y una pierna en algunos sitios de alojamiento ( por ejemplo, Hetzne r)