¿En qué casos tengo que usar un entorno distribuido y en qué casos no?

Mi experiencia ha sido en gran medida con modelos que tratan con texto, por lo que puede que no se aplique a los modelos que toman imágenes / video como entrada ( aunque a menudo se cita a Yann Le Cun usando su computadora portátil para hacer una demostración de un convnet en acción Yann LeCun – The nuevo portátil Gigabyte P35w v2 se ve … )

  • En el caso de los modelos de aprendizaje basados ​​en texto, puede ser mejor comenzar con una sola máquina: múltiples núcleos, con suficiente memoria y espacio en disco necesarios para probar primero un modelo, aunque solo sea con un pequeño subconjunto de datos.
  • Esto puede ser fácil ya que nos ayuda a iterar rápidamente en diferentes modelos y ajustar hiperparámetros, etc.
  • Luego, para la capacitación / prueba a gran escala, uno podría optar por una implementación distribuida del modelo.
  • Este enfoque ha funcionado para el texto; quizás alguien que ha trabajado en imágenes / video puede tener un enfoque diferente. En el caso del texto, es posible ejecutar el tren y probar en una máquina con suficientes núcleos (<= 40), memoria (256 GB) y espacio en disco (TB) para 1–2 TB de datos para algunos modelos (las RNN requieren GPU) ) Dicha máquina no cuesta un brazo y una pierna en algunos sitios de alojamiento ( por ejemplo, Hetzne r)

More Interesting

¿El aprendizaje por refuerzo es meta-aprendizaje?

¿Qué deben saber todos los ingenieros de software sobre el aprendizaje automático?

Cómo agregar una razón de probabilidad para una característica en mi conjunto de datos

El límite de decisión de los árboles de decisión es el eje paralelo. Random Forests es un conjunto de árboles. ¿Cuál es el límite de decisión de los bosques aleatorios?

¿Tiene sentido emplear Bayes ingenuos multinomiales con n-gramos? Pregunto porque supone que cada posición está ocupada por un término, por lo que los n-gramos no parecen encajar naturalmente en el modelo.

¿Cuál es la mejor clase de Machine Learning en Penn?

¿Por qué la similitud entre palabras generalmente se calcula a través del coseno métrico, no euclidiano?

Como estudiante que realiza un curso de algoritmos de aprendizaje automático, ¿en qué debe centrarse el objetivo principal para maximizar el conocimiento aplicable al final del semestre?

¿Qué es el generador Deep Dream?

¿Cómo se puede aplicar el aprendizaje profundo a los sistemas de recomendación en el mercado de valores?

¿Cómo puede ser útil el aprendizaje automático para el diseño de juegos?

Cómo extraer términos importantes de datos de texto no estructurados

¿Cómo se pueden adaptar los sistemas de recomendación para recomendar elementos que atraigan a todos en un grupo, en lugar de a un solo individuo?

¿Cuán relevantes son las redes neuronales atractoras en la investigación actual del aprendizaje automático?

Yoshua Bengio: ¿cuáles son las preguntas abiertas más importantes en el aprendizaje profundo?