Si quiero comenzar con el aprendizaje profundo, ¿debería comprar una GPU de gama baja o aprovechar una solución en la nube? ¿Cuál es más barato / mejor?

Una GPU externa tiene como objetivo acelerar el proceso del aprendizaje profundo. Para comenzar el aprendizaje profundo, creo que hacer cualquiera de ellos no es necesario. Entonces, esto depende de “cómo” planeas comenzar con el aprendizaje profundo en términos de su aplicación y el tipo de configuración de la red neuronal profunda utilizada.

  1. Si tuviera que comenzar con conjuntos de funciones pequeños, entonces quizás no sea realmente necesario comprar una GPU externa debido al tiempo de entrenamiento rápido (tenga en cuenta que las CPU en la actualidad también tienen un chip gráfico integrado o GPU integrada) para realizar un aprendizaje profundo y puede realizar localmente sin siquiera requerir / usar una solución en la nube (aún puede usarlos si hay otras razones, como Heroku y AWS y su nivel gratuito debería ser suficiente). Sin embargo, si es lo contrario (se requieren grandes conjuntos de características y una gran potencia de cálculo), dependerá aún más de la duración del tiempo de entrenamiento. El servicio de servicio en la nube generalmente cobra una tarifa por unidad de tiempo procesada con un límite impuesto, mientras que la compra de una GPU es una tarifa única siempre que no se rompa pronto, y la GPU de gama baja hoy en día no es tan costosa, y capaz de ofrecer una potencia computacional decente en comparación con el costo que cobra el servicio promedio en la nube. Si aún decidiera optar por el servicio en la nube, aquí hay una publicación que podría ayudarlo a elegir entre diferentes proveedores de nube: ¿Cuál es la mejor solución en la nube para el aprendizaje profundo?
  2. Hay muchos tipos de configuración de redes neuronales que se conocen, cada uno con su propia idoneidad en términos de aplicación. Aquí se enumeran algunos ejemplos comunes:
    https://en.wikipedia.org/wiki/De…
    Junto con el punto 1 anterior, una buena opción de configuración de redes podría generar un tiempo de entrenamiento más rápido que la compra de GPU externa no ofrece una diferencia de tiempo significativa en el entrenamiento.

Principalmente depende de la escala de los conjuntos de datos que ejecuta su planificación.

Siempre y cuando solo estés aprendiendo y haciendo cosas básicas de baja escala, AWS. Si realmente llega a la fase que desea ejecutar en grandes conjuntos de datos con numerosas características, compre una GPU.

La capacitación en servicios en la nube es realmente costosa, puede llegar al punto en que una capacitación individual costará como una GPU de segunda mano (NVIDIA Titan X, por ejemplo).

Solo piense en lo que desea maximizar en rendimiento / presupuesto.

La mejor conclusión que encontré fue de un artículo de Tim Dettmers: Cuál es la mejor GPU para el aprendizaje profundo, del cual propuso que es más rentable construir una plataforma que usar la nube.

La versión TL; DR: –

Mejor GPU en general : Titan X Pascal
Rentable pero costoso : GTX 1080, GTX 1070
Rentable y económico: GTX 1060