Si quiero comenzar con el aprendizaje profundo, ¿debería comprar una GPU de gama baja o aprovechar una solución en la nube? ¿Cuál es más barato / mejor?

Una GPU externa tiene como objetivo acelerar el proceso del aprendizaje profundo. Para comenzar el aprendizaje profundo, creo que hacer cualquiera de ellos no es necesario. Entonces, esto depende de “cómo” planeas comenzar con el aprendizaje profundo en términos de su aplicación y el tipo de configuración de la red neuronal profunda utilizada.

Si tuviera que comenzar con conjuntos de funciones pequeños, entonces quizás no sea realmente necesario comprar una GPU externa debido al tiempo de entrenamiento rápido (tenga en cuenta que las CPU en la actualidad también tienen un chip gráfico integrado o GPU integrada) para realizar un aprendizaje profundo y puede realizar localmente sin siquiera requerir / usar una solución en la nube (aún puede usarlos si hay otras razones, como Heroku y AWS y su nivel gratuito debería ser suficiente). Sin embargo, si es lo contrario (se requieren grandes conjuntos de características y una gran potencia de cálculo), dependerá aún más de la duración del tiempo de entrenamiento. El servicio de servicio en la nube generalmente cobra una tarifa por unidad de tiempo procesada con un límite impuesto, mientras que la compra de una GPU es una tarifa única siempre que no se rompa pronto, y la GPU de gama baja hoy en día no es tan costosa, y capaz de ofrecer una potencia computacional decente en comparación con el costo que cobra el servicio promedio en la nube. Si aún decidiera optar por el servicio en la nube, aquí hay una publicación que podría ayudarlo a elegir entre diferentes proveedores de nube: ¿Cuál es la mejor solución en la nube para el aprendizaje profundo?
Hay muchos tipos de configuración de redes neuronales que se conocen, cada uno con su propia idoneidad en términos de aplicación. Aquí se enumeran algunos ejemplos comunes:
https://en.wikipedia.org/wiki/De…
Junto con el punto 1 anterior, una buena opción de configuración de redes podría generar un tiempo de entrenamiento más rápido que la compra de GPU externa no ofrece una diferencia de tiempo significativa en el entrenamiento.

Aprendizaje automáticoAprendizaje profundoPregunta personalUnidad de procesamiento de gráficos

Related Content

¿Qué habilidades de programación / habilidades informáticas debo aprender si quiero especializarme en visión por computadora y aprendizaje automático?

¿Cuáles son algunos buenos documentos con ejemplos del mundo real del aprendizaje de refuerzo inverso (IRL)?

¿Cuáles son los poderes de clasificación sobre la agrupación? ¿Por qué elegiría una clasificación?

¿Cómo debo aprender el aprendizaje automático? ¿Puede proporcionar una hoja de ruta específica desde un principiante hasta un experto?

¿Son todos los problemas de programación cuadrática convexos?

¿Puedo incluir el aprendizaje automático en mi currículum después de aprender scikit-learn?

¿Puede funcionar una economía futura en la que las personas sean propietarias de la fuerza laboral robótica / IA y la alquilen a las grandes corporaciones? Ya sea individualmente o en grupos.

Principalmente depende de la escala de los conjuntos de datos que ejecuta su planificación.

Siempre y cuando solo estés aprendiendo y haciendo cosas básicas de baja escala, AWS. Si realmente llega a la fase que desea ejecutar en grandes conjuntos de datos con numerosas características, compre una GPU.

La capacitación en servicios en la nube es realmente costosa, puede llegar al punto en que una capacitación individual costará como una GPU de segunda mano (NVIDIA Titan X, por ejemplo).

Solo piense en lo que desea maximizar en rendimiento / presupuesto.

Hafidz Zulkifli

La mejor conclusión que encontré fue de un artículo de Tim Dettmers: Cuál es la mejor GPU para el aprendizaje profundo, del cual propuso que es más rentable construir una plataforma que usar la nube.

La versión TL; DR: –

Mejor GPU en general : Titan X Pascal
Rentable pero costoso : GTX 1080, GTX 1070
Rentable y económico: GTX 1060

Hafidz Zulkifli

More Interesting

¿Cuáles son las aplicaciones de los gráficos dispersos?

Cómo lidiar con una variable independiente categórica que tiene más de 500 variables en un problema de clasificación

¿Cuál es el mejor código comercial de reconocimiento facial?

Al entrenar a un clasificador, ¿cómo trato con clases que tienen números muy diferentes de muestras en el conjunto de entrenamiento? ¿Cómo evito un ajuste excesivo en la clase que tiene la mayor cantidad de muestras?

Cómo explicar las diferencias entre IBM Watson y Google DeepMind a personas no técnicas

¿Qué tan difícil es aprender TensorFlow?

¿Cuál es la mejor estimación para la existencia de una máquina del tiempo?

¿La retropropagación de red neuronal de convolución utiliza un algoritmo en línea o un algoritmo por lotes?

¿Qué es mejor en CMU: 10-601 o 10-701?

¿Cómo son los cursos en edX sobre aprendizaje automático, ingeniería artificial y robótica para el empleo?

¿Qué es la agrupación promedio global?

¿Cómo usa la NASA el aprendizaje automático?

¿Qué problemas o conjuntos de datos existen cuando usar el impulso da mejores resultados que usar un SGD simple?

¿Cuáles son los casos de uso de aprendizaje profundo en CRM?

¿La normalización de lotes hará la diferencia al entrenar con tamaño de lote = 1?

Web Analytics