¿Cómo podemos hacer que las redes profundas funcionen de manera eficiente en dispositivos de baja potencia (por ejemplo, teléfonos)?

Comencemos con la inferencia, por ejemplo, reconocimiento de imagen o detección de objetos. Muchos de los marcos actuales se han escrito para capacitación, por lo que hay varias formas de mejorar su eficiencia mediante la creación de una versión optimizada para la inferencia. Por ejemplo, cuando el convnet está entrenado, debe mantener la salida de cada capa en paso hacia adelante para propagación hacia atrás. Por inferencia, no necesitamos esto, por lo que podemos sobrescribir las salidas de capas anteriores y reutilizar buffers, y reducir significativamente la huella de memoria. También podemos fusionar muchas capas (por ejemplo, capa convolucional, agrupación y relu) para mejorar la latencia y reducir el ancho de banda a DRAM. A continuación, podemos usar matemática de baja precisión para la inferencia, por ejemplo, medio flotador (como en Nvidia GPU Inference Engine) o súper corto int (8 bits), pero esto puede ser un poco más complicado ya que su red debería reescalar dinámicamente las salidas a manténgalos en un rango numérico muy estrecho.

También puede comprimir la red durante el entrenamiento (por ejemplo, Han, … Comprimiendo redes neuronales profundas e Iandola, … Squeezenet) o binarizar sus pesos (por ejemplo, en Rastegari, … XNOR-Nets).

Si su aplicación móvil necesita el paso hacia atrás (p. Ej., Transformación de fotos en cuadros como arte profundo), entonces todavía puede usar algunos de estos trucos (matemática de baja precisión, compresión, …)

Por cierto, hay una serie de marcos que ya se han portado para Android e iOS: por ejemplo MXnet – dmlc / mxnet, Tensorflow – tensorflow / tensorflow, Torch soumith / torch-android, etc.)

Related Content

¿Qué es el modelo log-lineal latente con variables latentes y cómo se entrena tal modelo?

Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?

¿Qué tan bueno debería ser uno en Python para aprender Data Science?

¿Cuáles son las mejores empresas de minería de datos?

¿Cuál es el mejor clasificador HOG de detección de peatones para descargar?

¿Cuál es el mejor lenguaje de programación para el aprendizaje automático? ¿Qué idioma es mejor para programar microcontroladores y otras partes de hardware?

¿Cuáles son los beneficios de una inteligencia más baja?

Estoy de acuerdo con la respuesta del profesor Bengio. Implica el rediseño de algoritmos adecuados para hardware basado en perfil de baja potencia. Por ejemplo, redes neuronales convolucionales | Data Center Performance es una de esas startups que intenta construir una biblioteca optimizada para crear algoritmos de aprendizaje profundo en el FPGA y otros dispositivos integrados.

Zeeshan Zia

Cree hardware especializado y diseñe algoritmos de aprendizaje para ese propósito. En mi laboratorio estamos trabajando en redes neuronales que se pueden implementar sin multiplicación y con muy baja resolución. Eso reduciría considerablemente el consumo de energía.

Zeeshan Zia

More Interesting

¿Es la informática de alto rendimiento un conocimiento esencial para el aprendizaje profundo dado que se trata de una gran red neuronal?

¿Cómo se utiliza el aprendizaje automático en el análisis de sentimientos?

¿Cuál es el mejor sitio web de aprendizaje automático?

Cómo configurar un laboratorio de innovación de ciencia de datos

¿Hay algún kit de herramientas LSTM disponible en MATLAB?

¿Puede el aprendizaje automático ayudarnos a comprender el cerebro humano?

¿Cuáles son algunos marcos de aprendizaje profundo con solo CPU?

¿Cómo se aplica el aprendizaje profundo en la industria?

En Batch Normalization, ¿por qué se deben actualizar moving_mean y moving_variance?

¿Qué debo hacer para pasar de la bioinvestigación al aprendizaje automático de manera muy eficiente?

¿Cómo evalúa el rendimiento de un algoritmo de aprendizaje no supervisado?

¿Cómo se pueden adaptar los sistemas de recomendación para recomendar elementos que atraigan a todos en un grupo, en lugar de a un solo individuo?

¿Qué algoritmos / tecnologías se usaron para hacer Siri?

En términos simples, ¿cómo funciona Gibbs Sampling?

¿Es cierto que las predicciones en el espacio de alta dimensión son más difíciles en torno al origen?

Web Analytics