¿Qué opinas de la biblioteca de aprendizaje profundo de código abierto de Amazon ‘DSSTNE’ (pronunciado Destiny)?

A diferencia de otros marcos de Deep Learning, el DSSTNE de Amazon parece haber sido desarrollado para el caso de uso de la creación de recomendaciones. Caffe está sintonizado hacia el procesamiento de imágenes a través de Convolution Networks. Kaldi está sintonizado para el reconocimiento de voz. Antorcha, TensorFlow y CNTK tienen un propósito más general en el soporte para redes totalmente conectadas, CNN y diversos grados de soporte para RNN. Sin embargo, DSSTNE parece admitir solo redes completamente conectadas. Otra desviación de otros marcos es que DSSTNE usa archivos de configuración (como Caffe) en lugar de código para componer un NN.

La afirmación de Amazon es que DSSTNE está sintonizado para soportar redes mucho más grandes a través de su soporte de conjuntos de datos dispersos y capacitación paralela modelo. Utiliza GPU basadas en CUDA y ha ajustado los núcleos para admitir el escaso cálculo. Emplea OpenMPI por sus capacidades de cálculo distribuido. La afirmación es que su marco es 2.1 veces más rápido en comparación con una implementación de Tensorflow. Sin embargo, la afirmación más interesante es que los núcleos de GPU dispersos permiten que se calculen matrices mucho más grandes en una GPU en comparación con otros marcos no dispersos.

En conclusión, DSSTNE es probablemente un buen marco para usar para construir grandes NN para recomendaciones, sin embargo, está lejos de ser un marco DL de propósito general.

Related Content

Ciencias de la computación: ¿Cuáles son los pros y los contras de utilizar el modelado de procesos gaussianos para la regresión?

¿Cuál es la principal diferencia entre la forma bayesiana de estimación de parámetros y la regresión lineal?

¿Cuál es la relevancia de la factorización matricial en el aprendizaje profundo?

¿Cuál crees que es la razón detrás de la asociación de Microsoft y Amazon en la tecnología de red neuronal llamada 'Gluon'?

¿Cuál es el papel de la Inteligencia Artificial en las redes sociales?

¿Cuál es la diferencia entre retroiluminación LED, HD TN GL Slim y WLED TN Glare Slim?

¿Cuáles son algunas aplicaciones de muestreo de importancia en Deep Learning?

More Interesting

¿Cuál es un buen sitio de contestación de preguntas sobre IA y aprendizaje automático aparte de Quora? Los relacionados con Stack Exchange son bastante malos. Las personas están más centradas en los puntos y formatos en lugar de dar una respuesta adecuada.

¿Hay algún ejemplo de código de agrupación de documentos utilizando PCA o Autoencoder o algún otro algoritmo de agrupación?

¿Qué es la agrupación?

Cómo pasar del desarrollo de pila completa al aprendizaje automático en el trabajo independiente

¿Se ha resuelto el problema de reconocimiento de caracteres escritos a mano?

¿Podría el Monte Carlo híbrido ser una forma efectiva de realizar búsquedas de hiperparámetros en Deep Learning?

¿Qué significan las redes bayesianas en Machine Learning?

Después de las estructuras de datos y algoritmos (DSA), ¿qué debo aprender (ML, AI, ciencia de datos)? ¿O debería comenzar a hacer algunos proyectos sobre cosas que ya he aprendido?

¿Los científicos de datos y el ingeniero de aprendizaje automático necesitan saber implementar algoritmos ML / DL desde cero o simplemente usar las bibliotecas existentes en producción?

¿Cuál es la definición de 'conjunto de desarrollo' en el aprendizaje automático?

En los algoritmos de aprendizaje automático, ¿por qué la función sigmoidea se usa principalmente y no funciones como tanh (x)? En tanhx por ej. parece dividir el eje y de manera uniforme y aplanarse rápidamente a medida que x se aproxima a +/- infinito. El rango es: sigmoide [0-1] y tanh (x) [-1,1].

¿Cuál es la mejor extracción de características de un conjunto de datos de imágenes?

¿Qué son las redes neuronales convolucionales?

¿Cómo puedo hacer que mi computadora esté disponible para Google, Quora, Facebook, para poder contribuir a sus tareas de aprendizaje automático durante el tiempo de inactividad?

¿Cómo puedo explicar que las unidades tradicionales de red neuronal recurrente (RNN) sufren el problema del gradiente de fuga?

Web Analytics