¿Cuál es el mejor marco de aprendizaje profundo para Apache Spark?

Deeplearning4j puede ser el mejor marco de aprendizaje profundo para Spark, ya que se basa en un lenguaje JVM, como el propio Spark, para integraciones y fue construido con la computación distribuida en mente. Deeplearning4j tiene varios módulos Scala.

Los marcos como Deeplearning4j usan Spark como una capa de acceso a datos para orquestar múltiples subprocesos de host, mientras confían en otras bibliotecas para realizar las operaciones de matriz grande. Bibliotecas como ND4S o matrices n-dimensionales para Scala:

deeplearning4j / nd4s

El proyecto DL4J también incluye un contenedor Scala inspirado en las API de Keras y Torch:

deeplearning4j / ScalNet

DL4J usa Spark para ETL rápido, no computación. Se integra con Spark y hace que se ejecute en múltiples GPU o CPU. Para tareas de procesamiento de imágenes no triviales, el rendimiento es igual a Caffe, con la ventaja adicional de que DL4J es una biblioteca de aprendizaje profundo de propósito general, construida de manera modular. Es decir, con DL4J, puede procesar series de tiempo, texto o sonido, así como imágenes. Aquí hay un par de enlaces sobre cómo DL4J hace que Spark funcione y cómo funciona con GPU distribuidas:

Deeplearning4j en Spark

Deeplearning4j con GPU

DL4J es la única biblioteca de DL certificada en Spark (a través de CDH) que viene con soporte comercial. (Divulgación: soy colaborador del proyecto). También es la única biblioteca DL escrita para la JVM. El resto está enfocado en Python.

Related Content

¿Qué es el modelo log-lineal latente con variables latentes y cómo se entrena tal modelo?

¿Por qué decimos que las redes neuronales simples no pueden manejar la entrada de longitud variable?

¿Cuáles son los componentes básicos del reconocimiento de voz desde el punto de vista DSP?

¿Podría la red neuronal de convolución completa aprender a discriminar entre clases si no hay muestreo descendente y la entrada es igual a salida?

¿Cuáles son las áreas más activas de investigación de aprendizaje automático para la aplicación de datos tabulares? Mis datos están en forma de CSV con unos pocos miles de instancias.

¿Qué es más beneficioso para la comprensión general de la informática, el procesamiento del lenguaje natural o la teoría de la computación?

¿Por qué se utiliza un descenso gradiente iterativo para redes neuronales y no inmediato?

More Interesting

¿Cuál es la definición de un 'prior bayesiano'?

Cómo encontrar el contexto de una conversación usando técnicas de aprendizaje automático / aprendizaje profundo / PNL

¿La retropropagación de red neuronal de convolución utiliza un algoritmo en línea o un algoritmo por lotes?

¿Cómo y qué tipo de datos ha recopilado por su cuenta para el proyecto / servicio ML?

¿Qué técnicas de aprendizaje automático debo usar para estratificar y spofing?

Intuitivamente, ¿cómo afecta el tamaño del mini lote al rendimiento del descenso de gradiente (estocástico)?

Cómo discriminar una señal del ruido en la última investigación y desarrollo de AI / ML

He completado el curso para el aprendizaje automático. Quiero hacer un proyecto corto sobre aprendizaje automático. Actualmente estoy haciendo BE en CS. ¿Qué materia debo elegir?

¿Cuáles son algunas aplicaciones interesantes de aprendizaje profundo en FinTech?

¿Puede un ML / AI aprender a pasar captchas?

¿Cuáles son los mejores laboratorios de investigación en el campo de los UAV combinados con aprendizaje automático, visión y percepción por computadora?

¿Cuál es el significado real de los pesos en la red neuronal?

¿Qué conocimientos de matemática / estadística y CS debo dominar (no matemático / stat / CS, pero graduado en ingeniería) para carrera / investigación en aprendizaje automático?

¿Cuál es la intuición para usar tocones de decisión en el aprendizaje automático?

¿Cuáles son los temas candentes en el aprendizaje automático y la lógica difusa juntos?

Web Analytics