¿Cuál es la diferencia entre Deep Autoencoders y Deep Belief Networks?

Hmm en este momento, ya no creo que sea apropiado (si alguna vez lo fue) describir los autoencoders profundos de esa manera. La gente suele pensar en los autoencoders profundos como un superconjunto de redes de creencias profundas (DBN). Creo que la fuente de la confusión aquí es que en 2006, Hinton et al. publicó un artículo muy influyente sobre un algoritmo de aprendizaje rápido para máquinas de Boltzmann restringidas (también conocidas como redes de creencias profundas). Básicamente, este fue uno de los primeros pasos para poder entrenar efectivamente redes neuronales profundas. Configuraría un DBN, realizaría un pre-entrenamiento sin supervisión para obtener un conjunto decente de representaciones de características para las entradas, y luego ajustaría el conjunto de entrenamiento para obtener predicciones de la red. Lo mismo ocurrió con los modelos de autoencoder. Si desea entrenar un autoencoder profundo, debe configurarlo como un DBN y aplicar el mismo algoritmo de pre-entrenamiento no supervisado. Esto fue durante el tiempo antes de que el entrenamiento con GPU en grandes conjuntos de datos fuera popular, por lo que entrenar una red profunda sin preentrenamiento tendía a ser extremadamente lento.

Obviamente, hoy en día, ya no necesitamos formular autoencoders profundos en términos de RBM para poder capacitarlos de manera efectiva. Podemos usar topologías de red más generales para el codificador / decodificador, como las basadas en un CNN o un RNN (eche un vistazo a seq2seq) para entrenar un autoencoder profundo. De modo que la definición de codificadores automáticos profundos está desactualizada, aunque los principios subyacentes para los codificadores automáticos profundos / DBN aún se mantienen.

Related Content

¿Cuándo harán las máquinas la física y volverán a aprender las características de los datos de observación y luego reemplazarán aquellas como masa, giro, color o carga?

Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST

¿Qué se sabe sobre la eficiencia de la agrupación espectral en caso de que los datos no estén completamente conectados?

¿Por qué la inteligencia artificial se vuelve agresiva?

¿Cuál es el libro recomendado sobre 'plasticidad neuronal' para informáticos, programadores o profesionales de aprendizaje profundo?

¿Qué debo hacer si alguien conoce la ip externa e interna de mi teléfono Android?

¿Son los Sith inherentemente malvados?

More Interesting

¿Existe algún conjunto de datos disponible públicamente para la clasificación étnica / nacionalidad de los nombres humanos?

Cómo ingresar a un programa de doctorado en la mejor escuela de EE. UU. En inteligencia artificial, visión artificial y aprendizaje automático

¿Qué es la precisión en el aprendizaje automático?

¿Los bosques aleatorios son solo un tipo de Monte Carlo?

¿Cuáles son las mejores herramientas de última generación para la extracción de información en Python?

¿Por qué mi modelo de regresión produce valores negativos para SalePrice en los datos de prueba?

¿Cuál es su enfoque para el diseño de redes neuronales convolucionales?

Si pudieras elegir cinco miembros perfectos para un equipo de desarrollo de aprendizaje automático y en la nube, ¿qué habilidades requerirías que tuvieran?

¿Es una idea loca aprender el aprendizaje automático y el aprendizaje profundo sin ningún conocimiento avanzado de matemáticas?

Cómo construir y trazar una gráfica de vecinos más cercanos

¿Cuál es la mejor manera de encontrar el conjunto de patrones similares en datos de series de tiempo?

¿Qué significa extraer características de alguna capa de una red neuronal convolucional?

¿El gradiente sintético eliminará la propagación hacia atrás?

¿Dónde funcionará bien el aprendizaje automático como servicio? ¿Dónde no lo hará?

En un juego de billar, ¿puede el mejor robot (diseñado específicamente para esta tarea) derrotar al campeón mundial humano?

Web Analytics