Cada capa RBM en sí misma es un modelo gráfico no dirigido, pero apilarlas y entrenarlas de una manera particular puede cambiar si el modelo gráfico completo debe ser dirigido o no dirigido. En el caso de la red de creencias profundas, donde apilamos RBM y los entrenamos en capas comenzando en la capa base y subiendo, este es un modelo dirigido porque no hay retroalimentación de las capas superiores a las capas inferiores (bueno, la capa superior RBM no está dirigido, pero eso es todo). Por otro lado, una máquina de Boltzmann profunda es un gráfico completamente no dirigido, por lo que hay retroalimentación de capas superiores a capas inferiores en cada etapa del entrenamiento.
Esto hace que un método de muestreo directo sea más difícil. Si entrenamos usando divergencia contrastante, por ejemplo, tendríamos que modificarlo para actualizar los pesos de cada capa en cada paso de Gibbs. Parte de la razón por la que la divergencia contrastante incluso funciona es porque es de un modelo que no es muy complicado (en términos de topología gráfica), e incluso con gráficos bipartitos extremadamente simples como los RBM, su rendimiento se deteriora durante el entrenamiento. Esta es probablemente la razón por la que no usaría la divergencia contrastante para entrenar una máquina de Boltzmann profunda directamente. Existen métodos alternativos, pero el punto principal es que el muestreo se vuelve más difícil si incluye una estructura adicional en las capas ocultas. Esos métodos son más complicados, pero al final deberían proporcionar un mejor modelo.
- ¿Qué aplicaciones iOS usan TensorFlow del lado del cliente?
- ¿Cuál es el mejor foro de red neuronal en Internet?
- Además de tratar de reconstruir la entrada (como en Autoencoder), ¿qué otras tareas podrían resultar útiles para el aprendizaje no supervisado de redes profundas?
- ¿Cómo puede un estudiante graduado de primer año en ciencias de la computación encontrar un trabajo en minería y análisis de datos después de graduarse?
- ¿Qué arquitectura / herramientas usan los gigantes tecnológicos como Facebook / Amazon / Apple / Microsoft para el análisis de big data / ML?