¿Ha habido algún éxito con el aprendizaje profundo bayesiano?

Si y no.

En la academia, diría que el aprendizaje profundo despegó con algunos investigadores que primero intentaron interpretar y desarrollar la teoría desde una perspectiva bayesiana, es decir, el trabajo de Geoffrey Hinton, Radford Neal, Ruslan Salakhudinov y otros que se derivaron de bayes variacionales en el algoritmo de vigilia-sueño. para redes neuronales estocásticas. El trabajo adicional basado en la capacitación de la máquina restringida de Boltzmann también incluyó el uso de la cadena de markov monte carlo para estimar parámetros a pesar de derivar el MLE del producto de expertos. Todo esto se hizo para acelerar el entrenamiento de las redes neuronales y también con la esperanza de mejorar la propiedad de convergencia de alguna manera. Esto fue antes de que el aprendizaje profundo se hiciera popular en la industria.

Estas teorías ayudaron a los investigadores a comprender un poco más sobre las redes neuronales y eso contribuye a por qué se está convirtiendo en la parte superior de la tendencia ahora. Al principio, las máquinas de Boltzmann restringidas se usaban para entrenar previamente los parámetros de la red neuronal antes de realizar un ajuste fino con retropropagación.

Sin embargo, en la industria, Bayesian nunca ha despegado, además del análisis a pequeña escala, principalmente debido a las limitaciones de tiempo de cálculo, lo que hace que muchos métodos bayesianos sean poco prácticos.

A medida que la tecnología de hardware (GPU) se volvió lo suficientemente eficiente como para realizar la propagación hacia atrás de manera bruta, y el hecho de que la propagación hacia atrás con MLE es mucho más fácil de entender e implementar y, de hecho, no necesariamente ofrece una precisión peor que hacer un preentrenamiento de la red Con la máquina de Boltzmann restringida en casos prácticos, el aprendizaje profundo bayesiano ha desaparecido de la imagen por un tiempo.

Creo que debería haber más investigaciones en el área bayesiana, pero en este momento no es práctico para muchas aplicaciones e investigaciones.

Tal vez debería echar un vistazo al documento Deep Learning: A Bayesian Perspective, que es de 2017 para obtener una perspectiva actualizada sobre el tema.