Probablemente sea demasiado temprano para llamar ya que ha estado en arxiv por menos de tres meses. Además, solo he leído el resumen. Sin embargo, supongo que no es especialmente significativo, principalmente porque el resumen afirma mejores resultados en un solo conjunto de datos, y ese conjunto de datos, CIFAR-100, no es tan popular y competitivo como CIFAR-10 o ImageNet. Pero para ser justos, no debe juzgar este documento hasta que lo haya leído usted mismo o haya escuchado a alguien que lo haya leído; Solo estoy deduciendo del resumen que no es un avance importante.
Un artículo relacionado que creo que es más significativo es este: [1603.09382] Redes profundas con profundidad estocástica
El documento de profundidad estocástico tiene un significado más amplio porque muestra que los modelos profundos que no caen bajo el paradigma de “redes neuronales profundas aprenden una representación diferente en cada capa” pueden funcionar realmente bien. Esto proporciona mucha evidencia a favor del paradigma de “las redes neuronales profundas aprenden un programa de múltiples pasos”. Anteriormente, las personas eran conscientes de ambas interpretaciones. La mayoría de los modelos de aprendizaje profundo podrían describirse por ambos paradigmas igualmente bien, pero creo que la interpretación del aprendizaje de representación fue más popular (teniendo en cuenta que una de las principales conferencias de aprendizaje profundo se llama Conferencia Internacional sobre Representaciones de Aprendizaje). El documento de profundidad estocástico muestra que puede tener una representación única que se actualiza mediante muchos pasos de un programa y que funciona realmente bien. También muestra que solo es útil dejar que este programa se ejecute más tiempo, incluso si no fue entrenado para ejecutarse durante tanto tiempo. Esto sugiere que la interpretación del programa de varios pasos relativamente descuidada puede haber sido la más importante todo el tiempo.
- ¿Cómo se compara Scikit Learn con R (en términos de velocidad, conveniencia y potencia)?
- ¿A qué tipo de problemas del mundo real se aplica el aprendizaje no supervisado?
- ¿Cómo se reduce el tamaño de una red neuronal profunda sin gastar grandes recursos para reentrenarla?
- Cómo construir un sistema de recomendación de itinerario basado en las preferencias del usuario
- ¿Puedo usar word2vec para entrenar un clasificador de aprendizaje automático?