¿Cuáles son todos los trabajos de investigación que han estudiado la superficie de pérdida de las redes neuronales?

Algunos trabajos recientes incluyen:

http://arxiv.org/pdf/1412.6544v4…

http://www.jmlr.org/proceedings/…

Al construir una red neuronal artificial para un simulador de caminata, ¿cuál es el número óptimo de variables de entrada?
¿Es la pirámide de Maslow la clave para hacer una IA 'consciente'?
¿Cómo podemos usar Machine Learning para escribir software?
¿Por qué Google publica un tutorial y el código sobre cómo construir su propio sistema de traducción automática neuronal en su blog de investigación en GitHub?
Si las células 'tontas' individuales independientes pueden agruparse para desarrollar la conciencia y la vida inteligente (es decir, nosotros), ¿por qué los grupos de hormigas ya inteligentes (que ya exhiben un comportamiento grupal inteligente) se convierten en un 'enjambre' inteligente con conciencia cuya inteligencia enana incluso el nuestro?

https://arxiv.org/pdf/1605.07110…

Este es en realidad un tema muy antiguo que surgió en el estudio de la física estadística de los vidrios giratorios, y muchos de los resultados clave en el documento de LeCun se sospechan y / o entienden desde hace algún tiempo. Ver :

http://www.uni-saarland.de/fak7/…

No estoy convencido de que estos estudios sean tan significativos para el aprendizaje profundo, ya que los anteojos giratorios son altamente aleatorios y estudiados en el caso de campo medio, y el aprendizaje profundo es muy no aleatorio y probablemente está fuertemente correlacionado.

Para una perspectiva diferente, ver:

https: //ganguli-gang.stanford.ed…

y documentos relacionados del laboratorio de Surya Ganguli

¿Qué diferencias de IA deberíamos esperar con las consolas de próxima generación?

¿La humanidad será robótica?

¿Quora intenta convertirse en un motor de conocimiento de inteligencia artificial como la próxima evolución de un motor de búsqueda?

¿Cuáles son los beneficios de usar un Chatbot?

¿Cuánto tiempo hasta que la población general comience a utilizar Bot Suits?

¿Por qué las imágenes se consideran datos no estructurados cuando se pueden almacenar en bases de datos?

Recomendaría mirar las diapositivas de los tutoriales sobre “Matemáticas del aprendizaje profundo” organizadas en ICCV’15 y CVPR’16. Algunos de los oradores dieron una descripción decente de la literatura que está buscando.

El tutorial en ICCV’15:

JHU Computer Vision Machine Learning

En CVPR’16:

http://www.vision.jhu.edu/tutori …

Zeeshan Zia

Se puede encontrar una descripción general en nuestro trabajo reciente y las referencias en él:

CNN profundos: [1710.10928] La superficie de pérdida y la expresividad de las redes neuronales convolucionales profundas

Redes profundas completamente conectadas: [1704.08045] La superficie de pérdida de redes neuronales profundas y anchas

Zeeshan Zia

Aquí hay un blog sobre todo tipo de actualizaciones en la superficie de pérdida de la red neuronal, lo mejor es que tiene todos los enlaces a trabajos de investigación.

Enlace del blog: una descripción general de los algoritmos de optimización de descenso de gradiente

Zeeshan Zia

More Interesting

Si las redes neuronales artificiales se rediseñaran desde cero basándose en nuestro conocimiento actual del cerebro humano, ¿cuáles serían las diferencias importantes?

¿Cómo se relacionan la inteligencia humana y el talento humano?

¿Hay buenos libros o cursos para comenzar a aprender redes neuronales?

¿Por qué los motores de búsqueda semánticos no han despegado hasta ahora?

¿Cuál es la diferencia entre aprendizaje automático, red neuronal y cómo se relacionan con el aprendizaje profundo?

¿Cuáles son algunos buenos proyectos potenciales de IA?

¿Qué se necesita para crear un chatbot?

¿Cómo podemos fusionar neurociencia + IA?

¿Cuáles son las mejores plataformas y recursos para construir chatbots?