La referencia estándar para las CNN es de 1998/9 por LeCun et al., “Reconocimiento de objetos con aprendizaje basado en gradientes”:
http://yann.lecun.com/exdb/publi…
Tenga en cuenta que Yoshua Bengio es el autor final de ese documento. Desde entonces, ha habido muchas mejoras y extensiones, como agrupación máxima y normalización de lotes.
- ¿Qué es la regresión no lineal vs regresión lineal?
- ¿Cómo revolucionaría el mundo la PNL perfecta por computadoras?
- ¿Las redes RBM (máquina de Boltzman restringida) suelen tener el mismo número de nodos por capa?
- ¿Existe alguna implementación de aprendizaje profundo de respuesta basada en la recuperación de preguntas?
- ¿Cómo encontrar un mentor que me ayude a construir una carrera en visión por computadora y aprendizaje profundo como investigador o académico? ¿Cuál es el camino definitivo hacia este objetivo?
Antes de ese momento, había redes neuronales convolucionales con un nombre diferente. Fueron introducidos por Kunihiko Fukushima en 1980:
K. Fukushima. Neocognitron: un modelo de red neuronal autoorganizado para un mecanismo de reconocimiento de patrones no afectado por el cambio de posición. Cibernética biológica, 36 (4): 93-202, 1980.
El neocognitrón se basó en la idea de células simples y complejas. Si observa detenidamente, verá que las celdas simples básicamente realizan una convolución y las celdas complejas realizan una agrupación promedio. El neocognitrón no se dio cuenta por varias razones, que incluyen principalmente un rendimiento lento (en ese momento), la falta de una “aplicación asesina” y la falta de una comunidad de investigadores que lo promocionen. No parece que LeCun supiera sobre el neocognitrón cuando hizo su trabajo con convoluciones.
Jürgen Schmidhüber escribió una revisión histórica del aprendizaje profundo que es muy exhaustiva:
[1404.7828] Aprendizaje profundo en redes neuronales: una visión general
Pero tenga en cuenta que el objetivo de Schmidhüber está en ese documento es atribuir “correctamente” los descubrimientos dentro del aprendizaje profundo, porque siente que el crédito por varias contribuciones no se ha asignado correctamente antes. Es decir, prefiere enfatizar a las personas que han sido pasadas por alto en la reciente popularización del aprendizaje profundo.