Esa es una pregunta muy común pero interesante.
¡Muchas personas tienen la noción de que agregar más capas te hace pasar del aprendizaje automático al aprendizaje profundo! También he visto personas trazando un límite de decisión entre el aprendizaje automático y el aprendizaje profundo: las redes neuronales son aprendizaje profundo y SVM, ¡las regresiones son aprendizaje automático! Si bien la primera noción es parcialmente cierta, la segunda afirmación es ridícula.
Las redes neuronales han estado allí durante mucho tiempo, antes de que Deep Learning se volviera genial. Entonces, ¿el hecho de poder agregar más capas (gracias a los recursos de hardware mejorados que tenemos ahora) lo hace profundo?
- ¿Cuánto aprendizaje automático se usa en Quora?
- ¿Por qué tantos geeks de datos se unen a compañías web en lugar de resolver problemas de datos a gran escala en biología?
- ¿Qué resultado arrojará una máquina de aprendizaje profundo bien entrenada de esta imagen?
- ¿Cómo se diseñan y desarrollan las nuevas arquitecturas de aprendizaje profundo?
- ¿Es efectivo el entrenamiento de confrontación contra los ejemplos de confrontación en general?
Ahora veamos un caso específico que muestra cómo hemos pasado realmente del aprendizaje automático al aprendizaje profundo (si es que lo hemos hecho). Hay una tarea crucial en el procesamiento del lenguaje natural: etiquetado POS. Anteriormente, para predecir la etiqueta, solíamos usar características como etiquetas circundantes, si la palabra está en mayúscula, si es de varias palabras, cuál es su primer carácter, etc. Entonces, solíamos crear manualmente características como estas y luego, tal vez , use alguna selección de características como chi-cuadrado, basada en correlación para seleccionar las características más adecuadas y finalmente use algún algoritmo de aprendizaje automático para predecir la etiqueta de la palabra.
La limitación más importante de este proceso es que necesita saber con qué característica debe comenzar y luego elegir qué características se seleccionarán de ellas. Sobre todo, este proceso también necesita un poco de experiencia en el dominio, mientras que la función más importante de los algoritmos de aprendizaje debe ser eliminar el DA del usuario tanto como sea posible.
Deep Learning aprende características de los datos y las características que aprende son más ricas y significativas. En otras palabras, el aprendizaje profundo lo ayuda a aprender representaciones útiles de sus datos para resolver mejor la tarea en cuestión.
Ahora se trata de vectores con valores reales que contienen toda la información importante sobre cualquier palabra, frase y oración, y también aprende qué información usar directamente de los datos. Todo esto sucede debido a los diseños eficientes de la arquitectura neuronal, el objetivo de entrenamiento y también los datos con un patrón rico y suficiente para el algoritmo.
En cierto modo, también puedes decir que
Aprendizaje profundo = Aprendizaje automático + Aprendizaje de representación.
Entonces, básicamente, ves que solo aumentar las capas por el bien no hace que tu algoritmo sea “profundo”. Un modelo de aprendizaje profundo tiene dos componentes importantes: características eficientes y predictor eficiente. Ambos se aprenden!