Deep Learning es una herramienta increíble que está ayudando a numerosos grupos a crear emocionantes aplicaciones de IA. Nos está ayudando a construir autos autónomos, reconocimiento de voz preciso, computadoras que puedan entender imágenes y mucho más.
A pesar de todo el progreso reciente, todavía veo grandes oportunidades sin explotar por delante. Hay muchos proyectos en agricultura de precisión, finanzas de consumo, medicina, … donde veo una clara oportunidad para que el aprendizaje profundo tenga un gran impacto, pero ninguno de nosotros ha tenido tiempo de enfocarse todavía. Así que estoy seguro de que el aprendizaje profundo no se “estabilizará” en el corto plazo y que continuará creciendo rápidamente.
El aprendizaje profundo también se ha sobrevalorado. Debido a que las redes neuronales son muy técnicas y difíciles de explicar, muchos de nosotros solíamos explicarlo dibujando una analogía con el cerebro humano. Pero casi no tenemos idea de cómo funciona el cerebro biológico. Michael Jordan de UC Berkeley llama al aprendizaje profundo una “caricatura” del cerebro biológico, una versión muy simplificada de algo que ni siquiera entendemos, y estoy de acuerdo. A pesar de la exageración de los medios, no estamos cerca de poder construir inteligencia a nivel humano. Debido a que fundamentalmente no sabemos cómo funciona el cerebro, los intentos de replicar ciegamente lo poco que sabemos en una computadora tampoco han resultado en sistemas de IA particularmente útiles. En cambio, el trabajo de aprendizaje profundo más efectivo hoy en día ha progresado al extraer de CS y principios de ingeniería y como máximo un toque de inspiración biológica, en lugar de tratar de copiar a ciegas la biología.
- ¿Cuál es la relación entre visión artificial, inteligencia artificial de aprendizaje automático y aprendizaje profundo? ¿Son dependientes y están estrechamente vinculados?
- ¿Cuáles son los pasos necesarios para el análisis de sentimientos de las redes sociales?
- ¿Dónde entran en juego las funciones de activación en una red neuronal de convolución?
- ¿Cuál es la diferencia entre soft k-means y el algoritmo EM?
- ¿Cómo se usa el cálculo vectorial en el aprendizaje automático?
Concretamente, si escuchas a alguien decir “El cerebro hace X. Mi sistema también hace X. Por lo tanto, estamos en el camino de construir el cerebro”, ¡mi consejo es huir!
Muchas de las ideas utilizadas en el aprendizaje profundo han existido durante décadas. ¿Por qué está despegando solo ahora? Dos de los principales impulsores de su progreso son: (i) escala de datos y (ii) escala de cálculo. Con nuestra sociedad pasando más tiempo en sitios web y dispositivos móviles, durante las últimas dos décadas hemos ido acumulando datos rápidamente. Fue solo recientemente que descubrimos cómo escalar la computación para construir algoritmos de aprendizaje profundo que puedan aprovechar esta gran cantidad de datos.
Esto ahora nos ha colocado en dos circuitos de retroalimentación positiva, lo que está acelerando el progreso del aprendizaje profundo:
Primero, ahora que tenemos grandes máquinas para absorber grandes cantidades de datos, el valor de los grandes datos es más claro. Esto crea un mayor incentivo para adquirir más datos, lo que a su vez crea un mayor incentivo para construir redes neuronales más grandes / más rápidas.
Segundo, que tenemos implementaciones rápidas de aprendizaje profundo, también acelera la innovación y acelera el progreso de la investigación de aprendizaje profundo. Muchas personas subestiman el impacto de las inversiones en sistemas informáticos en el aprendizaje profundo. Cuando llevamos a cabo una investigación de aprendizaje profundo, comenzamos sin saber qué algoritmos funcionarán y cuáles no, y nuestro trabajo es realizar muchos experimentos y resolverlo. Si tenemos una infraestructura de cómputo eficiente que le permite ejecutar un experimento en un día en lugar de una semana, ¡entonces su progreso de investigación podría ser casi 7 veces más rápido!
Es por eso que alrededor de 2008 mi grupo en Stanford comenzó a abogar por el cambio de aprendizaje profundo a las GPU (esto fue realmente controvertido en ese momento; pero ahora todos lo hacen); y ahora estoy abogando por cambiar a tácticas HPC (High Performance Computing / Supercomputing) para ampliar el aprendizaje profundo. El aprendizaje automático debería adoptar HPC. Estos métodos harán que los investigadores sean más eficientes y ayudarán a acelerar el progreso de todo nuestro campo.
Para resumir: el aprendizaje profundo ya ha ayudado a la IA a lograr un progreso tremendo. ¡Pero lo mejor está por venir!