¿Qué piensa Andrew Ng sobre Deep Learning?

Deep Learning es una herramienta increíble que está ayudando a numerosos grupos a crear emocionantes aplicaciones de IA. Nos está ayudando a construir autos autónomos, reconocimiento de voz preciso, computadoras que puedan entender imágenes y mucho más.

A pesar de todo el progreso reciente, todavía veo grandes oportunidades sin explotar por delante. Hay muchos proyectos en agricultura de precisión, finanzas de consumo, medicina, … donde veo una clara oportunidad para que el aprendizaje profundo tenga un gran impacto, pero ninguno de nosotros ha tenido tiempo de enfocarse todavía. Así que estoy seguro de que el aprendizaje profundo no se “estabilizará” en el corto plazo y que continuará creciendo rápidamente.

El aprendizaje profundo también se ha sobrevalorado. Debido a que las redes neuronales son muy técnicas y difíciles de explicar, muchos de nosotros solíamos explicarlo dibujando una analogía con el cerebro humano. Pero casi no tenemos idea de cómo funciona el cerebro biológico. Michael Jordan de UC Berkeley llama al aprendizaje profundo una “caricatura” del cerebro biológico, una versión muy simplificada de algo que ni siquiera entendemos, y estoy de acuerdo. A pesar de la exageración de los medios, no estamos cerca de poder construir inteligencia a nivel humano. Debido a que fundamentalmente no sabemos cómo funciona el cerebro, los intentos de replicar ciegamente lo poco que sabemos en una computadora tampoco han resultado en sistemas de IA particularmente útiles. En cambio, el trabajo de aprendizaje profundo más efectivo hoy en día ha progresado al extraer de CS y principios de ingeniería y como máximo un toque de inspiración biológica, en lugar de tratar de copiar a ciegas la biología.

Concretamente, si escuchas a alguien decir “El cerebro hace X. Mi sistema también hace X. Por lo tanto, estamos en el camino de construir el cerebro”, ¡mi consejo es huir!


Muchas de las ideas utilizadas en el aprendizaje profundo han existido durante décadas. ¿Por qué está despegando solo ahora? Dos de los principales impulsores de su progreso son: (i) escala de datos y (ii) escala de cálculo. Con nuestra sociedad pasando más tiempo en sitios web y dispositivos móviles, durante las últimas dos décadas hemos ido acumulando datos rápidamente. Fue solo recientemente que descubrimos cómo escalar la computación para construir algoritmos de aprendizaje profundo que puedan aprovechar esta gran cantidad de datos.

Esto ahora nos ha colocado en dos circuitos de retroalimentación positiva, lo que está acelerando el progreso del aprendizaje profundo:

Primero, ahora que tenemos grandes máquinas para absorber grandes cantidades de datos, el valor de los grandes datos es más claro. Esto crea un mayor incentivo para adquirir más datos, lo que a su vez crea un mayor incentivo para construir redes neuronales más grandes / más rápidas.

Segundo, que tenemos implementaciones rápidas de aprendizaje profundo, también acelera la innovación y acelera el progreso de la investigación de aprendizaje profundo. Muchas personas subestiman el impacto de las inversiones en sistemas informáticos en el aprendizaje profundo. Cuando llevamos a cabo una investigación de aprendizaje profundo, comenzamos sin saber qué algoritmos funcionarán y cuáles no, y nuestro trabajo es realizar muchos experimentos y resolverlo. Si tenemos una infraestructura de cómputo eficiente que le permite ejecutar un experimento en un día en lugar de una semana, ¡entonces su progreso de investigación podría ser casi 7 veces más rápido!

Es por eso que alrededor de 2008 mi grupo en Stanford comenzó a abogar por el cambio de aprendizaje profundo a las GPU (esto fue realmente controvertido en ese momento; pero ahora todos lo hacen); y ahora estoy abogando por cambiar a tácticas HPC (High Performance Computing / Supercomputing) para ampliar el aprendizaje profundo. El aprendizaje automático debería adoptar HPC. Estos métodos harán que los investigadores sean más eficientes y ayudarán a acelerar el progreso de todo nuestro campo.


Para resumir: el aprendizaje profundo ya ha ayudado a la IA a lograr un progreso tremendo. ¡Pero lo mejor está por venir!

More Interesting

Cómo usar mel-spectrogram como entrada de una CNN

¿El aprendizaje automático es un tema torpe?

Cómo leer los datos de un directorio en Tensorflow

¿Cómo elegiría el marco de aprendizaje profundo adecuado para un proyecto?

¿Cuál es la forma correcta y deseable de hacer un asistente personal / bot de chat usando AI, ML y NLP?

¿Cómo se comparan las bibliotecas de aprendizaje automático de Python con las de Go?

En la regresión cuadrática, ¿por qué tengo que mantener una variable y su aumento exponencial en el mismo modelo?

Si quiero comenzar con el aprendizaje profundo, ¿debería comprar una GPU de gama baja o aprovechar una solución en la nube? ¿Cuál es más barato / mejor?

¿Podemos regularizar la red neuronal profunda desconectando enlaces entre unidades, en lugar de abandonar unidades seleccionadas al azar?

¿Cuáles son los conjuntos de datos canónicos de aprendizaje automático utilizados como punto de referencia para demostrar un nuevo método?

Después de dominar el aprendizaje profundo, ¿es posible conseguir un trabajo en aprendizaje automático?

¿Cómo debo abordar mi tesis sobre 'conversión de lenguaje de señas a texto'? ¿Cuál debería ser el método?

¿Hay conjuntos de datos abiertos que contengan textos y calificaciones de los usuarios para ellos?

En Python, ¿cómo puedo probar y asegurarme de que mi modelo predice datos correctamente? (principiante preguntando)

¿Cuáles son los mejores métodos para el reconocimiento robusto de caracteres en MATLAB u OPENCV?