¿Por qué es importante el aprendizaje no supervisado?

El aprendizaje profundo se trata realmente de aprender representaciones, lo que significa aprender conceptos intermedios, características o variables latentes que son útiles para capturar las dependencias estadísticas que nos interesan. Estas dependencias son las variables de entrada a las variables de salida, en el aprendizaje supervisado, o entre cualquier subconjunto de variables, en el aprendizaje no supervisado. A menudo, el aprendizaje supervisado se usa para enseñarle a la computadora sobre conceptos intermedios (como categorías) que son importantes para resolver una tarea particular de interés. Sin embargo, vemos que nuestras redes profundas supervisadas descubren conceptos intermedios significativos en sus capas. El aprendizaje no supervisado es similar, excepto que le pedimos al modelo que capture todas las dependencias posibles entre todas las variables observadas, sin distinción entre entradas y salidas. Para ascender en la escalera de la IA con aprendizaje supervisado puede requerir “enseñar” a la computadora todos los conceptos que nos importan al mostrar toneladas de ejemplos donde ocurren estos conceptos. Así no es como aprenden los humanos: sí, gracias al lenguaje obtenemos algunos ejemplos que ilustran nuevos conceptos nombrados que se nos dan, pero la mayor parte de lo que observamos no viene etiquetado, al menos inicialmente. Los niños no tienen adultos que les digan qué representa cada píxel en cada imagen que ven, o cuáles son los objetos presentes en cada imagen, cuál es la estructura gramatical y el sentido preciso de cada palabra en cada oración que escuchan. Extraemos la mayor parte de la información de la simple observación (posiblemente a través de un ciclo de acción-percepción) y eso es lo que en principio hace el aprendizaje no supervisado. La esperanza es que el aprendizaje profundo no supervisado pueda descubrir (posiblemente con un poco de ayuda de los pocos ejemplos etiquetados que podemos proporcionar) todos los conceptos y las causas subyacentes que importan (algunos están explícitamente etiquetados, otros permanecen sin nombre) para explicar Lo que vemos a nuestro alrededor. Por lo tanto, creo que es esencial para acercarse a la IA avanzar en esta dirección. Y nosotros somos 😉

Si lo piensas bien, los científicos están aprendiendo sin supervisión: observando el mundo, elaborando modelos explicativos, probándolos mediante la recopilación de más observaciones (dirigidas, aunque), y tratando continuamente de mejorar nuestro modelo causal de cómo funciona el mundo que nos rodea. Sin embargo, sí recibimos un arranque de la educación, por lo que pueden ser necesarias ideas como el aprendizaje curricular (como vemos en algunas tareas de aprendizaje automático).

Agregando a la respuesta de Yoshua Bengio, Geof Hinton, quien es un famoso profesor de ML en la Universidad de Toronto (Googler a tiempo parcial), ha dicho:

Cuando estamos aprendiendo a ver, nadie nos dice cuáles son las respuestas correctas, solo miramos. De vez en cuando, tu madre dice “eso es un perro”, pero esa es muy poca información. Tendría suerte si obtuviera algunos bits de información, incluso un bit por segundo, de esa manera. El sistema visual del cerebro tiene 10 ^ 14 conexiones neuronales. Y solo vives por 10 ^ 9 segundos. Entonces no sirve de nada aprender un bit por segundo. Necesita más como 10 ^ 5 bits por segundo. Y solo hay un lugar donde puede obtener tanta información: desde la entrada en sí. – Geoffrey Hinton, 1996

Lo que dice es esto: el aprendizaje supervisado es limitado en términos de escalabilidad de la función objetivo en cuestión. El aprendizaje no supervisado es el procedimiento natural para los mamíferos cognitivos (nosotros). Se espera que deduzcamos los patrones de la información sensorial que recibimos del mundo físico. La superioridad del sistema cognitivo humano se basa en la práctica de un conjunto de métodos no supervisados ​​y supervisados ​​en los que no supervisados ​​es dominante.

1) Tenemos toneladas de datos, muy pocas etiquetas, y el aprendizaje semi supervisado es la única forma de lidiar con eso. El aprendizaje no supervisado es la mitad del aprendizaje semisupervisado. Si ayuda, puede pensar en ello como usar los datos no etiquetados para aprender a ver, luego los datos etiquetados para conocer los nombres de las cosas.

2) Los modelos no supervisados ​​son más robustos. Por ejemplo, pueden ser la base para muchas tareas diferentes. Si pasa mucho tiempo haciendo un clasificador de raza de perro totalmente supervisado (a partir de imágenes), eso es genial, tiene un buen clasificador de raza de perro. Pero si pasa la mayor parte de ese tiempo construyendo un buen modelo de imagen natural sin supervisión como su base, entonces pase una pequeña cantidad de tiempo entrenando una capa de clasificación de perros poco profunda, también tendrá un buen clasificador de raza de perro.

3) Hay algunos indicios de que estos modelos profundos generativos sin supervisión parecen hacer algo parecido a lo que está haciendo el cerebro. Es difícil no pensar que es un gran paso hacia el santo grial de la inteligencia general artificial, si tan solo pudiéramos hacerlos más grandes y salirse con la suya agitando una gran cantidad de arquitectura cerebral natural.

Haga clic aquí para obtener más detalles: ¿Qué es el aprendizaje no supervisado?

El aprendizaje no supervisado es importante en el campo de la ciencia de datos para revelar patrones que podrían haberse perdido.

Aprenda un poco sobre los problemas de agrupamiento en el campo de estudio de Machine Learning / Inteligencia artificial.

También en la vida real, el aprendizaje no supervisado podría tener en cuenta

1. Las fortalezas y debilidades personales de una persona.

2. Una nueva perspectiva que podría echar un vistazo a los datos disponibles bajo una nueva luz.

PD: Fue una muy buena pregunta.