¿Es el aprendizaje no supervisado la próxima frontera en la investigación del aprendizaje automático?

No quiero decir que sea trivial, pero para que algo sea “la próxima frontera”, ¿eso no requiere que algo sea nuevo?

El aprendizaje no supervisado es algo que se ha investigado ampliamente, y aunque estoy seguro de que hay más cosas que descubriremos, creo que esta pregunta surge principalmente de un malentendido crucial que muchas personas tienen sobre el aprendizaje no supervisado.

Al comenzar por primera vez en el aprendizaje automático, las personas suelen mencionar la división de aprendizaje automático supervisado / no supervisado. La suposición incorrecta a la que la gente suele saltar es que estas dos técnicas son capaces de hacer lo mismo.

Esto simplemente no es el caso. No existe una fórmula mágica mediante la cual pueda simplemente asignar un conjunto de datos a un algoritmo y esperar que descubra lo que desea adivinar.

Un solo documento en un corpus puede tener muchos atributos: sentimiento, categoría, autor, subjetividad, etc. Para determinar cualquiera de estos, debe guiar la capacitación para decirle al modo exactamente lo que desea extraer.

Una vez que haya hecho eso, ya no estará en el ámbito del aprendizaje sin supervisión. Al especificar la información que desea extraer, está agregando un nivel de supervisión al proceso. Esto lo lleva al ámbito del aprendizaje semi-supervisado, activo, de representación y de refuerzo, según el enfoque que desee adoptar.

Todas estas son áreas de investigación muy activa en la actualidad, y la comunidad investigadora es muy consciente del hecho de que estas áreas aún están en su infancia. Muchos de los documentos clave en estos espacios se han desarrollado en los últimos 5 años.

TL; DR: No puedo decir con certeza, pero mi instinto dice que no.