¿Dónde caen los sistemas de recomendación en los enfoques de aprendizaje automático?

Esa es una pregunta interesante. Mi respuesta sería que, si bien un sistema de recomendación puede utilizar el aprendizaje supervisado o no supervisado, no es ninguno de ellos, porque es un concepto en un nivel diferente.

Definiría algoritmos de aprendizaje supervisados ​​y no supervisados ​​como herramientas de recomendación. En ese sentido, un sistema de recomendación puede:

  • utilice el aprendizaje supervisado para clasificar los elementos en elementos que se recomendarán / no se recomendarán (“supervisados” porque funcionan con datos etiquetados, a saber, perfiles de usuario: elementos anteriores, calificaciones, lo que sea) En términos más generales, aprender a clasificar es la técnica típica de aprendizaje automático en la que estaría interesado un sistema de recomendación (ya que, en esencia, un motor de recomendación es principalmente una máquina de clasificación)
  • o utilice el aprendizaje no supervisado para, por ejemplo, dar sentido al espacio de funciones del elemento de usuario. Por ejemplo, las técnicas de factorización matricial habituales en el filtrado colaborativo podrían considerarse una forma de reducción de la dimensionalidad, similar a la PCA.

La conclusión es que un motor de recomendaciones, para proporcionar un servicio, necesita una caja de herramientas de técnicas. Algunos de ellos pueden ser etiquetados como aprendizaje supervisado o no supervisado. Algunos no lo son. Pero en general, el motor está haciendo algo más general que el aprendizaje automático. Si me presionaron para enmarcarlo en algún lugar, diría que lo que está haciendo un motor de recomendación es la Recuperación de información (en sí misma, un área de gran aplicación de aprendizaje automático y otras técnicas), ya que está recuperando datos en función de ciertos criterios. No es tan diferente de un motor de búsqueda en el procedimiento, aunque puede estar en apariencia.

Por lo tanto, para resumir: los sistemas de recomendaciones se pueden definir como una subárea de recuperación de información, que para trabajar puede utilizar aprendizaje supervisado o no supervisado, o ambos, o ninguno.

Se enmarca en el aprendizaje activo . En el aprendizaje activo, el algoritmo elige el siguiente ejemplo para el que quiere una etiqueta.

Por supuesto, normalmente el algoritmo elegiría aquellos ejemplos en los que el modelo tiene la mayor incertidumbre. Sin embargo, para muchas aplicaciones, desea equilibrar lo que ya sabe que es bueno ( explotación del modelo aprendido) con probar opciones que podrían ser mejores ( exploración ).

Este equilibrio entre exploración y explotación siempre ocurre en problemas de decisión secuenciales. Los problemas más simples son los problemas de los bandidos con múltiples brazos, pero pueden volverse mucho más complejos (por ejemplo, procesos de decisión de Markov parcialmente observables o POMDP en resumen, donde la acción elegida podría tener efectos secundarios no observables).

Para los problemas de los bandidos, hubo un trabajo realmente importante con un límite comprobable en el arrepentimiento (cuánto mejor podría haberlo hecho con información perfecta), el algoritmo UCB. Consulte Optimismo frente a la incertidumbre: el algoritmo UCB1 para obtener más información.

En términos de supervisión o no supervisión, supongo que muchos de los sistemas de recomendación más modernos probablemente se considerarían sin supervisión.

Con frecuencia usan grupos de personas (a las personas que les gustó la película X con mayor frecuencia la película Y, así como grupos de personas (a las personas con su perfil demográfico y / o de gusto por la película también les gustaron las películas Y). Estas no necesitan etiquetas explícitas en el contenido , aunque pueden formar grupos de género por cierto.