Sistemas de recomendación: ¿Cuál es la diferencia entre el filtrado colaborativo de elemento a elemento y el filtrado basado en contenido?

La diferencia entre estos dos está en el valor agregado que desea proporcionar más allá del elemento principal de la página. El filtrado colaborativo de artículo a artículo refleja la “sabiduría de las multitudes”. tales recomendaciones muestran a los espectadores qué otras tendencias están relacionadas con el elemento visto. Los ejemplos incluyen: “las personas que vieron / dieron me gusta / compraron este artículo también vieron / dieron me gusta / compraron ese otro artículo”.

El filtrado basado en contenido proporciona alternativas contextualizadas al elemento visto. El sistema hace coincidir los atributos del elemento visto con los atributos de otros elementos para generar recomendaciones.

Los motores de recomendación suelen utilizar estos dos enfoques juntos (así como otros enfoques). En un entorno de comercio electrónico, por ejemplo, cuando ve una página de detalles de un producto en particular, los motores de recomendación utilizarán filtros basados ​​en el contexto para reducir la lista de recomendaciones posibles (por ejemplo, seleccionar opciones de la categoría de catálogo de bajo o alto nivel del artículo) , y luego elija las opciones más modernas basadas en el filtrado colaborativo.

En el filtro colaborativo de elementos del elemento 2, se comparan los elementos según las opiniones de los usuarios. Si su matriz de utilidad tiene n usuarios por m elementos, compare los vectores de columna de esta matriz.

En la recomendación basada en el contenido, compara elementos según sus características para películas, como título, género, fecha de lanzamiento, director, productores, estudio, etc.

Una parte clave en la recomendación de contenido es que el usuario tiene un interés a largo plazo en ciertas categorías y un interés a corto plazo en los acontecimientos recientes. El interés a corto plazo del usuario sobre algún evento reciente puede tratarse recomendando el artículo de tendencias sobre la base del recuento de vistas dentro de un marco de tiempo particular. En lo que respecta al interés a largo plazo del usuario , la recomendación puede hacerse sobre la base del comportamiento y las preferencias del usuario. Para este propósito, el filtrado basado en contenido y las técnicas de filtrado colaborativo se utilizan para generar la recomendación.

El filtrado basado en contenido busca artículos que son similares en función de las etiquetas asignadas a cada artículo. A cada artículo se le asignan pesos en función de la frecuencia de los términos y la frecuencia inversa de los documentos de cada etiqueta. Después de esto, se calcula la probabilidad del usuario de leer un artículo.

La desventaja del filtrado basado en contenido es que conduce a una especialización excesiva, es decir, el artículo recomendado es similar al artículo ya leído y puede no ser útil para el usuario. Este método no utiliza la información de interacción entre usuarios para generar recomendaciones.

El filtrado colaborativo elemento-elemento utiliza la interacción entre usuarios para recomendar artículos. En el algoritmo, las similitudes entre diferentes elementos en el conjunto de datos se calculan utilizando una de las medidas de similitud, y luego estos valores de similitud se utilizan para generar recomendaciones para los usuarios. El valor de similitud entre dos artículos se mide observando a todos los usuarios que han leído ambos artículos. El enfoque de similitud basado en Pearson (correlación) se puede utilizar como medida de similitud.

El filtrado colaborativo se basa en preferencias anteriores o en la correlación de calificaciones entre usuarios. Sin embargo, esta técnica puede conducir a malas predicciones si el artículo es impopular y muy pocos usuarios han dado su opinión sobre ellos.

Para superar estas dificultades, se propone un modelo híbrido que tiene en cuenta todos los aspectos posibles que contribuyen a hacer la recomendación más relevante para el usuario.

Haga clic aquí para descargar nuestro trabajo de investigación para hacer un motor de recomendación híbrido

El filtrado colaborativo de artículo a artículo se basa en productos similares, por ejemplo, cualquier producto que coincida en función de sus similitudes en un sitio web de comercio electrónico podría ser una colaboración basada en artículo a artículo.

Mientras que el filtrado basado en contenido se basa en los metadatos de los productos (tomando un ejemplo aquí usando el comercio electrónico). Los metadatos aquí pueden ser los precios, el tipo de producto, la ubicación del usuario y personas similares a su alrededor. Podría resultar en un producto totalmente diferente del que el usuario recogió para comprar. Sin embargo, el producto será del agrado del usuario en función de sus hábitos de compra y los metadatos, la técnica de ML recogida.

El filtrado basado en contenido utiliza características (metadatos) del producto que le gustó a un usuario y los rasgos de personalidad del usuario para hacer recomendaciones. Por otro lado, en la CF de artículo a artículo solo se considera el “sabor” general. Esto significa que usted calcula una calificación tentativa sobre los elementos que el usuario aún no ha calificado mediante la descomposición de la matriz de calificación inicial escasamente poblada descomponiéndola en matrices de usuarios e ítems provisionales usando alguna forma modificada de SVD y construyendo una matriz de calificación tentativa. Ahora, selecciona el n superior de este o de un usuario similar.

En términos simples, la colaboración basada en artículos trata con las otras acciones del usuario en el artículo que está viendo o comprando. Este tipo de filtrado ocurre generalmente de manera simultánea y los atributos del producto no tienen la importancia de recomendar. Por ejemplo, estoy comprando un ventilador de techo y luego el sistema comienza a recomendarme comprar una luz (esto se debe a que muchas personas que compran ventiladores de techo también están comprando luces y no porque la luz y el ventilador de techo estén relacionados, esta información generalmente se extrae de la transcripción de los usuarios)

Mientras que cuando hablamos de filtrado basado en contenido, generalmente los atributos predefinidos de los productos coinciden y se recomendarán productos similares. Por ejemplo: cuando un usuario compra una cámara Cannon D450, el sistema comienza a recomendar lentes, otro modelo de cámara similar (Estas recomendaciones se basan en el hecho de que solo aquellos productos relacionados con el elemento principal en algunos atributos como modelo o lente compatible, etc., y también estos detalles sobre el producto se toman de los datos almacenados)

Hay algo más fundamental … las recomendaciones basadas en contenido no están supervisadas y no sufren el problema del arranque en frío

Las recomendaciones basadas en elementos requieren algún tipo de datos históricos y tienen un ciclo de retroalimentación implícito