¿Cuál es la diferencia entre el filtrado basado en contenido y el filtrado colaborativo?

Filtrado basado en contenido : el motor de recomendación basado en contenido funciona con perfiles de usuarios existentes. Un perfil tiene información sobre un usuario y sus gustos. El gusto se basa en la calificación del usuario para diferentes artículos. En general, cada vez que un usuario crea su perfil, el motor de recomendaciones realiza una encuesta para obtener información inicial sobre el usuario a fin de evitar nuevos problemas. En el proceso de recomendación, el motor compara los elementos que el usuario ya calificó positivamente con los elementos que no calificó y busca similitudes. Se recomendarán al usuario elementos similares a los de calificación positiva. Aquí, según el gusto y el comportamiento del usuario, se puede construir un modelo basado en el contenido recomendando artículos relevantes para el gusto del usuario. Tal modelo es eficiente y personalizado, pero le falta algo.

Comprendamos esto con un ejemplo. Suponga que hay cuatro categorías de noticias A) Política B) Deportes C) Entretenimiento D) Tecnología y hay un usuario A que ha leído artículos relacionados con Tecnología y Política. El motor de recomendaciones basado en contenido solo recomendará artículos relacionados con estas categorías y puede que nunca recomiende nada en otras categorías, ya que el usuario nunca ha visto esos artículos antes. Este problema se puede resolver utilizando otra variante del algoritmo de recomendación conocido como Collaborative Filtering.

Filtrado colaborativo: la idea del filtrado colaborativo es encontrar usuarios en una comunidad que compartan apreciaciones. Si dos usuarios tienen elementos iguales o casi iguales en común, entonces tienen un gusto similar. Dichos usuarios construyen un grupo o un llamado vecindario. Un usuario obtiene recomendaciones para aquellos elementos que el usuario no ha calificado antes, pero que los usuarios de su vecindario lo calificaron positivamente.

El filtrado colaborativo tiene básicamente dos enfoques:

Enfoque basado en el usuario
En este enfoque, los elementos que se recomiendan a un usuario se basan en una evaluación de elementos por parte de usuarios del mismo vecindario, con quienes comparte preferencias comunes. Si la comunidad calificó positivamente el artículo, se lo recomendará al usuario. En el enfoque basado en el usuario, los artículos que ya han sido calificados por un usuario, juegan un papel importante en la búsqueda de un grupo que comparta apreciaciones con él / ella.
Enfoque basado en artículos
Refiriéndose al hecho de que el gusto de los usuarios permanece constante o cambia muy ligeramente, artículos similares construyen vecindarios basados en las apreciaciones de los usuarios. Posteriormente, el sistema genera recomendaciones con artículos en el vecindario que un usuario podría preferir.

UNA El Sistema de recomendación también puede utilizar una combinación de los dos enfoques anteriores, es decir, un enfoque híbrido .

Aprendizaje automáticoFiltrado colaborativoSistemas de recomendación

¿Cómo construiría un sitio web que utiliza el aprendizaje automático (qué marcos para frontend y backend, Python o R)?

¿Por qué Microsoft decidió usar bosques aleatorios en el Kinect?

¿Cuáles son los mejores usos de Deep Learning para la clasificación de relevancia de búsqueda?

¿Cuáles son las 3 mejores GPU, independientemente del precio del aprendizaje profundo, especialmente si necesitamos mucha RAM de GPU, así como cálculos de alto rendimiento / velocidad?

¿Cuáles son algunas aplicaciones interesantes de aprendizaje profundo en FinTech?

Si hiciéramos inteligencia artificial, ¿estaríamos esencialmente creando o replicando nuestra propia conciencia? Si aislamos nuestra inteligencia para que no supieran que los habíamos creado, ¿cómo se aplicaría esto al concepto de Dios en realidad si es una posibilidad?

Una parte clave en la recomendación de contenido es que el usuario tiene un interés a largo plazo en ciertas categorías y un interés a corto plazo en los acontecimientos recientes. El interés a corto plazo del usuario sobre algún evento reciente puede tratarse recomendando el artículo de tendencias en función del recuento de vistas dentro de un marco de tiempo particular. En lo que respecta al interés a largo plazo del usuario , la recomendación puede hacerse sobre la base del comportamiento y las preferencias del usuario. Para este propósito, el filtrado basado en contenido y las técnicas de filtrado colaborativo se utilizan para generar la recomendación.

El filtrado basado en contenido busca artículos que son similares en función de las etiquetas asignadas a cada artículo. A cada artículo se le asignan pesos en función de la frecuencia de los términos y la frecuencia de documentos inversa de cada etiqueta. Después de esto, se calcula la probabilidad del usuario de leer un artículo.

Por otro lado, el filtrado colaborativo utiliza la correlación entre los artículos sobre la base de las calificaciones otorgadas al artículo por diferentes usuarios.

La desventaja del filtrado basado en contenido es que conduce a una especialización excesiva, es decir, el artículo recomendado es similar al artículo ya leído y puede no ser útil para el usuario. Este método no utiliza la información de interacción entre usuarios para generar recomendaciones.

El filtrado colaborativo se basa en preferencias anteriores o en la correlación de calificaciones entre usuarios. Sin embargo, esta técnica puede conducir a malas predicciones si el artículo es impopular y muy pocos usuarios han dado su opinión sobre ellos.

Para superar estas dificultades, se propone un modelo híbrido que tiene en cuenta todos los aspectos posibles que contribuyen a hacer la recomendación más relevante para el usuario.

Haga clic aquí para descargar nuestro trabajo de investigación para hacer un motor de recomendación híbrido

Además, comuníquese con nosotros para obtener más información sobre Inteligencia Artificial (IA), Aprendizaje automático (ML), Historias relacionadas con análisis en: Blog, Estudios de casos, Documentos de investigación

Deepanjan Majhee

Filtrado basado en contenido : el objetivo del sistema de filtrado basado en contenido es conocer el contenido tanto del usuario como del elemento. Por lo general, construye y luego compara el perfil de usuario y el perfil de elemento utilizando el contenido del espacio de atributo compartido. Por ejemplo, para una película, la representas con las estrellas de cine y los géneros (usando una codificación binaria, por ejemplo).

Para el perfil de usuario, puede hacer lo mismo en función de que a los usuarios les gusten algunas estrellas de cine / géneros, etc.

Filtrado colaborativo: el algoritmo colaborativo utiliza “Comportamiento del usuario” para recomendar elementos. Explotan el comportamiento de otros usuarios y artículos en términos de historial de transacciones, calificaciones, selección e información de compra. El comportamiento y las preferencias de otros usuarios sobre los elementos se utilizan para recomendar elementos a los nuevos usuarios. En este caso, no se conocen las características de los elementos.

Deepanjan Majhee

Puede encontrar información detallada en este artículo / tutorial

Método de mínimos cuadrados alternos para filtrado colaborativo

En resumen, el filtrado basado en contenido se basa en la similitud de los atributos de los elementos que está analizando, por ejemplo. categorías, etiquetas, palabras recurrentes.

El filtrado colaborativo no tiene en cuenta las propiedades de los elementos, sino solo la preferencia expresada por los usuarios para los elementos. Un filtro colaborativo predice los elementos que le gustarán a un usuario en función del voto que los usuarios similares dieron a ese elemento.

Deepanjan Majhee

More Interesting

¿Cuáles son los algoritmos actuales de última generación para la detección de objetos en 2017?

¿Cuáles son algunos proyectos interesantes del último año relacionados con el aprendizaje automático?

¿Cuáles son algunos libros sobrevalorados en aprendizaje automático, estadísticas y aprendizaje profundo?

En problemas de optimización matemática, a menudo se usa la primera derivada. ¿Por qué no el segundo, o derivados de orden superior?

¿Cuántos parámetros deben ajustarse para Random Forest?

¿Cuál es la mejor arquitectura de red neuronal para procesar video?

¿Se puede solicitar un doctorado en aprendizaje automático sin conocimientos y habilidades de CompSci? ¿Se puede aprender en el trabajo?

¿Qué es el código de máquina?

¿Es una buena idea dejar el aprendizaje automático después de 2 años y estudiar desarrollo web, si me di cuenta de que no soy tan inteligente para todas esas matemáticas de ML?

¿Los científicos informáticos realmente entienden cómo el aprendizaje profundo puede lograr sus resultados?