¿Cuál es la mejor manera de combinar filtrado colaborativo y recomendaciones basadas en contenido?

Una parte clave en la recomendación de contenido es que el usuario tiene un interés a largo plazo en ciertas categorías y un interés a corto plazo en los acontecimientos recientes. El interés a corto plazo del usuario sobre algún evento reciente puede tratarse recomendando el artículo de tendencias en función del recuento de vistas dentro de un marco de tiempo particular. En lo que respecta al interés a largo plazo del usuario , la recomendación puede hacerse sobre la base del comportamiento y las preferencias del usuario. Para este propósito, el filtrado basado en contenido y las técnicas de filtrado colaborativo se utilizan para generar la recomendación.

El filtrado basado en contenido busca artículos que son similares en función de las etiquetas asignadas a cada artículo. A cada artículo se le asignan pesos en función de la frecuencia de los términos y la frecuencia de documentos inversa de cada etiqueta. Después de esto, se calcula la probabilidad del usuario de leer un artículo.

Por otro lado, el filtrado colaborativo utiliza la correlación entre los artículos sobre la base de las calificaciones otorgadas al artículo por diferentes usuarios.

La desventaja del filtrado basado en contenido es que conduce a una especialización excesiva, es decir, el artículo recomendado es similar al artículo ya leído y puede no ser útil para el usuario. Este método no utiliza la información de interacción entre usuarios para generar recomendaciones.

El filtrado colaborativo se basa en preferencias anteriores o en la correlación de calificaciones entre usuarios. Sin embargo, esta técnica puede conducir a malas predicciones si el artículo es impopular y muy pocos usuarios han dado su opinión sobre ellos.

Para superar estas dificultades, se propone un modelo híbrido que tiene en cuenta todos los aspectos posibles que contribuyen a hacer la recomendación más relevante para el usuario.

Haga clic aquí para descargar nuestro trabajo de investigación para hacer un motor de recomendación híbrido

Además, comuníquese con nosotros para obtener más información sobre inteligencia artificial (IA), aprendizaje automático (ML), historias relacionadas con análisis en: Blog, estudios de casos, documentos de investigación

Si está buscando un motor de recomendaciones que combine recomendaciones basadas en contenido y filtrado colaborativo, le sugiero que consulte Boomtrain.

Boomtrain está impulsado por una IA (inteligencia artificial) y un núcleo de aprendizaje automático que aprende de los patrones de navegación de su usuario, me gusta, disgustos, clics y mucho más.

Boomtrain utiliza una combinación de filtrado colaborativo, análisis de comportamiento, análisis semántico y más para recomendaciones basadas en contenido. El equipo de soporte trabaja con cada cliente para comprender a sus clientes, y qué combinación funcionaría mejor para crear magia de compromiso.

Los editores y las compañías de medios como Conde Nast, UpOut, ReadWrite y Barkpost han integrado el motor de recomendación de contenido de Boomtrain en sus plataformas para crear un mejor compromiso con sus lectores y suscriptores. Estas son algunas de las características.

Filtración colaborativa
Boomtrain utiliza el filtrado colaborativo para comprender qué les puede gustar a los usuarios en función de los artículos y la información que a dos usuarios les gusta en común. Esto proporciona una base para conexiones más fuertes con cada contenido que comparta con el usuario y aumenta las posibilidades de interacción.

Análisis semántico
El análisis semántico se basa en el consumo de texto y los patrones de intercambio, nuestro núcleo de inteligencia artificial lo ayuda a identificar qué temas puede interesarle más a un usuario en función de sus interacciones, me gusta, compartir y comentar una información.

Análisis de popularidad
El motor de Boomtrain realiza un seguimiento del contenido más popular en su campo y ayuda a incorporarlo en las recomendaciones basadas en los intereses de su audiencia.

Plataforma de comunicación
La plataforma de comunicación integrada de Boomtrain lo ayuda a redactar correos electrónicos, boletines, SMS, en el sitio, en la aplicación y enviar mensajes a sus usuarios mediante una plantilla fácil de usar de arrastrar y soltar. Ahorre el tiempo y el esfuerzo que pasa diseñando plantillas y pase más tiempo entendiendo a sus usuarios.

Echa un vistazo a Boomtrain y solicita una demostración aquí.

Una de las formas es utilizar un clasificador o un clasificador de nivel superior que utilice tanto el filtrado colaborativo como las características basadas en contenido.

Puede usar un algoritmo de aprendizaje automático supervisado (como árboles de decisión potenciados por gradiente) para predecir si cierto usuario está interesado en un elemento. Puede entrenarlo como un clasificador (si necesita solo los elementos principales) o como un clasificador (por ejemplo, si necesita probabilidad de clics) o, a veces, como un modelo de regresión (por ejemplo, si necesita mostrar su predicción de calificación al usuario).

En este modelo de nivel superior, puede combinar las funciones que desee: funciones de usuario (género, edad, ingresos, etc.), funciones de elementos o contenido (categorías, precios, etc.), y también funciones de modelos de filtrado colaborativo (como factorización matricial). El modelo de nivel superior puede usar todas estas características de forma inteligente descubriendo algunas interacciones no triviales entre ellas. Este enfoque tiene una buena propiedad de extensibilidad.

Puede ver mi breve charla (solo 4 minutos) sobre nuestro sistema de recomendación en Yandex que se utiliza para recomendar música, artículos y productos:

También está mi póster con muchos más detalles: Poster.pdf

Otra forma de combinar recomendaciones basadas en contenido y filtrado colaborativo del que he oído hablar es entrenar un modelo combinado de red neuronal como el aprendizaje colaborativo profundo para sistemas de recomendación.

Recientemente he aprendido sobre la página de filtrado de contenido agregada como una función avanzada. La función simplemente funciona como Filtrado web que filtra las páginas web para determinar si parte o la totalidad debe bloquearse. La solución de filtrado web escanea sitios web que probablemente incluyan publicidad no deseada, contenido explícito, spyware, virus y otras formas maliciosas de contenido.

No solo se limita a la idea del filtrado de contenido predeterminado, sino también al filtrado según los requisitos recientes del usuario.

Las siguientes son las formas en que funciona el filtrado

Filtrado basado en categorías

Bloquear omisión de página

Permitir / bloquear URL

Limitaciones de configuración

Por lo tanto, la necesidad de colaboración basada en contenido se manejará de la mejor manera.

More Interesting

¿Por qué la resolución de las imágenes de entrada en la red convolucional debe tener la misma dimensión (ancho y alto)?

¿Qué 2 cursos entre estructuras de datos y algoritmos, diseño de software, introducción a IA, aprendizaje automático y sistemas operativos, debo elegir?

¿Las startups ofrecen trabajos orientados a la investigación?

¿Cuáles son las cosas más difíciles o problemáticas para los ingenieros de Machine Learning / Deep Learning?

¿Cuáles son algunos de los mejores trabajos de investigación o libros para el aprendizaje automático?

¿No tener datos temporales en el vector de entrada hace que un RNN-LSTM sea inútil en comparación con otros NN si su salida es una secuencia temporal?

¿Debo aprender el aprendizaje automático y el desarrollo de aplicaciones de Android simultáneamente? En caso afirmativo, ¿a qué lenguaje (s) de programación debo recurrir?

¿Cómo puedo aprender ciencia de datos?

¿Cuántas horas le tomaría a un analista de datos profesional revisar los datos simples de la compañía y construir un modelo para predecir el desgaste?

Para las selecciones de características, ¿cuál deberíamos preferir, PCA (basado en la matriz de correlación) para reducir la dimensión o Xgboost (basado en el árbol)?

¿Por qué TF (frecuencia de término) a veces da mejores puntuaciones F que TF-IDF para la clasificación de texto?

¿Cuál es un buen consejo para una implementación eficiente de un algoritmo de aprendizaje automático en C / C ++?

¿Dónde usa Quora el aprendizaje automático?

¿Qué le parece más interesante: el análisis de series temporales o el aprendizaje automático? ¿Por qué?

¿Por qué es importante usar pruebas de regresión?