Cómo hacer un algoritmo de filtrado basado en contenido de Python

Como primera solución simple, trataría esto de la siguiente manera (elegí algunos números reales para mayor claridad):

  • Asegúrese de que sus artículos tengan algunas palabras clave asociadas (etiquetas), por ejemplo, “avión”, “cuerpo ancho”.
  • Rastree el número de clics por usuario y artículo
  • Cuando muestre recomendaciones, seleccione los 5 artículos principales que ha visto el usuario (ordenar por número de clics descendentes). Para cada uno de esos artículos:
    • Encuentra los 3 artículos principales que comparten la mayoría de las palabras clave
  • Ordene esos 15 artículos por el número de clics del artículo de origen asociado y muéstrelos al usuario.

Es muy probable que esto tenga problemas de rendimiento al hacer coincidir las etiquetas, pero si lo mantiene bastante pequeño (y en caché) debería estar bien.

Como solución más avanzada, emplearía algo de aprendizaje automático, un sistema de recomendación real. Hay muchos por ahí que están listos para usar.

EDITAR

En lugar de contar las vistas de artículos, puede contar las vistas de palabras clave asociadas para simplificar el proceso. En este caso, solo usaría las palabras clave principales para encontrar artículos que coincidan mejor.