Puede descargar el conjunto de datos MovieLens 1M y explotar la información de género para un sistema de recomendación básico basado en contenido (CB-RecSys). Además, puede usar un mapeo de DBpedia (sisinflab / LODrecsys-datasets) que contiene un URI de DBpedia para cada película y descargar, usando consultas SPARQL, todos los datos que necesita, como la página de Wikipedia o algunas propiedades específicas asociadas a entidades de películas.
Después de eso, debe diseñar una metodología específica para representar los elementos y usuarios que debe explotar para generar sugerencias. Un enfoque común y simple es representar elementos como los vectores TF-IDF calculados a partir de sus descripciones y modelar el vector de usuario como el centroide de los elementos que le gustan. Después de eso, puede hacer una recomendación top-N clasificando cada elemento en orden decreciente por el puntaje de similitud entre el elemento y la representación vectorial del usuario.
Si desea obtener más información al respecto, le sugiero que lea el último capítulo del Manual del sistema de recomendaciones sobre sistemas de recomendación basados en contenido basados en la semántica que describe muchas metodologías utilizadas para aumentar las capacidades de CB-RecSys.
- Cómo realizar análisis de opinión sobre noticias del mercado de valores
- ¿En qué deberían centrarse los gerentes de productos de software que son nuevos en AI / Machine Learning? Los cursos en línea son extremadamente técnicos. ¿Es eso lo que se necesita?
- ¿Cuáles son los fundamentos programáticos del procesamiento del lenguaje natural?
- ¿Las implementaciones físicas de las redes neuronales son claramente preferibles a las GPU?
- ¿Los científicos informáticos realmente entienden cómo el aprendizaje profundo puede lograr sus resultados?