¿Cuáles son los resultados en la investigación en el área de filtrado colaborativo para recomendaciones de artículos de noticias?

La factorización matricial es solo una de las formas en que puede realizar el filtrado colaborativo. Como señaló, no funciona tan bien con datos escasos.
La recomendación de noticias es diferente de los dominios tradicionales de filtrado colaborativo, como películas o música, principalmente porque la frescura del artículo es muy importante. Los artículos de noticias, incluso de un día de antigüedad, no son aptos para ser recomendados, por lo que requiere un enfoque muy diferente. Un problema relacionado es que hay muy pocos comentarios de los usuarios sobre los “nuevos” artículos de noticias a medida que entran en el sistema.

Ha habido mucho trabajo en el campo, pero un modelo basado en el paradigma de exploración-explotación está ganando terreno (consulte este documento: www.cs.rutgers.edu/~lihong/pub/Li10Contextual.pdf, Yahoo lo usa para noticias) . La intuición es que obtener comentarios y recomendaciones de los usuarios debe realizarse simultáneamente. Por lo tanto, un proceso aleatorio decide si se muestra un nuevo artículo para obtener más comentarios o si el sistema recurre a su modelo calculado para servir la mejor recomendación. Ajustar los controles relativos de exploración (que muestra artículos subóptimos para comentarios) y explotación (que muestra las principales recomendaciones) puede dar un algoritmo bastante general.
Otro enfoque es utilizar la indexación semántica latente probabilística o los recuentos de visitas conjuntas para los artículos, algo que Google probó hace unos años (http://dl.acm.org/citation.cfm?i…).

En dominios a gran escala (usted menciona Twitter), la escalabilidad de un algoritmo de recomendación también es un problema importante. Las técnicas mencionadas anteriormente se pueden adaptar a los marcos informáticos distribuidos (como MapReduce); Las técnicas basadas en matrices son inherentemente difíciles de escalar.

Esto no quiere decir que la factorización matricial no funcionará, pero hay técnicas más adecuadas en la literatura que vale la pena consultar.

More Interesting

¿Cómo saben los mejores investigadores cuál de sus ideas funcionará?

¿Cuáles son las áreas de investigación actuales en informática?

¿Cuáles son buenas formas de cuantificar la calidad del código?

¿Cuáles son algunos campos crecientes y relativamente desconocidos de la informática (fuera de los campos como IA, criptografía, bioinformática, minería de datos)?

¿Cuál es el mejor lenguaje de programación para hacer investigaciones y locuras?

¿Cuáles son algunas de las ventajas de usar modelos de proceso gaussianos frente a redes neuronales?

¿Cómo se compara la investigación de la industria como Google Deepmind con la academia?

¿Cuál es la mejor manera de mantenerse al día con los últimos avances / avances en el campo de la informática?

¿Por qué las empresas como Google, Microsoft y Facebook publican su trabajo en lugar de guardar los hallazgos como secretos industriales?

¿Cuál es el SDLC que se sigue para los proyectos de investigación?

¿Cuáles son algunos de los problemas de investigación más difíciles en la arquitectura de computadoras ahora?

¿Cuáles son algunos avances recientes en la teoría de grafos? Tomé un curso de posgrado en teoría de grafos, pero los resultados que uso de la teoría de grafos (espectrales y aleatorios) tienen más de 50 años. ¿Qué hay de nuevo y cuáles son los grandes avances recientes?

¿Cuáles son algunos aspectos de investigación basados ​​en aplicaciones de big data?

¿Qué opinas sobre la video conferencia de visión por computadora de William Hoff?

¿Podría el aprendizaje automático reemplazar a científicos e investigadores médicos?