La factorización matricial es solo una de las formas en que puede realizar el filtrado colaborativo. Como señaló, no funciona tan bien con datos escasos.
La recomendación de noticias es diferente de los dominios tradicionales de filtrado colaborativo, como películas o música, principalmente porque la frescura del artículo es muy importante. Los artículos de noticias, incluso de un día de antigüedad, no son aptos para ser recomendados, por lo que requiere un enfoque muy diferente. Un problema relacionado es que hay muy pocos comentarios de los usuarios sobre los “nuevos” artículos de noticias a medida que entran en el sistema.
Ha habido mucho trabajo en el campo, pero un modelo basado en el paradigma de exploración-explotación está ganando terreno (consulte este documento: www.cs.rutgers.edu/~lihong/pub/Li10Contextual.pdf, Yahoo lo usa para noticias) . La intuición es que obtener comentarios y recomendaciones de los usuarios debe realizarse simultáneamente. Por lo tanto, un proceso aleatorio decide si se muestra un nuevo artículo para obtener más comentarios o si el sistema recurre a su modelo calculado para servir la mejor recomendación. Ajustar los controles relativos de exploración (que muestra artículos subóptimos para comentarios) y explotación (que muestra las principales recomendaciones) puede dar un algoritmo bastante general.
Otro enfoque es utilizar la indexación semántica latente probabilística o los recuentos de visitas conjuntas para los artículos, algo que Google probó hace unos años (http://dl.acm.org/citation.cfm?i…).
En dominios a gran escala (usted menciona Twitter), la escalabilidad de un algoritmo de recomendación también es un problema importante. Las técnicas mencionadas anteriormente se pueden adaptar a los marcos informáticos distribuidos (como MapReduce); Las técnicas basadas en matrices son inherentemente difíciles de escalar.
- ¿Cuáles son los temas de investigación más interesantes en ciencias?
- ¿Por qué alguien querría ser profesor en lugar de trabajar en Microsoft Research? El beneficio más obvio es que puedes enseñar, pero ¿hay otros beneficios?
- ¿Google financia una gran cantidad de investigación académica, especialmente en el aprendizaje automático?
- ¿Cuál es la mejor manera de mostrar resultados para un trabajo de informática?
- ¿Cuáles son las preguntas / temas de investigación más importantes en filosofía hoy?
Esto no quiere decir que la factorización matricial no funcionará, pero hay técnicas más adecuadas en la literatura que vale la pena consultar.