Cómo lidiar con una matriz escasa de pares de elementos de usuario mientras se construye un sistema de recomendación de filtrado colaborativo basado en perceptrón

Es posible que desee detallar los detalles de su pregunta, pero lo intentaré.

Debe combinar las calificaciones de los grupos de usuarios más similares. Estos grupos de usuarios formarán estereotipos, sobre los cuales puede combinar el usuario actual. Todo se convierte en un juego de recomendación de front-end bayesiano de estereotipos de usuario en el que envía las propias calificaciones de los usuarios como vector de entrada, que se corresponde con el mejor ajuste de los estereotipos.

Todos los estereotipos elegidos tendrán sus recomendaciones para productos sin calificación, basados ​​en un modelo de su elección, por ejemplo, sumar las calificaciones y dividir por promedio.

La calificación que se muestra para el usuario es la suma probabilística de todos los mejores estereotipos de abeto: si el 20% de ajuste tiene 5 estrellas, el 30% de ajuste tiene 4 estrellas y el 50% de ajuste proporciona solo 2 estrellas, la calificación final será de aproximadamente 3 estrellas.

Este modelo permitirá las pruebas A / B y el aprendizaje de refuerzo para su sistema de recomendaciones más adelante.

La idea es calcular previamente los conjuntos de resultados, que se ajustan más fácilmente a las memorias caché. Las matrices dispersas no se escalan.

Tu problema no es único. Así es como se ven los datos del sistema de recomendaciones: incluso es común que más del 90% o el 95% de sus datos estén “en blanco”. Vea los conjuntos de datos del sistema de recomendación de datos abiertos para obtener referencias

Desde una perspectiva teórica, si sus datos no fueran escasos, si todos sus usuarios hubieran calificado todos sus elementos, entonces no necesitaría un sistema de recomendación.

Desde una perspectiva práctica, observe los enfoques de factorización matricial, que pueden manejar bien este nivel de escasez, pueden producir la entrada para otros enfoques de aprendizaje automático y aún así producir resultados razonables.