¿Hay algún artículo que justifique la normalización de los valores de los elementos en los sistemas de recomendación?

Dependerá del caso de uso y del algoritmo de recomendación (y, como han dicho otros, qué contiene “A”). Me referiré aquí a los artículos de recomendación “clásicos”.

Si contiene puntajes de ítems (según lo dado por los usuarios) y el recomendante es un CF que usa un modelo de vecindad, entonces la calificación z puede ser un buen enfoque de normalización [1], probablemente mejor que normalizar a [0,1], aunque puede También depende de la distancia métrica utilizada.

Si estamos usando la factorización matricial, nuevamente con las puntuaciones de los ítems, entonces puede tener sentido no normalizar, y en su lugar dejar que el sistema aprenda los sesgos de los usuarios y los ítems y los tenga en cuenta en la ecuación [2]. Y si el conjunto de datos contiene solo retroalimentación implícita (es decir, datos unarios o recuentos de vistas), entonces podríamos binarizar los valores y, si lo desea, incorporar información de retroalimentación adicional (como los recuentos de vistas) en valores de confianza auxiliares [3]

Para otros sistemas de recomendación o tipos de datos, el enfoque puede ser diferente.

Referencias

  1. Christian Desrosiers y George Karypis. “Una encuesta exhaustiva de métodos de recomendación basados ​​en el vecindario”. Manual de sistemas de recomendación . Springer US, 2011. 107-144.
  2. Yehuda Koren, Robert Bell y Chris Volinsky. “Técnicas de factorización matricial para sistemas de recomendación”. Computadora 42.8 (2009).
  3. Yifan Hu, Yehuda Koren y Chris Volinsky. “Filtrado colaborativo para conjuntos de datos de retroalimentación implícita”. Minería de datos, 2008. ICDM’08. Octava Conferencia Internacional IEEE sobre . IEEE, 2008.

Probablemente pueda buscar en Google Scholar las palabras clave “sistema de recomendación de normalización” y ver qué resulta. (No trabajo con sistemas de recomendación, así que no tengo referencias disponibles).

Por lo que está haciendo, sus valores de conversión a la escala de 0 a 1. La normalización de características como esta, en general, evita que las características con diferentes escalas se dominen entre sí y mejora el rendimiento de los métodos espaciales, que suponen que las distancias son significativas. Al convertir todo a una escala común, reduce los problemas para interpretar las diferencias como distancias.

Gracias Lev Nikolaevic Myskin por preguntar!

No estoy seguro de que esté justificado en la mayoría de los casos; depende de qué A está aquí, cuál es la entrada, cuál es el modelo. Si A es una calificación explícita de un usuario, entonces creo que la normalización generalmente se ajusta por el hecho de que algunas personas califican una calificación alta o baja en general o rara vez dan una gran variedad de calificaciones. Pero hay mejores maneras de lograr esto que la fórmula que da, y podría leer https://www.cs.purdue.edu/homes/ … para obtener algunas ideas.