¿Hay algún artículo que justifique la normalización de los valores de los elementos en los sistemas de recomendación?

Dependerá del caso de uso y del algoritmo de recomendación (y, como han dicho otros, qué contiene “A”). Me referiré aquí a los artículos de recomendación “clásicos”.

Si contiene puntajes de ítems (según lo dado por los usuarios) y el recomendante es un CF que usa un modelo de vecindad, entonces la calificación z puede ser un buen enfoque de normalización [1], probablemente mejor que normalizar a [0,1], aunque puede También depende de la distancia métrica utilizada.

Si estamos usando la factorización matricial, nuevamente con las puntuaciones de los ítems, entonces puede tener sentido no normalizar, y en su lugar dejar que el sistema aprenda los sesgos de los usuarios y los ítems y los tenga en cuenta en la ecuación [2]. Y si el conjunto de datos contiene solo retroalimentación implícita (es decir, datos unarios o recuentos de vistas), entonces podríamos binarizar los valores y, si lo desea, incorporar información de retroalimentación adicional (como los recuentos de vistas) en valores de confianza auxiliares [3]

Para otros sistemas de recomendación o tipos de datos, el enfoque puede ser diferente.

Referencias

Christian Desrosiers y George Karypis. “Una encuesta exhaustiva de métodos de recomendación basados en el vecindario”. Manual de sistemas de recomendación . Springer US, 2011. 107-144.
Yehuda Koren, Robert Bell y Chris Volinsky. “Técnicas de factorización matricial para sistemas de recomendación”. Computadora 42.8 (2009).
Yifan Hu, Yehuda Koren y Chris Volinsky. “Filtrado colaborativo para conjuntos de datos de retroalimentación implícita”. Minería de datos, 2008. ICDM’08. Octava Conferencia Internacional IEEE sobre . IEEE, 2008.

Machine LearningSistemas de recomendación

¿Existen por sí mismas redes neuronales que cambian automáticamente y que pueden cambiar su estructura interna (capas, nodos, hyerparameters)?

¿Debería aprender aprendizaje automático, desarrollo en la nube o desarrollo de juegos en Unity como estudiante universitario de primer año?

¿Cómo debo combinar la retroalimentación implícita y explícita en el filtrado colaborativo?

¿Cuáles son los casos de uso de aprendizaje profundo en CRM?

Cómo usar más internet si tengo un plan ilimitado

¿Cuál es la diferencia entre una inferencia y una predicción?

Probablemente pueda buscar en Google Scholar las palabras clave “sistema de recomendación de normalización” y ver qué resulta. (No trabajo con sistemas de recomendación, así que no tengo referencias disponibles).

Por lo que está haciendo, sus valores de conversión a la escala de 0 a 1. La normalización de características como esta, en general, evita que las características con diferentes escalas se dominen entre sí y mejora el rendimiento de los métodos espaciales, que suponen que las distancias son significativas. Al convertir todo a una escala común, reduce los problemas para interpretar las diferencias como distancias.

Gracias Lev Nikolaevic Myskin por preguntar!

Sean Owen

No estoy seguro de que esté justificado en la mayoría de los casos; depende de qué A está aquí, cuál es la entrada, cuál es el modelo. Si A es una calificación explícita de un usuario, entonces creo que la normalización generalmente se ajusta por el hecho de que algunas personas califican una calificación alta o baja en general o rara vez dan una gran variedad de calificaciones. Pero hay mejores maneras de lograr esto que la fórmula que da, y podría leer https://www.cs.purdue.edu/homes/ … para obtener algunas ideas.

Sean Owen

More Interesting

¿Hay orden entre las características de las incrustaciones de palabras?

¿Qué modelo da un error de predicción más bajo cuando se usa R?

¿Qué significan las hipótesis finita e infinita en el aprendizaje automático? Cuáles son las diferencias entre ellos?

¿Cómo empiezo a analizar una base de datos de análisis web?

¿Qué es un giroscopio? ¿Como funciona?

¿Qué métricas debo usar en mi investigación de preprocesamiento de datos (no estructurada)?

Cómo implementar el aprendizaje automático en una aplicación de Android

¿Cuáles son algunas ideas importantes / brillantes en el aprendizaje automático?

¿Cuáles son algunas técnicas de compresión que usan redes neuronales recurrentes?

¿Cómo debo prepararme para Shogun Machine Learning Toolbox en GSoC? ¿Es difícil ser seleccionado en Shogun?