Dependerá del caso de uso y del algoritmo de recomendación (y, como han dicho otros, qué contiene “A”). Me referiré aquí a los artículos de recomendación “clásicos”.
Si contiene puntajes de ítems (según lo dado por los usuarios) y el recomendante es un CF que usa un modelo de vecindad, entonces la calificación z puede ser un buen enfoque de normalización [1], probablemente mejor que normalizar a [0,1], aunque puede También depende de la distancia métrica utilizada.
Si estamos usando la factorización matricial, nuevamente con las puntuaciones de los ítems, entonces puede tener sentido no normalizar, y en su lugar dejar que el sistema aprenda los sesgos de los usuarios y los ítems y los tenga en cuenta en la ecuación [2]. Y si el conjunto de datos contiene solo retroalimentación implícita (es decir, datos unarios o recuentos de vistas), entonces podríamos binarizar los valores y, si lo desea, incorporar información de retroalimentación adicional (como los recuentos de vistas) en valores de confianza auxiliares [3]
- Cómo construir un sistema de aprendizaje automático para la revisión automática de código
- OpenCV: ¿Cómo creo un conjunto de datos de descriptores de imagen con SIFT?
- ¿Puedes explicar cómo el BPTT sufre un problema de gradiente?
- ¿Qué tan importante es el aprendizaje profundo en la conducción autónoma?
- ¿Por qué necesitamos barajar entradas para el descenso de gradiente estocástico?
Para otros sistemas de recomendación o tipos de datos, el enfoque puede ser diferente.
Referencias
- Christian Desrosiers y George Karypis. “Una encuesta exhaustiva de métodos de recomendación basados en el vecindario”. Manual de sistemas de recomendación . Springer US, 2011. 107-144.
- Yehuda Koren, Robert Bell y Chris Volinsky. “Técnicas de factorización matricial para sistemas de recomendación”. Computadora 42.8 (2009).
- Yifan Hu, Yehuda Koren y Chris Volinsky. “Filtrado colaborativo para conjuntos de datos de retroalimentación implícita”. Minería de datos, 2008. ICDM’08. Octava Conferencia Internacional IEEE sobre . IEEE, 2008.