Mi impresión es que la decisión está impulsada por factores computacionales.
Por ejemplo, el conjunto de datos de desafío de Netflix contó con 480,000 usuarios y 18,000 artículos. Muchas otras compañías, como Amazon, tienen un desequilibrio similar en cuanto a la cantidad de usuarios en su sitio en comparación con la cantidad de artículos en venta.
Además, vale la pena señalar que los datos son menos escasos para los elementos que para los usuarios. En el conjunto de datos de Netflix, cada película fue calificada en promedio por más de 5K usuarios, mientras que cada usuario promedio solo había visto 200 películas.
- Cómo agregar una razón de probabilidad para una característica en mi conjunto de datos
- ¿Cómo puede ser útil el aprendizaje automático para el diseño de juegos?
- ¿Cuáles son las relaciones entre diversidad y precisión en los enfoques de conjunto?
- ¿Son los modelos gráficos probabilísticos comúnmente vistos / muy utilizados en la minería de datos práctica / cotidiana?
- ¿Cuáles son las características únicas de una red neuronal en comparación con otras técnicas de aprendizaje automático?
Finalmente, los gustos de los usuarios cambian con el tiempo. Sé que una canción o género que me gustaría en Spotify en este momento podría envejecer al menos temporalmente y pasaré a otra cosa. Las similitudes entre elementos permanecen más estáticas con el tiempo