Pandora es un poco diferente a otros sistemas de recomendación de música porque no se basa en los tipos de personas a las que les gusta o no una canción para hacer recomendaciones. Pandora en realidad contrató a miles de musicólogos para construir el Proyecto Music Genome [1], en el que cada canción está etiquetada con un “genoma” basado en unas 450 características musicales o “genes” (algunos géneros musicales tienen más genes que otros). Si está más interesado, aquí hay una entrevista interesante con Nolan Gasser, uno de esos musicólogos: profundizando en el genoma de la música de Pandora con el musicólogo Nolan Gasser
Por un lado, los sistemas como Spotify o Amazon crean un conjunto de usuarios o vecinos , de acuerdo con su nivel de acuerdo con el usuario objetivo (es decir, califican las mismas canciones, etc.). Por otro lado, Pandora crea un conjunto de canciones que son cualitativamente similares a las que el usuario está escuchando actualmente y luego aplica técnicas de filtrado (vecinos más cercanos) para producir recomendaciones. [2]
Si le gustan las estadísticas y está más interesado en el método de filtrado colaborativo basado en elementos que utiliza Pandora, le sugiero que lea el documento seminal de Sarwar et al. [3]
- Cómo obtener información real de los datos
- ¿Qué posibilidades futuras ve en la intersección de la ciencia de datos y las finanzas?
- Cómo calcular la distribución estadística en un gran conjunto de datos
- ¿Por qué debería molestarme con Python si puedo usar software para el análisis de datos (Excel, Tableau)?
- ¿Por qué pasarías a la ciencia de datos de ser consultor?
Referencias
[1] Proyecto Genoma Musical
[2] Algorhythm and Blues (Cómo el servicio de emparejamiento de Pandora corta el caos de la música digital).
[3] Sarwar, Badrul, y col. “Algoritmos de recomendación de filtrado colaborativo basados en elementos”. Actas de la décima conferencia internacional sobre la World Wide Web . ACM, 2001.