¿Dónde puedo encontrar el conjunto de datos para un sistema de recomendación?

Recomender Systems es uno de los temas de investigación más buscados del aprendizaje automático. Los conjuntos de datos para los sistemas de recomendación son de diferentes tipos dependiendo de la aplicación de los sistemas de recomendación. Si está diseñando un sistema de recomendación general, los conjuntos de datos más populares son:

  1. Conjunto de datos MovieLens: este conjunto de datos contiene clasificaciones de usuarios para películas de diferentes géneros. La especialidad de este conjunto de datos es que también contiene información del usuario que se puede tener en cuenta para generar recomendaciones más relevantes y creativas.
  2. Conjuntos de datos de preferencias de SUSHI: este conjunto de datos contiene información de las preferencias del usuario para diferentes tipos de sushi. Es un conjunto de datos interesante y se pueden desarrollar muchos problemas de recomendación en este conjunto de datos.
  3. Frappe Dataset: este conjunto de datos contiene las preferencias del usuario para diferentes aplicaciones móviles. Aparte de esto, hay muchas más percepciones distintas registradas en este conjunto de datos que se pueden utilizar para generar recomendaciones.
  4. Conjunto de datos CoMoDa: este conjunto de datos es un conjunto de datos rico en contexto. Pero debe ponerse en contacto con sus creadores para obtener acceso al conjunto de datos. Puede encontrar fácilmente un enlace a través de google.

Estos fueron los principales conjuntos de datos que había utilizado para mi trabajo de investigación.

Puede encontrar una lista de otros conjuntos de datos para el sistema de recomendación utilizando el siguiente enlace:

9 conjuntos de datos imprescindibles para investigar sistemas de recomendación

Este artículo proporciona una comparación exhaustiva de diferentes artículos. Por ejemplo,

Mi consejo personal sería mantener un registro de las revistas y conferencias en el Sistema de recomendaciones. También proporcionan una buena cantidad de conjuntos de datos ricos y recientes que pueden mejorar su trabajo de investigación. Algunas de las conferencias para buscar serían:

  1. RecSys – Sistemas de recomendación de ACM
  2. Grupo de interés especial sobre recuperación de información (SIGIR)

Espero que esto ayude. 🙂

Echa un vistazo al conjunto de datos del Premio Netflix: Conjunto de datos del Premio Netflix

Tendrás que dividirlo en entrenamiento / validación / prueba tú mismo, pero eso no es demasiado difícil.

Depende de lo que quieras recomendar. Kaggle es un buen lugar para conjuntos de datos de muestra.

More Interesting

¿Cómo se puede minimizar el riesgo regularizado utilizando métodos bayesianos?

Si la tasa de predicción de un algoritmo de aprendizaje automático mantiene porcentajes bajos (50% a 60%) en un conjunto de datos, ¿cómo puedo mejorar?

¿Qué es el mecanismo de atención en redes neuronales?

¿Existe una diferencia práctica y significativa entre los términos 'función objetivo' y 'función de pérdida' en el aprendizaje profundo?

¿Qué es la agrupación promedio global?

En un problema de optimización no convexo, ¿es posible determinar si dos puntos pertenecen al mismo valle o no?

¿Cuáles son los primeros usos de la regresión logística?

¿Cuáles son las características únicas de una red neuronal en comparación con otras técnicas de aprendizaje automático?

Cómo determinar la distribución que sigue un conjunto de datos

Aprendizaje automático: Alex Casalboni: ¿Cuál es la mejor herramienta de ML para desenfocar caras (los tres tipos de visión izquierda, derecha y frontal) y placas en las imágenes?

¿Es realmente necesaria la programación competitiva para campos como la ciencia de datos o el aprendizaje automático y para solicitar gigantes tecnológicos?

Cómo configurar Sublime Text para el entorno de Machine Learning

¿Qué puedo hacer si soy un experto en aprendizaje automático supervisado?

¿Qué biblioteca de PNL cubre la mayoría de los idiomas para un proyecto de análisis de sentimientos?

Redes neuronales convolucionales: ¿Qué están haciendo los regresores de cuadro delimitador en Fast-RCNN?