No creo que haya ningún proyecto activo de Kaggle que pueda calificar. Entre las competiciones cerradas, además de los buenos ejemplos ya mencionados, está el R Package Evaluation Engine, que se enmarca explícitamente como un problema de recomendación (con una pequeña base de usuarios en el conjunto de entrenamiento, por lo que es probable que sea mejor modelarlo como un recomendador basado en contenido, aprovechando los metadatos, que como un motor CF).
Además, el Hackathon de minería de datos en el sitio web móvil Best Buy de BIG DATA (7GB) (o su hermano menor) también podría calificar. Estrictamente hablando, es un problema de predicción (“predice en qué producto estará más interesado un usuario que visite el sitio móvil de Best Buy”), pero podría considerarlo un recomendador (“recomendar el mejor producto para el usuario visitante”) y salirse con la suya . La frontera entre la predicción y la recomendación a veces radica más en cómo evalúa los resultados que en el algoritmo en sí.
- Soy un novato en la minería de datos. ¿Cuál es el mejor algoritmo de aprendizaje automático para la minería de datos en términos de precisión y tiempo? Me parece que SVM se ha utilizado ampliamente, pero ¿hay alguna otra opción mejor que SVM?
- ¿Cómo difiere la ciencia de datos en el sector público del sector privado? ¿Qué servicios del sector público podrían beneficiarse de la ciencia de datos?
- Cómo adelantarme a mi competencia con la ayuda de Big Data
- ¿Cómo se aplica el big data al marketing de películas?
- Si WhatsApp no almacena mensajes, ¿cómo lo usa Facebook para la minería de datos?