¿Cuál sería un buen problema de recomendación de Kaggle para elegir como un proyecto corto?

No creo que haya ningún proyecto activo de Kaggle que pueda calificar. Entre las competiciones cerradas, además de los buenos ejemplos ya mencionados, está el R Package Evaluation Engine, que se enmarca explícitamente como un problema de recomendación (con una pequeña base de usuarios en el conjunto de entrenamiento, por lo que es probable que sea mejor modelarlo como un recomendador basado en contenido, aprovechando los metadatos, que como un motor CF).

Además, el Hackathon de minería de datos en el sitio web móvil Best Buy de BIG DATA (7GB) (o su hermano menor) también podría calificar. Estrictamente hablando, es un problema de predicción (“predice en qué producto estará más interesado un usuario que visite el sitio móvil de Best Buy”), pero podría considerarlo un recomendador (“recomendar el mejor producto para el usuario visitante”) y salirse con la suya . La frontera entre la predicción y la recomendación a veces radica más en cómo evalúa los resultados que en el algoritmo en sí.

El Desafío del motor de recomendación de eventos es interesante debido a la cantidad de datos ruidosos que no son relevantes.

More Interesting

¿Cuáles son las ventajas de ser un científico de datos?

¿Hay alguna manera de que podamos incorporar la genómica y las imágenes médicas a la ciencia de datos como postgrado?

¿Cómo funciona Elasticsearch? ¿Y cómo funciona para la minería de datos y big data?

¿En qué se diferencia el desarrollo de software de aprendizaje automático industrial orientado a productos de la investigación académica de aprendizaje automático o el desarrollo de prototipos de investigación industrial?

¿Cuál es la parte científica de la ciencia de datos?

¿Dónde encuentras datos? Entonces, ¿cómo lo usas?

¿Cuáles son algunas buenas técnicas o herramientas de visualización de datos además de Tableau que uno debe aprender para comenzar su carrera en el campo de la visualización?

¿Cómo podemos tratar las variables categóricas con muchos niveles (> 100) de manera eficiente en una regresión? ¿Qué métodos hay para reducir la cantidad de niveles?

Mientras se construye un modelo de datos predictivos, ¿el tratamiento para valores perdidos y valores atípicos debe realizarse tanto en los conjuntos de datos de entrenamiento como de prueba?

¿Cuál es el alcance de la ciencia de datos con Python?

Cómo pasar mi carrera de consultor MDM al análisis de datos

¿Qué carrera puede tener un analista de datos en el futuro? Después de años de minería de datos, ¿qué papel puede tomar el analista de datos?

¿Cómo ayuda la limpieza de datos a expirar datos y clientes potenciales pobres?

¿Sería difícil hacer una aplicación que tome fotos de partituras y las reproduzca en el instrumento elegido?

¿Qué hace el equipo de datos en Addepar?