Cómo decidir entre aprender un modelo para cada usuario o un modelo único a partir de todos los datos

Creo que hay una consideración práctica (¿puedes manejar el entrenamiento y la predicción con tantas redes neuronales?) Y una consideración teórica (es decir, un solo modelo da mejores o peores predicciones que muchos modelos). Siempre preferiría usar un solo modelo desde un punto de vista práctico.

Si le preocupa el rendimiento predictivo, hay formas de hacer que un solo modelo sea específico para el usuario. Quizás el ejemplo más claro de esto es [1], donde el hashing de características se usa para aprender un modelo único que implementa un clasificador de spam específico para el usuario. Tenga en cuenta que este enfoque tiene la ventaja de compartir información entre los usuarios, de modo que incluso puede obtener buenas predicciones cuando no hay datos disponibles para un usuario.

[1] Weinberger, Kilian y col. “Función hash para el aprendizaje multitarea a gran escala”. Actas de la 26ª Conferencia internacional anual sobre aprendizaje automático. ACM, 2009.

More Interesting

¿El aumento de Big Data obstaculizará el progreso de la investigación matemática?

Cómo implementar Data Compression + Denoising usando Machine Learning

¿Existe alguna metodología como OOP que guíe cómo diseñar un software de procesamiento de datos?

Ciencia de datos: ¿Se puede utilizar el aprendizaje automático para el análisis de series temporales?

¿Cuál es la diferencia entre ciencia de datos, análisis de datos, minería de datos, aprendizaje automático, inteligencia artificial y big data?

¿Existe una comunidad de ciencia de datos en Egipto?

¿Qué es la dependencia de datos?

¿Cuál es la forma más rápida de realizar un EDA en un conjunto de datos con más de 100 variables?

¿Qué es un lago de datos en el contexto de big data?

¿Cómo debería un principiante aprender de un libro técnico que diga "Ciencia de datos desde cero"? ¿Debería completarlo una vez y luego volver a comprender temas complejos, o debería comprender profundamente cada tema antes de continuar y así retrasar la finalización?

¿Cuál es el mejor marco de Python para el procesamiento en paralelo (procesamiento SMP y de clúster)?

¿En cuántas dimensiones (Vs) se define comúnmente Big Data?

¿Cuáles son algunas buenas técnicas o herramientas de visualización de datos además de Tableau que uno debe aprender para comenzar su carrera en el campo de la visualización?

¿Algunos físicos usan Excel para el análisis de datos?

¿Cuál es el mejor instituto en Pune para AngularJS y data science?