¿Cuáles son las mejores prácticas en torno al aprendizaje automático y los sistemas de recomendación para sitios de trabajo?

La clave para un buen sistema de recomendación de trabajo es combinar 3 bits de información. Las preferencias explícitas del usuario, el análisis / comportamiento implícito de los usuarios y todos los datos sobre sus pares. Por lo tanto, querrá comenzar permitiendo que los usuarios se suscriban o prefieran diferentes aspectos de su búsqueda de empleo. Ejemplos comunes incluyen guardar búsquedas de trabajo o permitir que los usuarios prefieran diferentes tipos de trabajos. (IE, estoy buscando trabajos de diseño en Nueva York, o programación de Ruby en SF). El segundo paso es rastrear con qué se comprometen realmente los usuarios. Entonces, si un usuario abre su correo electrónico y hace clic en una publicación de trabajo de Google que le dice algo. Todos estos eventos combinados le permiten crear un perfil de los intereses de un usuario. El último y tercer paso es analizar el comportamiento de los compañeros. Si los usuarios con un perfil similar se involucran con 1 trabajo con más frecuencia que otros trabajos en su sitio, querrá priorizar ese trabajo en sus recomendaciones. Estos 3 elementos combinados le permiten crear un poderoso ciclo de retroalimentación. Cada vez que el usuario vuelve a su sitio, usted aprende un poco más sobre ellos y las recomendaciones pueden mejorar. Gran parte de la mejor tecnología de personalización fue creada por sitios como Quora. Es sorprendente lo buenas que son sus recomendaciones para el resumen semanal de correo electrónico.

Sin necesidad de saber nada más, un buen enfoque de aprendizaje automático para combinar todos estos datos sería la factorización de matriz híbrida. Una gran biblioteca para comenzar es LightFM. Le permite combinar contenido y técnicas de filtrado colaborativo. Al agregar los datos explícitos recopilados anteriormente sobre usuarios individuales como características de usuario (Contenido) y completar la matriz de elementos de usuario con características implícitas, se puede construir un modelo poderoso que no solo mejora la mayor participación de los usuarios, sino que puede manejar el problema de arranque en frío gracias al contexto adicional que lo proporcionó. Incluso podría agregar características de elementos si sus trabajos fueron etiquetados, o etiquetarlos automáticamente utilizando técnicas de PNL como la asignación de Dirichlet Latente.

Soy científico de datos en Stream y hemos escrito sobre nuestro enfoque del aprendizaje automático y las recomendaciones para los sitios de trabajo aquí: https://getstream.io/blog/person…

More Interesting

¿Qué es la entropía cruzada en palabras fáciles?

¿Dónde puedo encontrar un conjunto de datos de texto traducido de cualquier idioma a otro válido para ser entrenado en un modelo de traducción automática en aprendizaje automático?

¿Cuáles son las ventajas de las máquinas de vectores de soporte (SVM) en comparación con la regresión lineal o la regresión logística?

¿Cuáles son los pasos básicos del procesamiento de texto en el procesamiento del lenguaje natural para la similitud de texto?

¿Los grandes ingenieros de aprendizaje automático siempre leen nuevos trabajos de investigación sobre ML?

¿Existe algún proyecto de código abierto que implemente algoritmos de aprendizaje profundo que aproveche la enorme potencia informática paralela de la GPU?

¿Cuántas imágenes se requieren para las redes adversas generativas (GAN)?

¿Cuáles son las ventajas y desventajas de cada método de regresión no lineal existente?

¿Qué tan cerca estamos del punto donde los radiólogos serán reemplazados por software de reconocimiento de imágenes / redes neuronales / IA?

¿Es posible entrenar modelos de aprendizaje automático de procesamiento de datos en dispositivos locales y enviar solo el modelo entrenado al servidor?

¿Cuál es la mejor manera de encontrar análisis de sentimientos?

¿Cuáles son algunas preguntas abiertas relacionadas con bandidos multibrazos?

¿Cuál es una buena distribución para usar para simular un conjunto de entrenamiento para la clasificación supervisada?

¿Cómo se puede minimizar el riesgo regularizado utilizando métodos bayesianos?

¿Es posible o hay algún documento sobre el ajuste de hiperparámetros usando aprendizaje de refuerzo o regresión?