Para un modelo por pares, normalmente genera pares a partir de clics. Específicamente, si un usuario hace clic en el resultado en el rango k> 1, usted genera el ejemplo de entrenamiento de que el resultado en la posición k es mejor que el resultado en la posición k-1. Hay más matices, pero espero que entiendas la idea general.
Tal vez se pregunte cómo entrena un sistema de este tipo antes de construirlo. Podrías usar juicios humanos explícitos. Pero el enfoque típico es recopilar datos de entrenamiento de los clics en un sistema sintonizado a mano (es decir, no aprendido por la máquina) que es lo suficientemente bueno como para ponerlo frente a sus usuarios mientras genera y registra los vectores de características para completar sus datos de entrenamiento.
Y los matices importan. Cualquier función aprendida de los clics estará sujeta a sesgos de presentación. Los clics no son señales perfectas de relevancia. Y la suposición de que hacer clic en un resultado implica preferencia por él sobre el resultado anterior es solo un modelo.
- Como ingeniero de ML en Quora, ¿alguna vez ha implementado un artículo de investigación en aprendizaje automático para resolver un problema técnico o de producto?
- ¿Por qué debería uno aprender el aprendizaje automático desde cero en lugar de aprender a usar las bibliotecas disponibles?
- ¿Cuál es la diferencia entre validación y validación cruzada?
- ¿Cuál es la diferencia entre IA, aprendizaje automático y aprendizaje profundo?
- Cómo implementar el aprendizaje sensible al costo en TensorFlow para penalizar la clasificación errónea en clases minoritarias (los datos tienen un problema de desequilibrio de clase)
No obstante, la clasificación de aprendizaje automático ha tenido mucho éxito en la práctica.