¿Cómo obtienen las empresas datos de capacitación para implementar el aprendizaje para clasificar algoritmos, especialmente en el contexto de búsqueda?

Para un modelo por pares, normalmente genera pares a partir de clics. Específicamente, si un usuario hace clic en el resultado en el rango k> 1, usted genera el ejemplo de entrenamiento de que el resultado en la posición k es mejor que el resultado en la posición k-1. Hay más matices, pero espero que entiendas la idea general.

Tal vez se pregunte cómo entrena un sistema de este tipo antes de construirlo. Podrías usar juicios humanos explícitos. Pero el enfoque típico es recopilar datos de entrenamiento de los clics en un sistema sintonizado a mano (es decir, no aprendido por la máquina) que es lo suficientemente bueno como para ponerlo frente a sus usuarios mientras genera y registra los vectores de características para completar sus datos de entrenamiento.

Y los matices importan. Cualquier función aprendida de los clics estará sujeta a sesgos de presentación. Los clics no son señales perfectas de relevancia. Y la suposición de que hacer clic en un resultado implica preferencia por él sobre el resultado anterior es solo un modelo.

No obstante, la clasificación de aprendizaje automático ha tenido mucho éxito en la práctica.

More Interesting

¿Cuáles podrían ser las características posibles para detectar fraude en transacciones en cajeros automáticos?

¿Cuáles son algunos documentos académicos de aprendizaje automático notables / influyentes en los últimos 5 años?

Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST

¿Cómo combinaría Apache Spark y CUDA para implementar un marco de aprendizaje profundo?

Como desarrollador web junior sin una sólida base matemática, ¿qué enfoques debo tomar para dominar el aprendizaje automático y aplicarlo al mundo empresarial? Acabo de empezar a estudiar la "Introducción al álgebra lineal" de Gilbert Strang.

¿Hay alguien aquí que pueda darme una lib correcta para R-Tree en Java?

¿Cómo puedo hacer que mi computadora esté disponible para Google, Quora, Facebook, para poder contribuir a sus tareas de aprendizaje automático durante el tiempo de inactividad?

¿Qué papel juegan las redes neuronales y el aprendizaje automático en la atención médica?

¿Qué algoritmo usar en la clasificación de la cobertura del suelo?

¿Qué significa para una red neuronal ser entrenada de extremo a extremo?

¿Cuáles son los algoritmos de aprendizaje automático adecuados para Big Data o análisis en tiempo real?

¿Por qué el escalado es importante para la clasificación SVM lineal?

¿Es la informática de alto rendimiento un conocimiento esencial para el aprendizaje profundo dado que se trata de una gran red neuronal?

¿Qué piensa Andrew Ng sobre Deep Learning?

Cómo hacer ingeniería de características en aprendizaje automático