OK, está describiendo el problema de recuperación clasificada, que es un problema clave en Recuperación de información.
La Introducción a la recuperación de información disponible gratuitamente por Manning, Raghavan y Schutze es una excelente introducción al campo.
Si bien podría implementar su propia implementación de las ideas en el libro,
Apache Lucene es un proyecto de código abierto bien conocido que implementa algoritmos de recuperación de información. Lucene in Action, Second Edition es otro gran libro de texto
que describe tanto la teoría IR como la implementación y uso de Lucene.
- ¿Cómo sugeriría Carlos Matias La Borde que un novato aprenda el aprendizaje automático?
- ¿Cuál es la mejor clase de Machine Learning en Penn?
- ¿Por qué las arquitecturas profundas aprenden representaciones de características cada vez más altas?
- Cómo implementar clustering basado en densidad
- ¿Cuál es la diferencia entre Internet de las cosas y el aprendizaje automático y cuál debo aprender primero?
Sunspot es una biblioteca de Ruby para interactuar con Solr, uno de los motores de búsqueda creados con Lucene.
¡Libera a los clientes! Ruby, Python, PHP, Perl describe un cliente Ruby para Elasticserch, el otro servidor contendiente basado en Lucene.
Creo que esto es suficiente para que comiences.