¿Cuál sería la mejor manera de integrar el algoritmo de aprendizaje para clasificar en Solr?

Su pregunta muestra su tarea: se prefiere Solr sobre ES donde la relevancia avanzada y el trabajo de IR están en juego. ES es un poco más productivo y está listo para instalarse y ejecutarse.

Sin embargo, tendrá que profundizar en Java para hacer esto, y más profundo de lo que yo he ido. Por lo tanto, mi respuesta puede no ser tan útil como esperabas. Lucene / Solr ahora admite BM25, y al observar las diferencias de código entre la puntuación TF-IDF y la puntuación BM25 determinará las clases a implementar para un nuevo algoritmo de puntuación. Cualquiera puede registrarse para obtener una cuenta en el sistema de seguimiento de errores JIRA para Apache Software Foundation. A partir de ahí, puede encontrar problemas para la puntuación BM25 y hacer un seguimiento de eso para codificar.

Además, si tiene algo de dinero para gastar en esto, puede inscribirse en un curso de desarrollador de LucidWorks en Solr / Lucene y profundizar.

También le sugiero que siga una disciplina de ingeniería de software antes de comenzar a codificar:

Compruébalo desde subversion
Aprende a construirlo
Aprende a construir el javadoc
Asegúrese de saber cómo ejecutar el conjunto de pruebas

Ahora, estás listo para sumergirte y probarlo. Aquí hay un enlace muy antiguo a Javadoc:

org.apache.lucene.search (Lucene 2.9.4 API)

Y otro para la relevancia BM25:

BM25 La próxima generación de relevancia de Lucene

La wiki de confluencia, Guía de referencia de Apache Solr, se utiliza para crear una guía de usuario. Este tipo de trabajo, aunque la documentación está dispersa, es mejor ayudado por el antiguo wiki Moin-moin – FrontPage – Solr Wiki.

AlgoritmosAprendizaje automáticoInteligencia ArtificialRecuperación de información

Related Content

Algoritmos: ¿Qué es el árbol utópico?

¿Cómo funcionan los algoritmos genéticos en la programación?

¿Cuáles son los temas de doctorado en estructuras de datos y análisis?

¿Por qué utilizar el árbol de búsqueda ternario en lugar de reemplazar cada nodo de Trie a un árbol BST?

¿Cómo demostró Alan Turing que solo seis operaciones primitivas se pueden usar para realizar cualquier operación matemática?

¿Es necesario investigar durante la licenciatura para ingresar a un programa de maestría en Ciencias de la Computación?

¿Cuáles son algunos de sus mejores algoritmos de C ++ o C que está orgulloso de haber escrito?

En general, es fácil manejar LTR fuera de SOLR. Usted toma los documentos N principales clasificados por SOLR y los pasa a su modelo LTR para volver a clasificar esos documentos.

Parece que la función LTR está integrada en SOLR a partir de la versión 6.4. Sin embargo, gran parte de la extracción / modelado de características aún debe realizarse fuera de línea y subirse a SOLR.

Refiera esto Aprender a clasificar

Gavin Ruddy

Aquí hay una estructura básica que solía hacerlo:

de Better Search: complemento de filtro de clic: una herramienta flexible para impr …

Para obtener más detalles, consulte las presentaciones vinculadas en {! Ctf}

Espero que esto ayude.

Kirubakumaresh Rajendran

More Interesting

¿Cómo puede el paralelismo mejorar el algoritmo de fuerza bruta?

¿Un cerebro humano tiene un algoritmo? Si se descifran los algoritmos del cerebro humano, ¿qué sucede? ¿Se usa en inteligencia artificial?

Cómo hacer un método que devuelva un arrayList que ha ordenado el número de Strings en cada fila del archivo

Si la compresión sin pérdida es completamente reversible, ¿por qué no omitimos un paso y solo usamos los archivos en su estado comprimido?

Cómo analizar la complejidad temporal del algoritmo MST de prims

¿Cuál es la diferencia entre O (n!) Vs O (2 ^ n) complejidad de tiempo?

¿Qué algoritmo se usa para comprimir todos los tipos de archivos (es decir, archivos de imagen, texto, audio, video)?

¿Aprender las estructuras de datos y las matemáticas será una "reinvención de la rueda"?

Quiero aprender más sobre algoritmos, pero no sé por dónde empezar. ¿Me puede dar algunas instrucciones o consejos? Gracias.

¿Cómo mejoro mis habilidades informáticas? ¿Alguien puede recomendarme formas de acortar la curva de aprendizaje?

¿Cómo funciona la transformación cuántica de Fourier?

¿Debo aprender C ++ ahora que sé cómo implementar algoritmos básicos de ML en Python, o debería seguir con scikit-learn?

¿Dónde puedo encontrar el código fuente de los algoritmos de Data Science?

¿Cuáles son los conceptos de software que todo programador debe saber?

Cómo calcular la O grande de: for (int k = 2; k <floor (sqrt (n)); k ++)

Web Analytics