¿Qué es un motor de búsqueda de código abierto?

En primer lugar, dudo si hubieras usado un motor de búsqueda de código abierto a menos que uses Linux o estés en el campo de investigación.

Ninguno de los grandes motores de búsqueda web es de código abierto. Para repetir lo que dijo John Linn:

El código abierto simplemente significa que el código fuente (programación) está disponible para que cualquiera pueda usarlo y modificarlo como lo desee.

Los motores de búsqueda como Lucene [1], Nutch [2], Terrier [3], Xapian [4] y otros son ejemplos de motores de búsqueda de código abierto. Todos le permiten cambiar el código del proceso de recuperación y clasificación.

[1] lucene.apache.org/core/
[2] http://nutch.apache.org/
[3] http://terrier.org/
[4] http://xapian.org/

Muchos motores de búsqueda le permiten cambiar la configuración con respecto a la clasificación y utilizar información personal para personalizar los resultados, pero solo los motores como los anteriores realmente le permiten cambiar el código (y romperlo).

Pros:
1. Si eres un estudiante de Recuperación de Información, los motores de código abierto te permiten modificar el código y aprender qué cambios ocurren como resultado.
2. Si desea realizar una investigación independiente sobre algoritmos de búsqueda, puede descargar el código e implementarlo usted mismo.
3. Si tiene algunos datos que deben clasificarse, es decir, si tiene una tarea de búsqueda privada, estos motores de búsqueda son las mejores formas gratuitas.

Contras:
1. No tienen ninguna garantía, por lo que no puede usarlos en entornos de misión crítica.
2. En la búsqueda web, una razón importante para el éxito de los grandes motores de búsqueda es que tienen un amplio rastreo de la web. Pero si está buscando solo, entonces probablemente comenzará desde el cuadrado 1 en el rastreo.
3. Si no tiene habilidades de programación, es mejor dejar estos motores solos. Todos ellos requieren configuraciones manuales que deben cambiarse.
4. Los algoritmos que se implementan son realizados por la comunidad. Entonces, no todos los que pueda necesitar estarán presentes. Es posible que deba agregar los algoritmos de clasificación, especialmente si su investigación es nueva. Sin embargo, puede usar la API del motor para varios módulos.

El código abierto simplemente significa que el código fuente (programación) está disponible para que cualquiera pueda usarlo y modificarlo como lo desee.

La mayoría de las personas que usan programas de código abierto (procesamiento de texto, hojas de cálculo, gráficos, editor de audio, etc.) nunca acceden al código subyacente para modificarlo. En cambio, simplemente lo usan en la forma provista que se ejecuta en su computadora.

Por supuesto, la búsqueda de Google es de uso gratuito, pero Google retiene y protege el código informático subyacente. Es copia escrita.