Una de las formas más simples de crear un SE es usar un servicio alojado. Algunas opciones son:
- Búsqueda personalizada de Google: si tiene la intención de buscar en páginas web y está de acuerdo con su nivel de cobertura sobre su contenido. Esta opción también limita su capacidad de definir cuáles son los resultados relevantes y se le deja a la opinión de Google que puede estar o no sincronizada con su intención. (aquí también obtienes anuncios de google y creo que obtienes un recorte en las ganancias). Esta es probablemente la forma más fácil y rápida de hacerlo. http://www.google.com/cse/
- IndexTank: la búsqueda como servicio, tiene una API simple y debe encargarse de indexar sus propios datos. Puede indexar sus propios objetos en lugar de solo páginas web y presentar los resultados de la manera que desee. Es gratis hasta 100K documentos sin ningún anuncio. Es en tiempo real y le brinda mucha flexibilidad para definir su relevancia con considerable facilidad. Tiene muchas más funciones, como Facetado y Geolocalización. (Descargo de responsabilidad: trabajo en IndexTank). Requiere más esfuerzo que GCS, pero sigue siendo lo suficientemente simple y le brinda una flexibilidad mucho mayor. http://indextank.com/
- WebSolr: similar en concepto a IndexTank, son básicamente instancias de Solr en la nube, tiene características similares, excepto para la búsqueda en tiempo real. No tiene planes gratuitos. En mi opinión, requiere más esfuerzo de configuración y mantenimiento que IndexTank, aunque tiene la ventaja de que puede migrar más fácilmente a una solución interna más adelante. http://websolr.com/
También puede configurar cualquiera de las soluciones de código abierto y administrarla usted mismo. Algunas opciones son Solr, Sphinx y ElasticSearch. Aunque esto requiere mucho más esfuerzo, especialmente a medida que sus necesidades comienzan a crecer.
EDITAR: Acabo de notar los comentarios en los que tomas a Quora como el cuerpo objetivo. IndexTank está diseñado para casos de uso como Quora, lo que permite actualizar rápidamente las variables relacionadas con la relevancia. También proporciona clientes javascript para búsqueda rápida ajax, resultados instantáneos (a-la Google) y enlaces instantáneos (a-la Quora)
- ¿Por qué el aprendizaje automático es más difícil en el comercio electrónico?
- ¿Cuáles son las diferencias significativas entre los archivos RAR y ZIP?
- ¿Cuántos datos digitales se pierden cada año?
- ¿Cómo difieren los roles de lingüistas e informáticos en el campo de la PNL?
- Como persona del campo de la medicina interesada en la investigación de inteligencia artificial, ¿cuál es la mejor manera de aprender al respecto?