¿Cómo se pueden combinar las técnicas de minería de texto con los sistemas de recuperación de información?

Gracias por el A2A. La minería de texto y el IR están muy relacionados, y existen numerosos ejemplos de minería de texto utilizados para aumentar los resultados devueltos por IR. Algunos ejemplos en los que puedo pensar de inmediato son los siguientes:

* Desambiguación del sentido de las palabras: por ejemplo, “audífonos” en “audífonos” no busca la enfermedad.
* Detección de errores ortográficos: la forma “correcta” suele ser más frecuente en el texto que la versión mal escrita. Ambos de los anteriores generalmente aparecen como sugerencias “Quiso decir”.
* Búsqueda de frases significativas, por lo que frases como “nueva york” se tratan como una sola unidad para la búsqueda, o la frase “ser o no ser” sobrevive a palabras vacías.
* Detección de entidades en la búsqueda: reconocimiento de nombres de personas o lugares en el texto de búsqueda para tratarlos de manera diferente durante la generación de consultas de búsqueda.
* Detección de idioma de consulta: para los índices de búsqueda en varios idiomas, puede usar el idioma para filtrar o aumentar los resultados en el idioma detectado, y / o reescribir la consulta para ir en contra de un campo específico del idioma.
* Modelado de temas: para la categorización de resultados.
* Sugerencias de consultas relacionadas: puede usar las técnicas de Filtrado colaborativo o Market Basket para implementar esto.

Solo puedo pensar en unos pocos, hay muchos otros ejemplos …

Aprendizaje automáticoCiencia de datosInformacióninformáticaMinería de datosRecuperación deSistemas de información

Related Content

¿Qué trabajos son más abundantes, puestos actuariales o puestos de ciencia de datos? ¿Requiere esto último un título de maestría o superior?

¿Cómo puede un servicio de coincidencia de datos ayudarlo a obtener una ventaja competitiva?

¿Cuál es la parte científica de la ciencia de datos?

¿Cómo es el futuro en Big Data?

¿Qué oportunidades de "big data" serán más rentables?

¿Cuál es la diferencia entre el enrutamiento basado en políticas y la optimización de WAN?

Para la validación cruzada K-fold, ¿qué k se debe seleccionar?

More Interesting

¿Cuáles son las características clave de OLAP y las herramientas de minería de datos y cómo se puede usar para ayudar al descubrimiento del conocimiento?

¿Qué tipo de problemas no puede resolver Data Science?

¿Qué especialización en ciencia de datos es mejor, la de edX o Coursera?

¿Qué pasos se deben tomar para tener una comprensión rigurosa de la ciencia de datos (lado teórico, especialmente)?

¿Qué campo tiene la mayor demanda y salario en los Estados Unidos: ingeniería de datos o ciencia de datos?

¿Qué tipo de método de análisis estadístico usaría para analizar la significación estadística de los datos de 2 variables discretas?

¿Cuál es la diferencia entre una maestría en análisis de negocios y big data y una maestría en ciencia de datos? ¿Qué habilidades necesitas dominar para cada uno?

Se dice que algo que funcionó muy bien con los datos de acciones anteriores puede fallar en el futuro. ¿Cómo es eso? ¿En qué formas exactas serán diferentes los datos futuros?

Cómo agrupar la bandera de un conjunto de datos

Dado que la mayoría del software de procesamiento de flujo de Apache está escrito en Java, ¿debería estudiarlo exclusivamente para Big Data y el campo de transmisión de datos?

¿Cuáles son algunas de las principales conferencias de ciencia de datos y análisis en India?

¿Cuál es el mejor programa de ciencia de datos?

¿Cuáles son algunos proyectos interesantes de Clojure para Big Data y Data Science?

¿Es bueno aprender análisis de datos siendo un desarrollador de Java?

¿Puedo obtener un trabajo como analista de datos si aprendo análisis de datos de Internet?

Web Analytics