¿Cuáles son algunos buenos documentos sobre la extracción de sinónimos de los registros de consultas?

Hay un montón de documentos de personas de Microsoft Research, Yahoo, Google y Baidu (pista: personas con acceso ilimitado a los registros de consultas) que usan registros de consultas para extraer sinónimos y, en general, paráfrasis y otras relaciones semánticas. Algunos de estos documentos tratan sobre la expansión de consultas, que es básicamente otra forma de decir “extracción de sinónimos”. Hablo de un montón de estos documentos en mi encuesta:

Nitin Madnani y Bonnie J. Dorr. Generando paráfrasis de frases y frases: Una encuesta de métodos basados ​​en datos. Comput Lingüista. 36, 3 341-387.

Aquí hay algunos otros documentos que pude encontrar en mi archivo bib:

1. Ricardo Baeza-Yates y Alessandro Tiberi. 2007. Extracción de relaciones semánticas de registros de consultas. En Actas de la 13ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos (KDD ’07).

2. Hang Cui, Ji-Rong Wen, Jian-Yun Nie y Wei-Ying Ma, Expansión de consultas probabilísticas utilizando registros de consultas, Acta de la Undécima conferencia de la World Wide Web (WWW 2002), 325-332, Honolulu, Hawaii, mayo, 2002

3. Paul: Alexandru Chirita, Claudiu S. Firan y Wolfgang Nejdl. 2007. Expansión personalizada de consultas para la web. En Actas de la trigésima conferencia anual internacional ACM SIGIR sobre Investigación y desarrollo en recuperación de información (SIGIR ’07).

4. Shiqi Zhao, Haifeng Wang y Ting Liu. 2010. Parafraseando con registros de consultas de motores de búsqueda. En Actas de la 23ª Conferencia Internacional de Lingüística Computacional (COLING ’10).

5. Stefan Riezler y Yi Liu. Reescritura de consultas mediante traducción automática estadística monolingüe. Comput Lingüista. 36, 3 569-582.

Es poco probable que esto se considere “bueno” según sus estándares, pero aquí está de todos modos: el primer trabajo de investigación que escribí durante una pasantía en un inicio de búsqueda en Alemania.

O. Medelyan, 2004. Uso de registros de consultas como corpus En: Proc. de la Conferencia de Estudiantes en la Escuela Europea de Verano sobre Lógica, Lenguaje e Información ESSLLI 2004 , Nancy, Francia.

El título muestra que, tal vez ingenuamente, me sorprendió que haya tan poca investigación sobre este tema, dada la utilidad de los registros de consultas. Pronto me di cuenta de que es muy difícil conseguirlo.

Los registros de consultas en este documento solo contenían las consultas, es decir, no hay información sobre sesiones o clics, lo que sería aún más efectivo. Creo que hay más documentos sobre eso …

More Interesting

¿Alguien puede presentar un tutorial o un documento sobre cómo elegir el valor de 'C' en la función de regresión logística scikit-learn?

¿Es posible crear un filtro adaptativo usando una red neuronal para que después del entrenamiento pueda filtrar la señal ruidosa y dar la salida deseada?

En weka, ¿qué significan las cuatro opciones de prueba y cuándo las usa?

¿Cuáles son algunos de los desafíos y oportunidades sobresalientes en el análisis predictivo con respecto a la privacidad y la propiedad de los datos, el análisis de los datos del usuario, el escalado de algoritmos y los ecosistemas e intercambios de datos emergentes?

Cómo leer esta arquitectura de red neuronal convolucional

¿Cómo es usar Theano en Python?

Qué rama es mejor en THAPAR UNIVERSITY: Computer Science Core (COE) o Hons. ¿En el aprendizaje automático y el análisis de datos (CML)?

¿Las redes neuronales convolucionales construyen simetrías locales o globales?

¿El aprendizaje de transferencia es adecuado para modelos que pueden tener características de entrada crecientes?

Cómo aprender machine learning para construir startups

¿Cuáles serán los 3 principales problemas de aprendizaje profundo en los próximos 5 años?

¿Qué es un proceso gaussiano?

¿Cuáles son algunos buenos documentos sobre la extracción de sinónimos de los registros de consultas?

¿Por qué es importante aprender el descenso de gradiente en el aprendizaje automático?

¿Por qué las variedades son importantes para el aprendizaje profundo o el aprendizaje de refuerzo profundo?