Hay un montón de documentos de personas de Microsoft Research, Yahoo, Google y Baidu (pista: personas con acceso ilimitado a los registros de consultas) que usan registros de consultas para extraer sinónimos y, en general, paráfrasis y otras relaciones semánticas. Algunos de estos documentos tratan sobre la expansión de consultas, que es básicamente otra forma de decir “extracción de sinónimos”. Hablo de un montón de estos documentos en mi encuesta:
Nitin Madnani y Bonnie J. Dorr. Generando paráfrasis de frases y frases: Una encuesta de métodos basados en datos. Comput Lingüista. 36, 3 341-387.
Aquí hay algunos otros documentos que pude encontrar en mi archivo bib:
- ¿Cómo puede un joven de 16 años comenzar a aprender sobre el aprendizaje automático?
- ¿Hay proveedores de reconocimiento de voz que aún brinden soluciones de servidor en las instalaciones (no en la nube) en 2017?
- ¿Se pueden utilizar bosques aleatorios para la selección de variables? De ser así, ¿cómo?
- ¿Qué valor cree que tiene la selección de funciones en el aprendizaje automático? ¿Cuál crees que mejora más la precisión, la selección de características o la ingeniería de características?
- Cómo entrenar a cualquier clasificador basado en características de texto en un documento EMR
1. Ricardo Baeza-Yates y Alessandro Tiberi. 2007. Extracción de relaciones semánticas de registros de consultas. En Actas de la 13ª conferencia internacional ACM SIGKDD sobre descubrimiento de conocimiento y minería de datos (KDD ’07).
2. Hang Cui, Ji-Rong Wen, Jian-Yun Nie y Wei-Ying Ma, Expansión de consultas probabilísticas utilizando registros de consultas, Acta de la Undécima conferencia de la World Wide Web (WWW 2002), 325-332, Honolulu, Hawaii, mayo, 2002
3. Paul: Alexandru Chirita, Claudiu S. Firan y Wolfgang Nejdl. 2007. Expansión personalizada de consultas para la web. En Actas de la trigésima conferencia anual internacional ACM SIGIR sobre Investigación y desarrollo en recuperación de información (SIGIR ’07).
4. Shiqi Zhao, Haifeng Wang y Ting Liu. 2010. Parafraseando con registros de consultas de motores de búsqueda. En Actas de la 23ª Conferencia Internacional de Lingüística Computacional (COLING ’10).
5. Stefan Riezler y Yi Liu. Reescritura de consultas mediante traducción automática estadística monolingüe. Comput Lingüista. 36, 3 569-582.