¿Cómo calcula Google los sinónimos de los términos en una consulta de búsqueda?

Es casi seguro que mediante el uso de una base de datos léxica, que, si se imprimiera y se convirtiera en un libro, se parecería a un tesauro.

Una base de datos léxica contiene una categoría léxica para cada una de sus palabras, como sustantivo, verbo, adjetivo (a veces verá las tesis denominadas partes del discurso). Cada entrada de palabras también incluye una lista de sinónimos (palabras con significado equivalente).

También se almacenan las relaciones semánticas entre diferentes palabras o conjuntos de palabras, esto permite que se representen jerarquías de significado, como un automóvil es un tipo de vehículo que está relacionado con conceptos en el transporte.

Los idiomas cambian lentamente y las conexiones entre palabras se comprenden bien, lo que permite crear bases de datos léxicas como gráficos con conexiones entre palabras relacionadas. Los gráficos proporcionan adyacencia sin índice, lo que significa buscar algo así como un sinónimo, simplemente sigue las conexiones a los nodos vecinos; lo que los hace muy rápidos de consultar.

Si desea obtener más información, la base de datos léxica más conocida de WordNet está disponible gratuitamente. Te sorprenderá lo inteligente que puedes hacer un sistema tonto al usarlo …