¿Cuáles son algunos de los usos del aprendizaje automático en los motores de búsqueda?

El aprendizaje automático se utiliza en casi todas las partes del sistema en los principales motores de búsqueda como Google o Bing. Cualquier cosa que requiera algún tipo de “inteligencia” a menudo se resuelve mediante el aprendizaje automático.

Aquí hay algunos lugares donde el aprendizaje automático se usa en los motores de búsqueda:

  1. Clasificación de búsqueda : a menudo los motores de búsqueda tienen múltiples fases de clasificación que ocurren en series, como la recuperación inicial, la clasificación primaria, la clasificación contextual, la clasificación personalizada, etc.
  2. Comprensión de la consulta: el aprendizaje automático se utiliza para casi todo lo que se hace para comprender la consulta de búsqueda escrita por el usuario. Algunos ejemplos de esto:
    1. Clasificación de consulta : los motores de búsqueda ejecutan varios clasificadores diferentes en la consulta de búsqueda. Por ejemplo, detectar consultas de navegación versus informativas versus transaccionales. O consultas de noticias vs. consultas de intención local vs. consultas de compras, etc.
    2. Sugerencia de ortografía / corrección
    3. Sinónimos / Expansión de consulta: los motores de búsqueda usan sinónimos para expandir las palabras clave de consulta y expandir el conjunto de resultados.
    4. Desambiguación de la intención : por ejemplo, cuando buscas [águilas], ¿es Eagles la banda o Philadelphia Eagles o el pájaro (o los 3)?
    5. Varias otras facetas con las que puede interpretar una consulta
  3. Comprensión de url / documento: Esto incluye todo lo que se hace para comprender una url, es decir, un resultado de búsqueda. Esto a menudo se hace cuando el motor de búsqueda rastrea / indexa la url. Algunos ejemplos de esto:
    1. Clasificación de página: comprender qué tipos de página es. Por ejemplo, blog vs. sitio de noticias vs. foro, etc.
    2. Detección de spam
    3. Basura / detección de URL de baja calidad
    4. Análisis de los sentimientos
    5. Detección de entidad / relación: detección de entidades, como personas o lugares en el contenido de la página. Descubrir las relaciones entre entidades.
    6. … y varias otras facetas con las que puedes interpretar una url
  4. Generando otro contenido que los motores de búsqueda muestran como:
    1. Enlaces de sitio
    2. Búsquedas relacionadas
    3. Datos del gráfico de conocimiento (para algunos motores de búsqueda)
  5. Los rastreadores utilizan el aprendizaje automático para determinar la frecuencia óptima para rastrear una URL particular en función de su importancia, la frecuencia con la que se actualiza, etc.
  6. Clasificación del usuario : averiguar qué tipo de usuario es usted. Esto es especialmente útil para la búsqueda personalizada.

Esto solo está rascando la superficie. En lugares como Google y Bing, con cientos de personas trabajando en el aprendizaje automático, la lista real es mucho más larga.

Aquí hay una implementación usando elasticsearch y angularjs. Complementará bien todas las explicaciones – Cómo construir un motor de búsqueda: Parte 1 – Blogs de Machine Learning

Descargo de responsabilidad: soy el autor de la serie

More Interesting

¿Qué es la optimización de colonias de hormigas y cómo funciona en términos simples?

Cómo usar el aprendizaje automático para unir un patrón a partir de valores CSV

¿Hay alguna API basada en la nube para agrupar Tweets?

Estoy interesado en el aprendizaje automático y la inteligencia artificial y recién comencé a aprender Python. ¿Qué otras habilidades debo tener en mi haber para tener éxito en este campo?

¿Cómo afecta el término de regularización a la constante de Lipschitz en la minimización empírica regularizada del riesgo?

¿Cómo cambio de una carrera de software integrado a una carrera en aprendizaje automático?

¿Qué consejo daría Yoshua Bengio a los jóvenes investigadores que ingresan al campo del aprendizaje automático?

¿Cómo se ajustan los pesos en una red neuronal mientras estoy entrenando la red?

¿Cuál es la diferencia entre regresión, clasificación y agrupamiento en el aprendizaje automático?

¿Cuál es la diferencia entre el aprendizaje automático, el procesamiento del lenguaje natural, el aprendizaje profundo y la visión por computadora?

¿Cómo podemos hacer que las redes profundas funcionen de manera eficiente en dispositivos de baja potencia (por ejemplo, teléfonos)?

¿Cuáles son las diferencias entre big data, hadoop y colmena? ¿Son solo jergas con el mismo significado? ¿Puedes resumir en detalle?

¿Cuál es la diferencia entre redes neuronales y de creencias?

Como principiante en el procesamiento del lenguaje natural, ¿desde dónde debo comenzar?

¿Cuáles son las deficiencias del aprendizaje profundo? ¿Cuál es el mayor defecto o limitación del aprendizaje profundo?