El aprendizaje automático se utiliza en casi todas las partes del sistema en los principales motores de búsqueda como Google o Bing. Cualquier cosa que requiera algún tipo de “inteligencia” a menudo se resuelve mediante el aprendizaje automático.
Aquí hay algunos lugares donde el aprendizaje automático se usa en los motores de búsqueda:
- Clasificación de búsqueda : a menudo los motores de búsqueda tienen múltiples fases de clasificación que ocurren en series, como la recuperación inicial, la clasificación primaria, la clasificación contextual, la clasificación personalizada, etc.
- Comprensión de la consulta: el aprendizaje automático se utiliza para casi todo lo que se hace para comprender la consulta de búsqueda escrita por el usuario. Algunos ejemplos de esto:
- Clasificación de consulta : los motores de búsqueda ejecutan varios clasificadores diferentes en la consulta de búsqueda. Por ejemplo, detectar consultas de navegación versus informativas versus transaccionales. O consultas de noticias vs. consultas de intención local vs. consultas de compras, etc.
- Sugerencia de ortografía / corrección
- Sinónimos / Expansión de consulta: los motores de búsqueda usan sinónimos para expandir las palabras clave de consulta y expandir el conjunto de resultados.
- Desambiguación de la intención : por ejemplo, cuando buscas [águilas], ¿es Eagles la banda o Philadelphia Eagles o el pájaro (o los 3)?
- Varias otras facetas con las que puede interpretar una consulta
- Comprensión de url / documento: Esto incluye todo lo que se hace para comprender una url, es decir, un resultado de búsqueda. Esto a menudo se hace cuando el motor de búsqueda rastrea / indexa la url. Algunos ejemplos de esto:
- Clasificación de página: comprender qué tipos de página es. Por ejemplo, blog vs. sitio de noticias vs. foro, etc.
- Detección de spam
- Basura / detección de URL de baja calidad
- Análisis de los sentimientos
- Detección de entidad / relación: detección de entidades, como personas o lugares en el contenido de la página. Descubrir las relaciones entre entidades.
- … y varias otras facetas con las que puedes interpretar una url
- Generando otro contenido que los motores de búsqueda muestran como:
- Enlaces de sitio
- Búsquedas relacionadas
- Datos del gráfico de conocimiento (para algunos motores de búsqueda)
- Los rastreadores utilizan el aprendizaje automático para determinar la frecuencia óptima para rastrear una URL particular en función de su importancia, la frecuencia con la que se actualiza, etc.
- Clasificación del usuario : averiguar qué tipo de usuario es usted. Esto es especialmente útil para la búsqueda personalizada.
Esto solo está rascando la superficie. En lugares como Google y Bing, con cientos de personas trabajando en el aprendizaje automático, la lista real es mucho más larga.
- ¿Cuál es el mejor lenguaje para el procesamiento del lenguaje natural?
- ¿Tengo que escuchar el curso de aprendizaje automático Coursera de Andrew Ng?
- ¿Cuáles son todas las formas en que Quora usa el procesamiento del lenguaje natural (PNL)?
- ¿Cómo y por qué funciona la estimación de contraste de ruido?
- ¿Dónde se pueden encontrar videos de Udacity Machine Learning Nanodegree gratis?