¿Qué algoritmos se utilizan para el proceso de aprendizaje automático de Yandex?

Recientemente, Yandex lanzó el algoritmo CatBoost [1] ( refuerzo categórico).

CatBoost aumenta el gradiente en la biblioteca de árboles de decisión con soporte de características categóricas listo para usar . El lanzamiento muestra que los gigantes todavía usan los algoritmos clásicos de aprendizaje automático y no solo las técnicas de aprendizaje profundo. Es bien sabido que las redes neuronales son especialmente buenas para procesar datos homogéneos, pero cuando los datos son heterogéneos que consisten en características numéricas y categóricas, entra en juego un buen refuerzo de gradiente antiguo.

Actualmente se implementan los soportes Python y R. Puede encontrar los resultados de la comparación en diferentes conjuntos de datos en la página de puntos de referencia [2]. Yandex está utilizando CatBoost para mejorar los resultados de búsqueda, clasificar las recomendaciones para Yandex.Dzen y predecir el clima.

Notas al pie

[1] CatBoost

[2] catboost / puntos de referencia