Es difícil tener una comparación significativa de las medidas de similitud sin la verdad básica.
La verdad fundamental puede ser un conjunto de datos que contenga las verdaderas medidas de similitud entre los elementos, que a menudo es curada / evaluada por humanos [1]. Con estos conjuntos de datos, puede comparar fácilmente el rendimiento de diferentes medidas de similitud.
Cuando los conjuntos de datos curados / evaluados por humanos son difíciles de obtener, puede obtener la verdad fundamental de los comentarios de los usuarios reales. Por ejemplo, cuando se construye un sistema para recomendar que se conecten nuevos usuarios (la función Personas que quizás conozcas en Facebook o LinkedIn), se pueden experimentar diferentes medidas de similitud de usuarios y la que conduce al mejor rendimiento del sistema (CTR, o cualquier métrica personalizada) ) se considera el mejor [2].
- ¿Cómo pudo Mark Zuckerberg implementar algoritmos de aprendizaje automático a la edad de 14 años?
- ¿Qué se entiende por el término "ejemplos adversos" en el aprendizaje automático?
- ¿Cómo debe comenzar un principiante con la investigación en Machine Learning?
- ¿Cuán relevantes son las redes neuronales atractoras en la investigación actual del aprendizaje automático?
- ¿Cuál es la mejor herramienta de aprendizaje automático para Mac OS?
- La evaluación de las medidas de similitud de oraciones
- Evaluación de medidas de similitud: un estudio a gran escala en la red social de Orkut