¿Cuál es una buena manera de entender un buen descuento?

GTD es una forma de tener en cuenta el hecho de que es posible ver una ficha que no se observó anteriormente, y para hacer esto, disminuimos ligeramente las masas de probabilidad observadas de cada recuento para dejar algunos para los elementos que no se encuentran en su cuerpo de entrenamiento.

Para tener en cuenta Ni = 0, puede suavizar los recuentos ajustándolos a una función y luego usando esa función para estimar lo que no es confiable. Por ejemplo, puede ejecutar una regresión lineal en las entradas de la tabla de recuento (no cero) y devolver la pendiente e interceptar resolviendo la ecuación log (Nc) = b + a * log (c). Con estos valores, puede actualizar (leer: suave) recuentos bajos y poco confiables (por debajo de cierto umbral, por ejemplo, 5) reorganizando la ecuación anterior a Nc = e ^ (a + b * log (c)) y luego resolviendo .

Mire este video para ayudar a entender por qué todo funciona: