Una distribución beta-binomial es una buena manera de suavizar los clics.
Definamos algunos términos:
V: número de veces que se ve el artículo
C: número de veces que se hace clic en el elemento
P (C | V): la probabilidad real subyacente de que un usuario haga clic en el elemento
P ‘: su estimación de P (C | V), dados los datos que tiene, que pueden ser escasos y ruidosos.
Si un elemento se ve V veces, entonces el número de clics seguirá la distribución binomial; puede pensar en cada vista como un “lanzamiento de moneda” ponderado donde el usuario hace clic (caras) o no (colas). Dado que cada elemento tiene una probabilidad subyacente diferente de hacer clic en él, también puede pensar en P (C | V) como extraído de una distribución. Elegiremos la distribución beta beta (A, B) ya que la beta es lo que se conoce como el “conjugado anterior” del binomio. No profundizaré aquí sobre lo que eso significa, pero el siguiente enlace lo explica y deriva una fórmula para suavizar.
- ¿Es posible combinar dos algoritmos no supervisados en serie para maximizar la precisión?
- ¿Cómo se aplica el aprendizaje profundo en el reconocimiento de imágenes?
- ¿Cuál es la diferencia clave entre backprop y backprop truncado a través del tiempo?
- Cómo evaluar mi modelo cada época en TensorFlow
- ¿Cuáles son los principales avances en el procesamiento del lenguaje natural en 2015?
Esa fórmula final es solo:
P ‘= (C + A) / (V + A + B) # A y B son los parámetros de la distribución beta
Una interpretación es que está agregando clics A “fantasma” y vistas A “B” fantasma “a cada elemento en su conjunto de datos, lo que tiene el efecto de suavizarlo. La mayoría de las personas probablemente solo comienzan con una conjetura y van desde allí.
Para obtener más información, consulte http://www.cs.cmu.edu/~10701/lec….