¿Cómo puedo calcular el número esperado de aciertos de caché?

Es más fácil calcular esto en términos de la cantidad de errores para los ítems [matemática] n [/ matemática].

Considere solo un “espacio” dentro de un caché (dedicado a un elemento en particular). Después de [math] n [/ math] objetos hay probabilidad [math] \ left (\ frac {m-1} {m} \ right) ^ {n} [/ math] que todavía está vacío: la probabilidad de que se haya elegido algún otro elemento en cada ronda hasta el momento.

El número esperado de errores después de los objetos [math] n [/ math] es la suma del número de errores en la ronda [math] 1, 2, 3, …, n [/ math] y la fórmula anterior nos da la probabilidad de que el objeto actual no se ha visto en las rondas 1 a [matemáticas] n-1 [/ matemáticas] Vamos a configurar [matemáticas] r = \ frac {m-1} {m} [/ matemáticas], entonces solo estamos sumando el series geométricas [matemáticas] 1 + r + r ^ 2 + r ^ 3 +… + r ^ {n-1} [/ matemáticas], que es [matemáticas] \ frac {1-r ^ {n}} {1- r} [/ matemáticas]. Entonces, el número de visitas , después de la simplificación, debe ser

[matemáticas] n – m \ left ({1 – \ left (\ frac {m-1} {m} \ right) ^ {n}} \ right) [/ math]

Verifique: si n = 1, entonces número de aciertos = 0, número de errores = 1, lo que concuerda con la fórmula.

Verifique: si n = 2, entonces el número de aciertos = [matemática] \ frac {1} {m} [/ matemática]. El número de errores de acuerdo con la fórmula es [matemática] \ frac {2m-1} {m} [/ matemática], por lo que el número de aciertos es correcto.

Verifique: si n = 3, entonces los casos para un hit son MHM, MHH o MMH. El primero tiene probabilidad [matemática] \ frac {1} {m} \ cdot \ frac {m-1} {m} [/ matemática]. El segundo, con dos golpes, tiene probabilidad [matemática] \ frac {1} {m ^ 2} [/ matemática]. La tercera tiene probabilidad [matemática] \ frac {m-1} {m} \ cdot \ frac {2} {m} [/ matemática]. Esto proporciona el valor esperado para el número de visitas como [math] \ frac {3m-1} {m ^ 2} [/ math]. Nuevamente, la fórmula funciona ya que la cantidad de fallas es [matemática] \ frac {3m ^ 2-3m + 1} {m ^ 2} [/ matemática]

Hay una manera de calcular esto usando variables indicadoras.

Llamemos a la muestra de objetos [math] n [/ math] set [math] S [/ math], y los objetos subyacentes [math] m [/ math] set [math] P [/ math].
Deje que la variable indicadora [math] I_ {k} [/ math] sea 1 si el objeto [math] k ^ {th} [/ math] en [math] P [/ math] tiene una instancia en [math] S [ / math], y 0 en caso contrario.

Entonces [math] E [I_ {k}] = p_ {k} [/ math] es la probabilidad de que el objeto [math] k ^ {th} [/ math] en [math] P [/ math] tenga una instancia en [matemáticas] S [/ matemáticas].
Esta probabilidad es simplemente [matemática] p_ {k} = 1- \ left (\ frac {m-1} {m} \ right) ^ {n} [/ math]

Primero queremos encontrar el número esperado de fallas. Ese es el número esperado de miembros distintos de [math] P [/ math] representados en [math] S [/ math].

Es decir: [matemáticas] E [falla] = E [m \ cdot {I_ {k}}] [/ matemáticas]

Usando la linealidad del valor esperado:
[matemática] E [falla] = E [m \ cdot {I_ {k}}] = m \ cdot {E [I_ {k}]} = m \ cdot {p_ {k}} [/ math]

Lo que resulta ser [matemáticas] m \ left (1- \ left (\ frac {m-1} {m} \ right) ^ {n} \ right) [/ math]

Entonces, finalmente, el número de visitas es:
[matemática] nm \ left (1- \ left (\ frac {m-1} {m} \ right) ^ {n} \ right) [/ math]

Creo que esta generalización de la paradoja del cumpleaños es exactamente su problema con una redacción ligeramente diferente: http://en.wikipedia.org/wiki/Bir

Otro enfoque simple (o simplemente otra interpretación de la respuesta de Ran Huo) es:

(1) Encuentre el número esperado de cachés no utilizados, que es [matemática] m (\ frac {m-1} {m}) ^ n [/ matemática] (porque la probabilidad de un caché no se utiliza después de [matemática] n [ / math] los objetos que se colocan es [math] (\ frac {m-1} {m}) ^ n [/ math]).

(2) Entonces el número esperado de cachés usados ​​es [matemática] m – [/ matemática] (1), que es [matemática] m (1 – (\ frac {m-1} {m}) ^ n) [/ mates].

(3) Finalmente, el número esperado de aciertos es [matemática] n – [/ matemática] (2), porque los objetos [matemática] n [/ matemática] se almacenan en (2) cachés, que se convierten en [matemática] nm (1 – (\ frac {m-1} {m}) ^ n) [/ math].