Una fábrica produce bombillas defectuosas con cierta probabilidad, p. Se sabe que p es pequeño: alrededor del 1%, pero se desconoce el valor exacto. ¿Cuál es el tamaño de muestra que tomaría para estimar el valor de p?

Nuestro estimador es [math] \ hat {p} [/ math], la proporción empírica. Muestramos bombillas [matemáticas] n [/ matemáticas]. La varianza de nuestro estimador es [matemática] \ frac {p (1-p)} {n} [/ matemática]. Podemos conectar el estimado [matemático] p = 0.01 [/ matemático] para estimar la varianza correspondientemente.

Por lo tanto, el intervalo de confianza (95%) para nuestra estimación del valor verdadero de [matemáticas] p [/ matemáticas] es [matemáticas] \ hat {p} \ pm 1.96 \ sqrt {\ frac {0.01 (0.99)} {n }}[/mates].

Entonces, si queremos estimar el valor de [math] \ hat {p} [/ math] dentro de [math] \ pm x [/ math], entonces simplemente establecemos [math] x = 1.96 \ sqrt {\ frac {0.01 (0.99)} {n}} [/ matemáticas]

Por ejemplo, si queremos estimar [matemática] \ hat {p} [/ matemática] con una precisión de [matemática] \ pm 0.05% [/ matemática] con una confianza del 95%, entonces establecemos [matemática] n [ / math] para resolver [math] 0.0005 = 1.96 \ sqrt {\ frac {0.01 (0.99)} {n}} [/ math].


Obtenemos [matemáticas] n \ aproximadamente 152,000 [/ matemáticas].

¡Son muchas bombillas!

Aquí hay un enfoque que es un poco más general.

Digamos que no conoce un valor aproximado de [math] p [/ math]. ¿Cómo eliges cuántas muestras tomar? El problema es un poco complicado, pero la clave es no pensar cuántas muestras tomar, sino cuántas muestras “positivas” esperar. En el caso de este problema, esperamos hasta que veamos [math] k [/ math] bombillas defectuosas antes de detener el muestreo.

Digamos que muestreamos [matemática] n [/ matemática] veces hasta que encontramos [matemática] k [/ matemática] bombillas defectuosas. Nuestro estimador de la tasa defectuosa es [matemáticas] \ hat {p} = \ frac {k} {n} [/ matemáticas].

La confianza que tengamos en este estimador depende de cuán grande sea [math] k [/ math]. Usando el límite de Chernoff, podemos deducir que la probabilidad de que [math] \ hat {p} [/ math] difiera de [math] p [/ math] en más de [math] 1 \ pm \ epsilon [/ math] ( multiplicativo) está delimitado por

[matemáticas] \ exp (- \ epsilon ^ 2 k / 3) [/ matemáticas].

Por lo tanto, si queremos un nivel de confianza [matemática] 1- \ delta [/ matemática], queremos elegir

[matemáticas] k = \ frac {3 \ log (1 / \ delta)} {\ epsilon ^ 2} [/ matemáticas].

En el caso de [matemáticas] \ delta = 0.05, \ epsilon = 0.05 [/ matemáticas] (como en la respuesta de William) obtenemos [matemáticas] k \ aproximadamente 3.600 [/ matemáticas]. Esto resultaría en esperar [matemáticas] n \ aproximadamente 360,000 [/ matemáticas].

Hmmm, si p es la probabilidad de una bombilla defectuosa, la respuesta sería la integral de “Haz tu propia tarea dx ” ja ja ja. Bromas. Sin ofender.