¿Cuál es la probabilidad de que 2 números sean iguales en una lista aleatoria de n números de m dígitos?

Este problema es un problema de cumpleaños … Si hay [matemática] m [/ matemática] dígitos por número y [matemática] k [/ matemática] posibles dígitos, entonces hay [matemática] k ^ m = N [/ matemática] distintas cadenas posibles . (Permitiré posibles ceros iniciales. Si no los quiere, la [matemática] N [/ matemática] será un poco más pequeña.) Para encontrar la probabilidad de que al menos un par coincida cuando haya [matemática] n [ / math] cadenas independientes elegidas uniformemente, primero encontraremos la probabilidad de que no haya coincidencias y restaremos eso de una.


No hay coincidencias

[matemáticas] \ displaystyle {P = 1 \ cdot (1-1 / N) \ cdot (1-2 / N) \ cdot \ ldots \ cdot (1- (n-1) / N) = \ prod_ {k = 1} ^ {n-1} (1-k / N)} [/ matemáticas]

Para grandes [matemáticas] N [/ matemáticas], esto se puede aproximar bien siempre que [matemáticas] n [/ matemáticas] no sea demasiado grande. Tomar el exponencial del registro y usar el primer término en la serie de Taylor da

[matemáticas] \ displaystyle {P \ aprox e ^ {\ sum_ {k = 1} ^ {n-1} – \ frac kN} = e ^ {- \ frac {(n-1) n} {2N}}} [/mates]


Entonces la probabilidad de al menos una coincidencia es casi:

[matemáticas] \ displaystyle {1-e ^ {- \ frac {(n-1) n} {2N}}} [/ matemáticas]


Para mayor diversión, el valor de [math] n [/ math] para el cual la probabilidad de tener al menos una coincidencia es de aproximadamente 50% viene dado por:

[matemáticas] n \ aprox \ sqrt {N \ ln 4} [/ matemáticas]

Y el número promedio de estas cadenas que necesita generar hasta que vea la primera coincidencia viene dado por:

[matemáticas] \ mathbb E (X) \ aprox \ sqrt {N \ frac \ pi 2} [/ matemáticas]

Estoy seguro de que debe haber escuchado sobre La paradoja del cumpleaños

Esta es solo una versión un poco modificada del mismo problema. Hay m dígitos en el número. Entonces la probabilidad de que 2 números sean diferentes:

P (diferente) = [10 ^ m – 1] / 10 ^ m

Entonces, la probabilidad de que todos estos conjuntos de 2 números sean diferentes:

Número total de pares de n números =
nC2 = n * (n-1) / 2

Entonces, la probabilidad de que TODOS estos conjuntos sean diferentes
= [(10 ^ m – 1) / 10 ^ m] ^ {n * (n-1) / 2}

Por lo tanto, la probabilidad de que haya al menos 1 par de números iguales es simplemente un inverso del evento anterior que establece que ¡NINGUNO de los números es igual! ¡Tan solo restarlo de 1 y listo!

P (final) = 1 – [(10 ^ m – 1) / 10 ^ m] ^ {n * (n-1) / 2}

No dude en preguntar, ya que estoy seguro de que no he hecho esto increíblemente fácil de entender …

PD: ¡Se agradecería ayuda para representar las matemáticas!

More Interesting

¿Dónde se puede encontrar una foto y detalles biográficos de Burton Howard Bloom, inventor del filtro Bloom?

¿Qué algoritmo de compresión de imagen se usa en WhatsApp?

Cómo contar el número de n rutas de borde que comienzan desde el nodo u en un DAG (gráfico acíclico dirigido)

¿Qué es un algoritmo para generar una lista de secuencias numéricas que consta de cinco números (00-99) de modo que cada número en una secuencia siempre ocurra en combinación ÚNICA con los otros números y no haya secuencias duplicadas?

¿Cuáles son los algoritmos de nivel básico con los que debemos comenzar y cuáles son los algoritmos avanzados que debemos estudiar?

¿Por qué los algoritmos de compresión de datos sin pérdida no funcionan bien en archivos de video?

¿Cuáles son algunos de los algoritmos comunes y estrategias de diseño utilizados por los desarrolladores de juegos sin fin?

Después de aprender Python (junto con algoritmos y estructuras de datos), ¿sería beneficioso para mí aprender Selenium o debería seguir alguna otra búsqueda? Ya trabajo con Node.js, ¿hay algo más además de Django?

¿Cuál es el mejor libro sobre comercio algorítmico?

Dada una lista enlazada circular, ¿cómo encuentro la secuencia más larga de nodos de valor no repetido?

¿Cuál es un problema que no se puede resolver en tiempo de EXP pero se puede resolver en tiempo de Tetración?

¿Qué es un algoritmo de colonia de abejas artificiales y cómo se puede utilizar para la optimización de estructuras de celosía?

¿Cuál es la diferencia entre la optimización de llamadas de cola y la optimización de recursión de cola?

¿Cómo se crean las redes publicitarias?

Silicon Valley (serie de televisión): ¿Cuál es el ejemplo más cercano en la vida real al algoritmo de compresión de Pied Piper?