¿Cómo se prueba que la probabilidad de una moneda es 1/2?

Puede usar el principio de simetría, también llamado principio de indiferencia, para argumentar que los mejores modelos probabilísticos deben ser uniformes para objetos simétricos como monedas y dados.

Una moneda tiene dos caras, y si aceptamos considerar solo dos posibilidades de que salga cara o cara, podemos modelar la moneda con dos probabilidades [matemática] p [/ matemática] para la probabilidad de que salga cara , y [math] q [/ math] para la probabilidad de subir colas, y, por supuesto, requerimos que [math] p + q = 1 [/ math]. En una moneda no simétrica, [matemática] p [/ matemática] podría no ser igual a [matemática] q [/ matemática]. En el caso de la simetría, la simetría física de la moneda sugiere que las dos deberían ser iguales.

Para una moneda real, vemos que no es perfectamente simétrica. Por lo general, hay más metal en el lado de la cabeza de la moneda que en el lado de la cola. Además, la moneda puede aterrizar en su borde, o un cuervo puede volar y robar la moneda, o cualquier otra posibilidad. Aún así, es un buen modelo para empezar, tan bueno, de hecho, que tendría que tener una muy buena razón para no usarlo.

El mismo tipo de argumento es válido para dados cúbicos y otros dados simétricos, excepto que el número de resultados es mayor.

Este argumento no funcionará para dados no simétricos como estos de 7 lados

Fuente de la imagen: OTROS DADOS de Joe Barbercheck

Primero debe definir “probabilidad”. Buena suerte, porque nadie lo ha logrado con éxito, para satisfacción de todos los demás.

La contribución revolucionaria de Euclides a la geometría no tuvo nada que ver con ningún teorema que probó. Los académicos habían estado tratando de probar ciertas propiedades fundamentales de cosas como puntos, líneas y ángulos ajustando las definiciones de esas cosas. No podían hacerlo mientras se mantenían coherentes con sus definiciones. Euclides decidió asumir las propiedades sin definiciones y proceder desde allí. Podemos interpretar esos términos indefinidos de la forma que queramos, pero a todos les parece claro lo que se supone que significan. Incluso si no puedo definirlos para ti. Pero puede modificar sus supuestas propiedades y obtener lo que llamamos geometrías “no euclidianas” que son tan autoconsistentes y que pueden (o no) representar la realidad que asignamos a los conceptos también.

La probabilidad tiene el mismo problema, pero es menos obvio lo que se supone que significan los términos indefinidos “probabilidad” y “resultado”. También hay conjuntos de supuestos en competencia. En la probabilidad de Kolmogorov, es completamente válido decir P (Heads) = 0.1 y P (Tails) = 0.9, porque este sistema no vincula los valores a la realidad de ninguna manera.

Lo que otros aquí han llamado probabilidad “frecuente” intenta asociar los valores con una repetición infinita del mismo experimento. Eso es imposible por al menos dos razones: no puede lograr repeticiones infinitas y no puede definir el “mismo experimento” de una manera coherente que permita la variación de un ensayo a otro. Entonces, lo mejor que puede hacer, como lo describió Phil McCanna, es aumentar su confianza en que la probabilidad (la interpretación de la probabilidad más buscada) para una moneda específica se encuentra dentro de un cierto rango que incluye 1/2. (¿O debería usar muchas monedas diferentes del mismo tipo? ¿O muchas monedas de muchos tipos diferentes?)

Hay otra interpretación de la probabilidad, llamada bayesiana, que funciona desde un enfoque completamente diferente. ¿Tienes alguna razón para pensar que Heads es más o menos probable que Tails? Si no, entonces sus probabilidades deben ser iguales. Y dado que, por cualquier conjunto de axiomas de probabilidad que elija, estos dos números deben sumar 1, cada uno debe ser 1/2. Esto “prueba” lo que quería probar, pero solo si se suscribe a esta interpretación de probabilidad.

Algunos piensan que estas dos interpretaciones son incompatibles. Yo no. Para repetir el experimento bayesiano, como quieren hacer los frecuentistas, debes usar una moneda diferente cada vez. Porque si tiene un historial de la moneda que usa, puede tener una razón para pensar que Heads es más o menos probable que Tails. Entonces están describiendo cosas diferentes.

(Como justificación para equiparar las interpretaciones, tenga en cuenta que ninguna moneda realmente dice “Cara” y “Colas” en ambos lados. Con frecuencia es una asignación arbitraria. Entonces, si usamos monedas diferentes, como sugerí entre paréntesis, no debería también cambiamos las definiciones arbitrarias de “cabezas” y “colas”? Si lo hacemos, las probabilidades frecuentas y bayesianas serán ambas 1/2.)

OP: está mezclando conceptos distintos, aunque relacionados, la probabilidad (es decir, la probabilidad de presenciar un resultado particular) de un evento y el “valor esperado” (es decir, el promedio) de repetir el “experimento” un número infinito de veces (y asignando el valor 1 a un resultado y 0 al otro). El primero mide la probabilidad de obtener un resultado particular de su experimento propuesto, es decir, lanzar una moneda “justa” con lados distinguibles, y es calculable completamente por motivos axiomáticos: Axioma: la probabilidad del “evento seguro” es 1; ahora, si suponemos que la probabilidad de que la moneda descanse sobre su lado es 0, entonces eso deja dos resultados posibles, mutuamente excluyentes, “cara” o “cruz”; Dado que estos dos resultados son las únicas posibilidades y son mutuamente excluyentes, el evento “la moneda sale cara O sale cruz (pero no ambas cosas simultáneamente)” es el evento seguro y, por axioma, debe tener una probabilidad; también por axioma, dado que son mutuamente excluyentes, esta probabilidad debe ser igual a la suma simple de sus probabilidades individuales; deje que H sea igual a la probabilidad de obtener caras, T a la probabilidad de obtener colas; entonces tenemos H + T = 1; ahora introducimos el supuesto de que la moneda es “justa”, con lo que queremos decir, convencionalmente, H = T; la sustitución en H + T = 1 produce H + H = 2H = 1 que tiene la solución H = 0.5 = T; por lo tanto, la probabilidad de cada resultado es 0.5, y todo lo que hemos usado para llegar a este resultado son axiomas fundamentales de probabilidad, suposiciones convencionales con respecto a la naturaleza del experimento y el álgebra más elemental.

Pero, ¿qué pasa con la parte promedio de la pregunta? Bueno, esto es algo más problemático, primero porque esta palabra significa dos cosas diferentes, aunque relacionadas, dependiendo de si estamos hablando de probabilidad o estadística. Lo primero que hay que tener en cuenta es que nuestro experimento, lanzar una moneda justa, no produce un resultado numérico, por lo que no podemos hablar del “promedio” o “valor esperado” del experimento. ¿Significa esto que no podemos relacionar el resultado de realizar el experimento con el resultado axiomático anterior? No: en la teoría de la probabilidad, existe un concepto muy importante conocido como la función característica, que se aplica cuando un experimento tiene dos resultados mutuamente excluyentes (y que se puede aplicar a experimentos más generales simplemente agrupando todos los resultados posibles en dos categorías mutuamente excluyentes, es decir, “éxito” o “fracaso”). La función característica asigna el “puntaje” 1 al “éxito” (p. Ej., Cara), 0 al “fracaso” (p. Ej., Colas). Lo que el char. func. permite relaciona la definición intuitiva de la probabilidad de éxito, la fracción de ensayos que son éxitos, ya que el número de ensayos se vuelve arbitrariamente grande, a la idea de la teoría de probabilidad del valor esperado de una (función de una) variable aleatoria: uno puede relativamente demuestre fácilmente que la probabilidad intuitiva de éxito anterior es igual al valor esperado de la función característica aplicada al experimento en cuestión. Usando una puntuación de 1 para caras, 0 para colas; la probabilidad axiomática de 0.5 para cada uno; y la definición del valor esperado; da E (CF (lanzar una moneda justa)) = 0.5 * 1 + 0.5 * 0 = 0.5 = probabilidad intuitiva de sacar cara cuando lanza una moneda justa.

Entonces, ¿cómo se aplica esto a las estadísticas, que es esa área de matemáticas que trata con datos reales de experimentos reales? Bueno, de nuevo, no se aplica, a menos que impongamos el sistema de puntuación CF en nuestros resultados, es decir, asignemos un 1 a cada cara, 0 a cada cola (o viceversa, para una moneda justa, no importa cuál resultado que llamamos éxito, siempre y cuando definamos al otro como fracaso). Sin embargo, si hacemos eso y luego calculamos el puntaje promedio (es decir, sumamos todos los 0 y 1 y dividimos por el número de veces que lanzamos la moneda), ya que la probabilidad de obtener cada resultado es 0.5, esperamos aproximadamente la mitad de nuestros resultados son unos, aprox. la mitad para ser ceros, y por lo tanto el promedio para ser aprox. 0.5. (Por ejemplo, supongamos que volteamos la moneda 1000 veces; si lanzar la moneda es realmente un evento aleatorio, incluso si es una moneda justa, podríamos obtener, por ejemplo, 497 caras, 503 colas, con un puntaje “promedio” de (497 * 1 + 503 * 0) / 1000 = 0.497, aprox., Pero no precisamente, 0.5.) ¡Pero no puedo enfatizar lo suficiente que este resultado es un artefacto de haber elegido el CF para calificar los resultados experimentales! Supongamos que en lugar de cero para colas usamos -1: ¡entonces el puntaje promedio para el ejemplo anterior sería (497 * 1 + 503 (-1)) / 1000 = -0.006! ¿Significa esto que la probabilidad de obtener resultado, cara o cruz, cambió? Por supuesto que no: no hemos cambiado nada acerca de la moneda ni la hemos lanzado, todo lo que hemos cambiado es el sistema de puntuación; hemos usado un CF “no convencional”, por así decirlo. El punto es, es solo porque, y cuando, usamos el CF – 1 “convencional” para “éxito”, 0 para “fracaso”, para calificar los resultados aleatorios, mutuamente excluyentes, de valor binario, que el promedio estadístico de puntajes aproximados, (mejor y mejor a medida que aumenta el número de ensayos), la probabilidad teórica del resultado asignó el puntaje de 1.

Experimentalmente: no prueba la hipótesis nula, no la rechaza. En general, no se prueba nada como resultado de los ensayos. Si la probabilidad es verdaderamente 0.5 (escuché que es muy probable que esta no sea una declaración verdadera), siempre puede seguir lanzando monedas y tener más y más confianza en su suposición. Pero no estás probando nada.

Matemáticamente: esto no tiene sentido. Estás preguntando sobre la probabilidad de un evento del mundo real. Cualquier prueba requeriría un conjunto de supuestos sobre el mundo real, entonces, ¿por qué no simplemente asumir que la probabilidad es 0.5 y omitir la prueba?

Se puede probar usando la visualización .

Este código usa la biblioteca Matplotlib y la función Random en Python 3

SALIDA

  1. CASO 1

2. CASO 2

CONCLUSIÓN

  • Con el aumento en el número de volteos, la probabilidad de obtener cabeza tiende a 0.5
  • Si el número de experimentos aumenta hasta el infinito , obtendremos una línea recta en y = 0.5

Siéntase libre de ver la salida para diferentes casos de prueba

Piense que proviene de dos fuentes: la mayoría de las monedas son increíblemente simétricas, no en forma, sino en la superficie y distribución de peso de los dos lados. Esas dos observaciones hacen plausible que la probabilidad de cara y cruz bajo un lanzamiento “justo” sea de 1/2.

Esa observación está respaldada (y escribí esta respuesta principalmente para usar esa palabra 🙂) mediante observación: en situaciones en las que las monedas se han arrojado de la manera más justa posible durante un gran número de veces, la frecuencia relativa de ocurrencia de caras ha sido (en buena medida aproximación) 1/2, igual que la frecuencia relativa de ocurrencia de colas.

Entonces, es un poco de “teoría” y un poco de datos de apoyo. Una pequeña y bonita mezcla.

Siguiendo la interpretación frecuentista de la probabilidad, la lanza muchas veces * sin introducir sesgos * (esto es difícil, por ejemplo: alternar / aleatorizar la posición inicial y el lado de la moneda cuando todavía está en la mano) y verifica que el número total de Las cabezas y las colas son iguales o comparables.

Idealmente, debería hacer esto varias veces que se acerca al infinito, de lo contrario siempre habrá una pequeña posibilidad de que, a pesar de que haya podido obtener una división perfecta entre cara y cruz, este resultado fue solo “por casualidad” y que el la probabilidad real de la moneda es ligeramente diferente … (esta es la razón de la palabra “comparable” antes, porque incluso si el número de caras o colas no es el mismo, esto podría ser por casualidad, incluso si la moneda realmente es 50/50).

Es una estimación teórica, basada en que solo hay dos caras en las que una moneda caerá razonablemente sobre una superficie dura, y ambas caras están bastante cerca de la misma. Tal vez sea en realidad 0.50002 y 0.49998, pero 50-50 está lo suficientemente cerca para fines prácticos.

Supongo que te refieres a otro concepto: frecuencia.
La frecuencia de un evento es la relación entre casos favorables y todos los casos y cambia cuando agrega nuevos casos o cuando los cambia.
Supuestamente, la probabilidad es el límite de la frecuencia (ya que el número de todos los casos llega al infinito), pero es más complicado. En breve, en el contexto de su pregunta “promedio” no encaja bien.

Creo que eso es prácticamente imposible, ya que la moneda es un objeto físico con diferencias mecánicas (incluso las más pequeñas). Necesita que alguien ‘acepte’ que la moneda es elegible y aceptable para usarse en esta condición. De todos modos, tendrías muchas otras variables que podrían afectar el comportamiento de la moneda.

Para el caso de una moneda justa:

La probabilidad de que una moneda justa caiga en las caras cuando se lanza debe ser 1/2 porque, según la definición de una moneda justa, es igualmente probable que el resultado sea uno de dos resultados. Cualquier otra probabilidad que no sea 1/2 significaría que los 2 resultados no son iguales, que hay sesgo y, por lo tanto, la moneda no es justa.

Simplemente no puedes. Una moneda justa, por definición, es una que tiene una probabilidad de caer 1/2 en la cabeza o en los cuentos, por eso usamos la probabilidad de 1/2.

No creo que sea posible que una moneda física sea perfectamente justa, pero podría ser justa en lo que respecta a nuestros poderes de medición. Y, por supuesto, solo tiene que ser justo para cualquier aplicación del mundo real.

Y no hay forma de saber “cuán justa” es una moneda física, excepto probándola.

Estaba investigando esto hace un tiempo y encontré un estudio sobre el lanzamiento de una moneda y probaron bajo las mismas y estrictas condiciones y descubrieron que para obtener la moneda en las caras 9 a 10 de cada 10 veces tenía que usar la misma cantidad de energía ( fuerza ..) en la misma ubicación del lanzamiento de la moneda en una caja sellada al vacío (para que la presión del aire y los cambios de humildad no afecten la prueba). Por lo tanto, parece basarse en la cantidad de energía utilizada para el lanzamiento que le dará los mismos resultados. Pensé lo mismo, luego encontré una prueba en él …