OP: está mezclando conceptos distintos, aunque relacionados, la probabilidad (es decir, la probabilidad de presenciar un resultado particular) de un evento y el “valor esperado” (es decir, el promedio) de repetir el “experimento” un número infinito de veces (y asignando el valor 1 a un resultado y 0 al otro). El primero mide la probabilidad de obtener un resultado particular de su experimento propuesto, es decir, lanzar una moneda “justa” con lados distinguibles, y es calculable completamente por motivos axiomáticos: Axioma: la probabilidad del “evento seguro” es 1; ahora, si suponemos que la probabilidad de que la moneda descanse sobre su lado es 0, entonces eso deja dos resultados posibles, mutuamente excluyentes, “cara” o “cruz”; Dado que estos dos resultados son las únicas posibilidades y son mutuamente excluyentes, el evento “la moneda sale cara O sale cruz (pero no ambas cosas simultáneamente)” es el evento seguro y, por axioma, debe tener una probabilidad; también por axioma, dado que son mutuamente excluyentes, esta probabilidad debe ser igual a la suma simple de sus probabilidades individuales; deje que H sea igual a la probabilidad de obtener caras, T a la probabilidad de obtener colas; entonces tenemos H + T = 1; ahora introducimos el supuesto de que la moneda es “justa”, con lo que queremos decir, convencionalmente, H = T; la sustitución en H + T = 1 produce H + H = 2H = 1 que tiene la solución H = 0.5 = T; por lo tanto, la probabilidad de cada resultado es 0.5, y todo lo que hemos usado para llegar a este resultado son axiomas fundamentales de probabilidad, suposiciones convencionales con respecto a la naturaleza del experimento y el álgebra más elemental.
Pero, ¿qué pasa con la parte promedio de la pregunta? Bueno, esto es algo más problemático, primero porque esta palabra significa dos cosas diferentes, aunque relacionadas, dependiendo de si estamos hablando de probabilidad o estadística. Lo primero que hay que tener en cuenta es que nuestro experimento, lanzar una moneda justa, no produce un resultado numérico, por lo que no podemos hablar del “promedio” o “valor esperado” del experimento. ¿Significa esto que no podemos relacionar el resultado de realizar el experimento con el resultado axiomático anterior? No: en la teoría de la probabilidad, existe un concepto muy importante conocido como la función característica, que se aplica cuando un experimento tiene dos resultados mutuamente excluyentes (y que se puede aplicar a experimentos más generales simplemente agrupando todos los resultados posibles en dos categorías mutuamente excluyentes, es decir, “éxito” o “fracaso”). La función característica asigna el “puntaje” 1 al “éxito” (p. Ej., Cara), 0 al “fracaso” (p. Ej., Colas). Lo que el char. func. permite relaciona la definición intuitiva de la probabilidad de éxito, la fracción de ensayos que son éxitos, ya que el número de ensayos se vuelve arbitrariamente grande, a la idea de la teoría de probabilidad del valor esperado de una (función de una) variable aleatoria: uno puede relativamente demuestre fácilmente que la probabilidad intuitiva de éxito anterior es igual al valor esperado de la función característica aplicada al experimento en cuestión. Usando una puntuación de 1 para caras, 0 para colas; la probabilidad axiomática de 0.5 para cada uno; y la definición del valor esperado; da E (CF (lanzar una moneda justa)) = 0.5 * 1 + 0.5 * 0 = 0.5 = probabilidad intuitiva de sacar cara cuando lanza una moneda justa.
Entonces, ¿cómo se aplica esto a las estadísticas, que es esa área de matemáticas que trata con datos reales de experimentos reales? Bueno, de nuevo, no se aplica, a menos que impongamos el sistema de puntuación CF en nuestros resultados, es decir, asignemos un 1 a cada cara, 0 a cada cola (o viceversa, para una moneda justa, no importa cuál resultado que llamamos éxito, siempre y cuando definamos al otro como fracaso). Sin embargo, si hacemos eso y luego calculamos el puntaje promedio (es decir, sumamos todos los 0 y 1 y dividimos por el número de veces que lanzamos la moneda), ya que la probabilidad de obtener cada resultado es 0.5, esperamos aproximadamente la mitad de nuestros resultados son unos, aprox. la mitad para ser ceros, y por lo tanto el promedio para ser aprox. 0.5. (Por ejemplo, supongamos que volteamos la moneda 1000 veces; si lanzar la moneda es realmente un evento aleatorio, incluso si es una moneda justa, podríamos obtener, por ejemplo, 497 caras, 503 colas, con un puntaje “promedio” de (497 * 1 + 503 * 0) / 1000 = 0.497, aprox., Pero no precisamente, 0.5.) ¡Pero no puedo enfatizar lo suficiente que este resultado es un artefacto de haber elegido el CF para calificar los resultados experimentales! Supongamos que en lugar de cero para colas usamos -1: ¡entonces el puntaje promedio para el ejemplo anterior sería (497 * 1 + 503 (-1)) / 1000 = -0.006! ¿Significa esto que la probabilidad de obtener resultado, cara o cruz, cambió? Por supuesto que no: no hemos cambiado nada acerca de la moneda ni la hemos lanzado, todo lo que hemos cambiado es el sistema de puntuación; hemos usado un CF “no convencional”, por así decirlo. El punto es, es solo porque, y cuando, usamos el CF – 1 “convencional” para “éxito”, 0 para “fracaso”, para calificar los resultados aleatorios, mutuamente excluyentes, de valor binario, que el promedio estadístico de puntajes aproximados, (mejor y mejor a medida que aumenta el número de ensayos), la probabilidad teórica del resultado asignó el puntaje de 1.