La aleatorización se está utilizando para probar la hipótesis nula. Por ejemplo, en el primer conjunto, queremos saber si el género tiene algo que ver con las promociones. La hipótesis nula establece que los hombres y las mujeres son promovidos aleatoriamente (independientemente del género). Queremos preguntarnos: ¿qué tan probable es que observemos este conjunto de datos si la hipótesis nula fuera cierta? En otras palabras, es probable que esta gran brecha de género se produzca solo por casualidad.
Para responder a esta pregunta, necesitamos tomar nuestros datos originales y barajar las cosas. Esto se puede hacer con una computadora o literalmente barajando las cartas (si te gusta ese tipo de cosas). Todo lo que hacemos es asignar aleatoriamente a nuestros machos y hembras a las pilas promovidas o no promovidas. Hacemos esto un montón de veces (mil) y luego preguntamos: ¿cuántas de nuestras muestras asignadas al azar mostraron una diferencia de género tan extrema como nuestra muestra original?
Si nuestra muestra original mostró una gran diferencia de género en las tasas de promoción, y casi ninguna de nuestras muestras aleatorias mostró una gran diferencia (tasa alfa = 0.05), entonces podemos concluir que la diferencia de género que vimos probablemente no surgió por casualidad . Sería más seguro asumir que hay un sesgo de género en el trabajo, y podemos rechazar nuestra hipótesis nula de que nuestras promociones se asignan al azar.
- ¿Cómo son las estadísticas generadas por los canales en los partidos de la Copa Mundial de la CCI que dicen: "India ha ganado todos sus partidos si batean primero y suman más de 270 +" / "India ha ganado todos sus partidos donde Kohli anotó> 100"?
- ¿Qué carreras significativas existen en la ciencia de datos (estadísticas / ML / optimización)?
- ¿Cuánto tiempo puede sobrevivir Informatica en el mundo de los grandes datos?
- ¿Cuáles son algunas aplicaciones de análisis de datos que pocas personas conocen?
- ¿Qué es el análisis de datos? ¿Puedes explicar con ejemplos?