¿Puede un fármaco ser estadísticamente efectivo para toda la población, pero estadísticamente no es efectivo para todas las subpoblaciones (como hombres y mujeres) por separado?

Esto parece imposible, pero es muy posible. Esto se llama la paradoja de Simpson y aquí hay un ejemplo simple de juguete que demuestra este efecto:

Pacientes combinados curados no curados Tasa de curado
Droga 40 20 20 50%
Sin Drogas 40 16 24 40%

Hombres Pacientes Curados Tasa de curación no curada
Droga 30 18 12 60%
Sin droga 10 7 3 70%

Mujeres Pacientes Curados Tasa de curación no curada
Droga 10 2 8 20%
Sin Drogas 30 9 21 30%

Destaqué en negrita las líneas que representan una tasa de curación más alta para toda la población y para las subpoblaciones masculinas y femeninas por separado. En este caso particular, lo que está sucediendo es que los hombres son más propensos a tomar el medicamento y los hombres también tienen una tasa de curación más alta (con o sin el medicamento) que las mujeres. Entonces, para los resultados combinados, parece que el medicamento está funcionando, pero para los hombres y las mujeres por separado, el medicamento realmente reduce la tasa de curación.

La paradoja de Simpson destaca la dificultad de determinar la causalidad a partir de correlaciones estadísticas. Nuestras intuiciones sobre la causalidad dirían que no puede tener causalidad opuesta para toda la población y para TODAS las subpoblaciones. Para una discusión interesante y esclarecedora sobre la resolución de esta paradoja en términos de causalidad, consulte http://bayes.cs.ucla.edu/R264.pdf.