Esto parece imposible, pero es muy posible. Esto se llama la paradoja de Simpson y aquí hay un ejemplo simple de juguete que demuestra este efecto:
Pacientes combinados curados no curados Tasa de curado
Droga 40 20 20 50%
Sin Drogas 40 16 24 40%
Hombres Pacientes Curados Tasa de curación no curada
Droga 30 18 12 60%
Sin droga 10 7 3 70%
- ¿Por qué es popular el aprendizaje profundo?
- ¿Apache Spark es un buen marco para implementar Reinforcement Learning?
- ¿Qué es el aprendizaje automático en la predicción de emociones basada en texto?
- ¿Debo usar juicios de relevancia explícitos o comentarios de clics implícitos para recopilar datos de capacitación para construir un modelo de Aprendizaje para clasificar?
- Aprendizaje automático: ¿qué significa "abandono en el cerebro con respecto a todas las entradas, mientras que abandono en una red convolucional funciona con respecto a cada unidad individual"?
Mujeres Pacientes Curados Tasa de curación no curada
Droga 10 2 8 20%
Sin Drogas 30 9 21 30%
Destaqué en negrita las líneas que representan una tasa de curación más alta para toda la población y para las subpoblaciones masculinas y femeninas por separado. En este caso particular, lo que está sucediendo es que los hombres son más propensos a tomar el medicamento y los hombres también tienen una tasa de curación más alta (con o sin el medicamento) que las mujeres. Entonces, para los resultados combinados, parece que el medicamento está funcionando, pero para los hombres y las mujeres por separado, el medicamento realmente reduce la tasa de curación.
La paradoja de Simpson destaca la dificultad de determinar la causalidad a partir de correlaciones estadísticas. Nuestras intuiciones sobre la causalidad dirían que no puede tener causalidad opuesta para toda la población y para TODAS las subpoblaciones. Para una discusión interesante y esclarecedora sobre la resolución de esta paradoja en términos de causalidad, consulte http://bayes.cs.ucla.edu/R264.pdf.