¿Cuáles son los principales desafíos con big data en epidemiología?

Lo mismo que en cualquier sector biológico: recopilar buenos datos.

No puedes experimentar bien con las personas. Hacer un LD50 está mal visto, así como mantenerlos en cautiverio para asegurarse de que solo pruebe un parámetro. E invariablemente tratamos de predecir la respuesta basada en nosotros mismos (y nuestra necesidad de financiación) y esto a menudo abruma los datos objetivos.

Cualquier forma de vida es una mezcla inmensamente compleja de química, genética e historia pasada. Por lo tanto, la mayoría de los grandes datos que recopila son defectuosos. Ha utilizado una categorización simplista en su colección, como raza, grupos socioeconómicos, etc. Las mediciones también son defectuosas: las variaciones diminutas de temperatura, humedad o dieta pueden afectar los resultados dramáticamente.

Entonces reunir es el primer problema. El segundo es el uso que se le da.

Los médicos son educados para creer en el paternalismo: que solo ellos saben lo que es correcto para un paciente. Ven una gama limitada de soluciones (tratamientos localizados como cirugía o medicamentos) y plazos limitados en lugar de planes de por vida que involucran estilo de vida, dieta y salud mental. Tienen casillas para marcar, ya sea para financiación o para justificar su empleo en términos de tratamientos por día / mes.

Los datos, por defectuosos que sean, se usan para respaldar esta necesidad de ser correctos y la solución que proponen, o para socavar la “respuesta” propuesta por un competidor o colega, no para construir una mejor imagen que ayude a todos hacia una vida duradera y con suerte iterativa. mejora.