Mi mejor conjetura: Salud (específicamente epidemiología)
Por el momento, los datos que tenemos son dispares y sufren de ser aislados. Un buen ejemplo es para los nuevos tratamientos de quimioterapia contra el cáncer, donde solo puede ver los resultados para un pequeño número de pacientes en un ensayo dado. Agregue a eso la complejidad de los médicos que prescriben variaciones y mezclas de tratamientos, y pinta una imagen muy compleja. Por ejemplo, solo una persona podría estar recibiendo un régimen de tratamiento específico en París, Francia, y no puede sacar conclusiones significativas de eso.
Sin embargo, si los datos pudieran ser agregados y estandarizados, extrayendo y haciendo coincidir variables donde sea posible, imputando donde no, podría terminar con un conjunto de datos sustancial, del cual puede derivar (al menos estadísticamente) conclusiones significativas. Cambiador de juego para productos farmacéuticos, investigación médica y tecnología de la salud.
- ¿Necesito ser un analista de datos para obtener un trabajo en el campo de aprendizaje automático?
- ¿Cuán estrechamente está relacionada la analítica de big data con el aprendizaje automático?
- ¿Cuál es la diferencia entre la pista de ciencia de datos de Coursera (a través de Johns Hopkins) y el nano grado de analista de datos de Udacity?
- ¿Qué tipo de habilidades necesita una ciencia de datos?
- ¿Qué hace un científico de datos?
Esto es similar a lo que los chicos de Flatiron Health pretenden hacer (Plataforma de Oncología, ¿Puede Big Data curar el cáncer?)