¿Cómo gana y retiene DeepMind los datos que necesita para el aprendizaje automático mientras garantiza la privacidad del paciente?

¿Cómo gana DeepMind los datos?

Simple: lo compran. Prácticamente todas las empresas de tecnología que se sumergen en el espacio de la atención médica compran datos de hospitales, consultorios médicos, compañías de seguros, compañías de facturación, centros académicos, etc. Eso tal vez no sea reconfortante, y la transacción en sí es generalmente más compleja (el valor comercializado no es necesariamente un montón de dinero), pero en realidad tener acceso a miles de puntos de datos de atención médica no es muy difícil en la actualidad.

¿Cómo garantiza DeepMind la privacidad del paciente?

En cierto punto, hay anonimato en los números. En el momento en que elimina los datos de identificadores únicos (nombre, SSN, dirección, etc.) de un conjunto de miles, es más o menos anónimo. ¿Cuántos hombres de 55 años con presión arterial alta y diabetes hay solo en los Estados Unidos? Miles Lleve eso a 75. Todavía miles. Lleve eso a 95. Todavía miles.

Fuera de ciertas condiciones genéticas raras, en realidad no es muy fácil identificar a un paciente dado usando solo sus datos médicos. Podría decirle que estoy describiendo a una mujer en el Área de la Bahía que tiene 60 años de edad, tiene presión arterial alta, toma metformina para la diabetes y anteriormente se sometió a una colecistectomía y una cesárea para uno de sus embarazos y le garantizo ‘ Todavía encontraré docenas de personas que encajan en este perfil. Haga casi cualquier historia de pacientes, e incluso en el mismo código postal en cualquier parte del país razonablemente poblada, encontrará varias personas que coinciden.

AprendizajeautomáticoCiencia de datosGoogle DeepMind

¿Cuáles son los recursos en línea más útiles (como capacitación, libros o certificaciones) para convertirse en un experto en arquitectura de Big Data?

¿Qué significa "casi todas las herramientas de software estadístico disponibles para los científicos alientan el modelado paramétrico y, por lo tanto, el diseño de experimentos basados en suposiciones sobre la distribución de datos que están equivocados"?

¿Cuáles son algunas de las principales conferencias de ciencia de datos y análisis en India?

¿Qué tipo de preguntas de prueba A / B debo esperar en una entrevista con un científico de datos y cómo debo prepararme para esas preguntas?

¿Cuál es la diferencia entre un ingeniero y un científico, y cuál es más divertido?

¿Es legal enviar datos de Kaggle a GitHub?

Supongo que la información en la que se basa DeepMind no requiere que se conozca la identidad del paciente. La información se agrega con otra información para generar recomendaciones de diagnóstico o tratamiento basadas en una gran cantidad de datos.

No he recibido información confidencial sobre DeepMind, pero estoy familiarizado con sistemas como este, y puedo decir con cierto grado de confianza que no es un gran problema proteger la privacidad. Siempre existe un riesgo de ciberseguridad con esa cantidad de datos en un solo lugar, ya que ningún sistema de servidores es 100% seguro contra un determinado ataque de ciberseguridad, especialmente uno lanzado por un gobierno hostil.

También me gustaría señalar que sistemas como este se están implementando para encontrar tratamientos para afecciones médicas que amenazan la vida. Cuando los pacientes necesitan ayuda de un sistema como DeepMind, es más probable que sean más abiertos acerca de su condición para encontrar a alguien o algo que pueda funcionar. La privacidad suele ser un problema con las afecciones de salud mental, enfermedades transmisibles que tienen un estigma asociado, como el VIH / SIDA o el embarazo adolescente.

Michael Critelli

Es posible conservar las propiedades estadísticas de los datos disponibles mientras se enmascaran los datos utilizando ruido (por ejemplo, agregando un pequeño delta a cada valor) y otros elementos. Esto se puede lograr mediante técnicas como la privacidad diferencial: Wikipedia. Dichas técnicas ayudan a aislar los datos de la persona de la que se obtuvieron, proporcionando así la privacidad necesaria a todos los involucrados. La mayoría de las técnicas de análisis de datos deben ser independientes del valor. Esto significaría que, independientemente de cuáles sean los valores, la técnica debe funcionar siempre que las propiedades estadísticas subyacentes y los patrones emergentes sigan siendo los mismos.

Como otra respuesta ha mencionado, el tipo de análisis de datos que DeepMind y otras compañías están haciendo usando los registros de pacientes no requiere la identidad de las personas involucradas. Por lo tanto, esto es bastante fácil de lograr utilizando los métodos disponibles.

Naran Bayanbat

No estoy seguro de cómo lo hace Deepmind, pero hay métodos que pueden extraer patrones de los datos y mantenerlos encriptados al mismo tiempo. CryptoDL y este proyecto de código abierto son intentos de hacer exactamente eso.

Naran Bayanbat

More Interesting

¿Por qué, en su opinión, tantas compañías de investigación clínica se niegan a usar Python en lugar de SAS o R?

¿Cómo pueden las tecnologías de Big Data mejorar la inversión de impacto social?

¿Cuál es la diferencia entre la exploración de datos y el análisis predictivo?

¿Vale la pena tomar el curso para desarrolladores de Big Data Hadoop de simplilearn.com?

¿Cuánto se relacionan estos términos como ciencia de datos, aprendizaje automático, inteligencia artificial e internet de las cosas con el mundo venidero? ¿De dónde puedo aprender estos temas? ¿Cuánto están relacionados con la ingeniería de comunicación electrónica?

Para aprender IA, ¿debería saber ciencia de datos?

¿Qué oportunidades de "big data" serán más rentables?

¿Cuáles son las habilidades / cualidades que busca un pasante de ciencia de datos?

¿Cuáles son algunas formas en que usa los datos para respaldar su aplicación?

¿Cuáles son algunos usos de big data? ¿Por qué debería aprenderlo en lugar de SQL?