La privacidad diferencial es una condición en un algoritmo que informalmente dice “Los pequeños cambios en la entrada solo deberían causar pequeños cambios en la salida”. La “entrada” aquí es una colección de registros de datos, uno de cada una de n personas. Un “pequeño cambio en la entrada” corresponde a cambiar el registro de exactamente una de esas personas. Y “un pequeño cambio en la salida” corresponde a cambiar la probabilidad de cualquier resultado en un factor como máximo de [matemáticas] \ exp (\ epsilon) \ aprox (1+ \ epsilon) [/ matemáticas], donde [matemáticas] \ epsilon [/ math] se conoce como el parámetro de privacidad.
¿Qué significa exactamente? Una interpretación es esta. Suponga que quiere saber cuáles son los datos de Alice. Ahora, en el peor de los casos sobre su creencia anterior sobre cómo se verían sus datos, y en el peor de los casos sobre los datos de las otras personas en el conjunto de datos, la privacidad diferencial garantiza que su creencia posterior acerca de que sus datos son FOO después de ver el resultado diferirá de su creencia anterior de que sus datos son FOO en un factor como máximo [math] (1+ \ epsilon) [/ math], para cualquier FOO (después de condicionar los datos de todos los demás en la base de datos).
Una cosa buena de la privacidad diferencial es que compone. Si ejecuto un algoritmo diferencialmente privado [math] \ epsilon_1 [/ math] en un conjunto de datos que contiene los datos de Alice, y luego ejecuto un algoritmo diferencialmente privado [math] \ epsilon_2 [/ math] en un conjunto de datos diferente que también contiene los datos de Alice, entonces con respecto a Alice, la composición de estos dos algoritmos es [matemática] (\ epsilon_1 + \ epsilon_2) [/ matemática] -diferencialmente privada.
- ¿Cuál es la mejor manera de mantenerse al día con los últimos avances / avances en el campo de la informática?
- ¿Quiénes son algunos grandes científicos informáticos con una sólida formación en física?
- Cómo equilibrar el estudio y la investigación para el mismo campo.
- ¿Qué áreas de la informática son las más relevantes para el aprendizaje automático?
- ¿Cuáles son los pasos (para un estudiante indio) para escribir un trabajo de investigación en ciencias de la computación sin la ayuda de profesores universitarios?
Compare esto con algo así como una prueba de conocimiento cero, que es lo que Sidhanth describe (y no es diferencialmente privado). Supongamos que un grupo de personas, incluida Alice, usa el procedimiento de Sidhanth para calcular su salario promedio. Ahora Alice se levanta para usar el baño. Mientras ella está allí, todos los demás vuelven a ejecutar el procedimiento, para conocer el salario promedio de todos, excepto de Alice. Usando estos dos números, ahora saben exactamente el salario de Alice, lo que sería imposible bajo una privacidad diferencial.
Resulta que hay muchas cosas que puede hacer sujeto a una privacidad diferencial: puede responder exponencialmente muchas consultas sobre un conjunto de datos, puede hacer aprendizaje automático, puede hacer una optimización combinatoria y más. Este libro que escribí con Cynthia Dwork no es un mal lugar para comenzar si desea obtener más información: Página en upenn.edu.