¡Por supuesto que es!
Incluso los datos personales se divulgan en un formato anónimo, siempre puede dañar la privacidad. Experinxe muestra que puede ser razonablemente fácil volver a identificarlo integrándolo con otra información secundaria que esté disponible públicamente.
Aquí hay un artículo que presenta un ejemplo de cómo los datos anonimizados pueden ser anonimizados (perjudicando así la privacidad de las personas): Reidentificación y fusión de información entre CDR anonimizados y datos de redes sociales.
- Si se le dieran los recursos y el tiempo necesarios, ¿qué problema elegiría abordar personalmente con el aprendizaje automático?
- Cómo convencer a una organización de la importancia de las pruebas A / B
- Si tuviera que configurar un programa de aprendizaje de ciencias de datos de 3 meses para principiantes, ¿cuál sería el mejor programa y la línea de tiempo?
- ¿Es necesario el conocimiento de AWS para la ciencia / análisis de datos?
- ¿Cuál es la diferencia entre roaming de datos y datos móviles?
Sin embargo, los grandes datos (y los datos personales) también son útiles para fines de investigación, por lo que deben usarse para el bien común.
Creo que debe encontrarse un equilibrio entre las dos cosas (privacidad, búsqueda e investigación). Ya existen prácticas diferentes, como la privacidad diferencial.
Uno de los principales contribuyentes en Ciencias Sociales (y Ciencias Sociales Computacionales) es Alex Pentland. Ha escrito un artículo sobre esos temas.
Se llama ” Big Data: equilibrando los riesgos y las recompensas de la política pública basada en datos ”
Puede encontrarlo aquí gratis: http://www3.weforum.org/docs/GIT…
Te sugiero que lo leas detenidamente para comprender este delicado equilibrio.