Así que no puedo responder tu pregunta. Pero me interesa enormemente, así que al menos tengo pensamientos al respecto.
Recuerde, la información está sujeta a dinámicas completamente diferentes que los objetos físicos. El precio de hacer una réplica perfecta de la información es casi nulo, y solo una copia necesita sobrevivir en algún lugar para que la información algún día se regenere y se disperse por completo. Más de un milenio y medio de represión por parte de las autoridades cristianas no fue suficiente para evitar que los textos apócrifos encontrados en Nag Hammadi y Qumran estén ampliamente disponibles hoy.
Con respecto a la preservación moderna de datos digitales: Los únicos ejemplos que son lo suficientemente destacados como para haber llamado mi atención son:
- ¿Qué tipo de algoritmos usan los solucionadores SAT?
- Cómo ganar dinero para comprar una MacBook pro
- ¿Cuáles son los conceptos que todo ingeniero profesional de aprendizaje automático debe conocer?
- ¿Qué cosas debería uno estudiar para ganar las competencias de codificación de Codechef o TopCoder?
- ¿Las computadoras podrán programarse en el futuro?
- El cierre de GeoCities y la clonación de última hora por voluntarios
- El anuncio en Slashdot hace unos meses de que los disquetes de 5.25 “de todos ahora son probablemente ilegibles sin la intervención de expertos.
- La recuperación del código fuente original de Prince of Persia
- El drama que rodea los datos de MegaUpload
- Algo que actualmente circula por Toy Story 2
No conozco ningún estudio que analice los datos que realmente se han perdido debido a la antigüedad y el abandono en lugar de rm -rf * y las copias de seguridad incorrectas. Cuantificar esta pérdida de información es particularmente desafiante porque solo ocurre cuando las personas no están prestando atención. Es cierto que puedes encuestar a las personas; pregúnteles sobre el “¡Oh, qué sorpresa! Ahí fueron mis fotos de vacaciones, ¡qué fastidio!” sentimiento, pero ese será un límite inferior muy generoso en cualquier estimación de pérdida. Este es el por qué:
Si te interesan los datos, no los dejes pudrirse; y si te falta algo importante, búscalo y, con suficiente esfuerzo, generalmente puedes resucitarlo (al menos la mayor parte). Y sí, podría requerir un millón de dólares y un microscopio electrónico. Pero este es un patrón que se ve en todo tipo de ciencias aplicadas, que van desde TEMPEST a la copia de Mona Lisa al ADN de mamut siberiano. Como si la información no se mezclara con el ruido continuo, sino que se mantuviera discreta e intacta contra viento y marea, y solo requiriera una instrumentación increíblemente precisa para recuperarla nuevamente.
Es cuando no recordamos que la información estaba allí en primer lugar, o no nos importa lo suficiente como para restaurarla y propagarla, que nadie la busca, que lentamente se vuelve cada vez más difícil tropezar por accidente. se muere. Todo esto cae directamente bajo el paraguas de “incógnitas desconocidas”.
En resumen: no conozco muchos ejemplos de pérdida de información debido a medios digitales descuidados, pero gran parte de lo que hemos perdido, tal vez no nos demos cuenta de que lo hemos perdido.