Usted define el “archivo web” como “el proceso de recopilación de partes de la World Wide Web para garantizar que la información se conserve para futuros investigadores, historiadores y el público”. Apuesto a que te refieres a coleccionar intencionalmente . Pero si solo desea averiguar qué sitios web solía contener, incluso si el material no fue recolectado intencionalmente para su conservación, puedo sugerir un par de lugares más.
El motor de búsqueda de Google “cacheará” las versiones de las páginas web que indexa. A menudo hace que esas versiones de las páginas estén disponibles, incluso si la página misma ha cambiado mientras tanto. El artículo Cómo acceder directamente a las páginas web en caché en Google explica cómo acceder al caché. Cuidado, Google sigue cambiando la forma en que presenta el caché, por lo que el artículo anterior puede quedar obsoleto.
Algunos sitios web, especialmente los Wikis basados en MediaWiki como Wikipedia y los repositorios de código fuente administrados como los de Build software, mantienen juntos (github) intencionalmente versiones anteriores de contenido, no para futuros investigadores sino para recuperarse de los errores actuales. Sin embargo, a veces puede obtener información histórica del registro de cambios.
- ¿Dónde debería poner anuncios Quora?
- ¿Qué es todo en la web profunda / web oscura?
- ¿Cómo sé si soy adicto a la información en la web y realmente no obtengo mucho valor de ella?
- ¿Cuál es la diferencia entre un navegador web y un sistema operativo?
- ¿Cuál es el propósito de las revistas académicas cuando tienes la red mundial ahora?