Mirror de 841 Gigabytes de Geocities

Iniciado por ~, 1 Enero 2015, 03:23 AM

0 Miembros y 1 Visitante están viendo este tema.

~

Hace un par de meses comencé a descargar el torrent de Geocities (de 641 Gigabytes), a una velocidad máxima de 400 Kilobytes por segundo, después de varios intentos parciales anteriores por buscar sitios antiguos de Internet de los 90's y principios del 2000, especialmente sitios técnicos con información interesante, como los sitios de Geocities en SiliconValley.

Necesité 3 Terabytes (1 disco de 1 Terabyte para descargar el torrent y otro disco de 2 Terabytes para descomprimir y finalmente guardar los contenidos, con un tamaño de clúster de 512 bytes y compresión NTFS activada, para ahorrar el máximo espacio posible), y usando también una laptop Dual Core a 2.4 GHz y 2 GB de memoria. Este es realmente un ejercicio muy interesante para aprender a manipular, copiar, detectar errores de CR5/MD5/SHA, administrar una enorme cantidad de datos arbitrarios del mundo real, y cosas que realmente no son tan críticas como la necesidad de reducir el tamaño del archivo MFT en una partición NTFS (con algo como Clean Disk Security), entre otras cosas a descubrir con más tiempo de tener que manejar tantos datos.



Este es el link del torrent:
Código (magnet) [Seleccionar]
magnet:?xt=urn:btih:2DC18F47AFEE0307E138DAB3015EE7E5154766F6&dn=geocities.archiveteam.torrent&tr=udp%3a%2f%2ftracker.openbittorrent.com%3a80&tr=udp%3a%2f%2ftracker.publicbt.com%3a80&tr=udp%3a%2f%2ftracker.istole.it%3a80%2fannounce&tr=udp%3a%2f%2fopen.demonii.com%3a1337


Este es el link que he puesto para visualizar cómodamente el contenido:
http://geocities.archefire.org/

Y el historial de intentos y del procedimiento para ponerlo finalmente en disco:

Agregado el dominio geocities.archefire.org (¿Qué Tiene De Nuevo para Ofrecer?)

Descargando el Torrent de Geocities


Resulta que hay mucho contenido que se ve mal si se trata de acceder localmente porque usa muchas URLs absolutas, y otros casos en los que el contenido puede existir pero estar disperso entre los diferentes directorios del torrent, y son tan enormes que lo mejor es buscar y redirigir automáticamente con PHP.

Así que puse todo el contenido, archivo por archivo, con el extra de que se puede ver el contenido de cada directorio existente sin que index.html estorbe, que es algo que no es posible hacer con otros mirrors como Reocities u OOcities, y en consecuencia no es posible saber de la existencia de mucho contenido ocultado por index.html, pero que está superado en este mirror que creé para mi conveniencia de visualización, y también para alguien más que quisiera poder ver el respaldo de Geocities en su totalidad, con absolutamente todo lo que eso implica.

Es posible que  este mirror esté ocasionalmente offline porque está en un disco USB de 3.5", y si necesito reconfigurar algo (o ahorrar electricidad, o por otras razones), sería mejor usar un disco interno o uno externo pero de 2.5".
Sitio web (si la siguiente imagen no aparece es porque está offline):