Webseiten aus der Wayback Machine herunterladen

Wenn man eine nicht mehr verfügbare Webseite aufrufen möchte oder einen älteren Stand einer Webseite benötigt ist die Wayback Machine vom Internet Archive stets zur Stelle. Das Internet Archive ist eine gemeinnützige Organisation, welche seit 2007 offiziell als Bibliothek vom US-amerikanischen Bundesstaat Kalifornien anerkannt ist.

archive.org/web/

Manchmal benötigt man einen Snapshot einer bestimmten Version der Webseite und möchte diesen nicht umständlich über das Webinterface der Wayback Machine herunterladen. In diesem Fall kann sich des Tools wayback-machine-downloader bedienen. Dieses Tool, welches in Ruby geschrieben ist, kann einfach über den Ruby-Paketmanager installiert werden:

gem install wayback_machine_downloader

Anschließend kann das Tool genutzt werden:

wayback_machine_downloader http://example.com

Damit wird der letzte gesammelte Snapshot heruntergeladen. Daneben existieren Option wie die –to Optionen um den Snapshot nur aus einem bestimmten Zeitraum zu holen. Da ich mehrere Snapshots einer Seite benötigte habe ich das ganze in ein Skript gegossen:

#sh

for i in `seq 127 1`;
  do
    # Define date postfix
    DATE_POSTFIX="28120000";
			
    # Linux (Linux date)
    #DATE=`date +%Y%m -d "$i month ago"`    
				
    # macOS (BSD date) 
    DATE=`date -j -v-${i}m +%Y%m` 
    
    # Add date postfix
    DATE=$DATE$DATE_POSTFIX
				
    # Create folder for snapshot
    mkdir $DATE
    cd $DATE

    # Download snapshot
    wayback_machine_downloader http://example.com --to $DATE

    # Leave folder
    cd ..
  done  

In diesem Skript wird durch das Skript 127 Monate in die Vergangenheit gereist und ein Snapshot der Webseite heruntergeladen. Das ganze läuft so lange durch bis das Ende der Schleife erreicht ist. So erhält man pro Monat einen Snapshot. Der Wayback Machine Downloader, dessen Quelltext auf GitHub zu finden ist, ist unter der MIT Lizenz lizenziert und damit freie Software.

C64 Preservation Project

Die goldenen Zeiten des Commodore 64 sind (leider) schon seit knapp 30 Jahren vorbei. Software wurde damals auf Kassetten und Disketten ausgeliefert. Gemeinsam haben diese Datenträger, das sie die Daten magnetisch speichern. Diese Datenträger sind dabei nicht auf Langzeit-Archivierung ausgelegt. Damit das Erbe dieser Ära nicht verloren geht, gibt es Projekte wie das C64 Preservation Project. Ziel des Projektes ist es die Erhaltung originärer Spiele und Anwendungen. Dabei geht es auch um solche Dinge wie die Erhaltung des „Kopierschutzes“ der Spiele und Anwendungen.

Die überarbeitete Version des Commodore 64

Die überarbeitete Version des Commodore 64

Anlässlich des zehnjährigen Bestehens wurde die 10th Anniversary Collection vom Projekt herausgegeben. Sie wird beim Internet Archive gehostet. Die offizielle Seite des Projektes ist unter c64preservation.com zu finden.

Gecachte Webseiten aufrufen

Im Internet gibt es eine Reihe von Diensten und Archiven, welche Snapshots von Webseiten speichern. Die bekanntesten dieser Dienste dürften Archive.org bzw. dessen Wayback-Machine und der Google Cache sein.

CachedView.com

CachedView.com

Ist man nun auf der Suche nach einer bestimmten Webseite, so kann man die einzelnen Caches natürlich einzeln abklappern. Eleganter funktioniert dies mit CachedView – dort gibt man die gesuchte URL ein und durchsucht damit gleichzeitig den Google Cache, das Webarchiv von Archive.org und den Coral Cache. Zu Finden ist CachedView unter cachedview.com.

1001 MS-DOS Spiele

Das Internet Archiv (archive.org) hat vor einigen Tagen knapp 2400 MS-DOS Spiele aus den 80er und 90er Jahren auf seinen Seiten zur Verfügung gestellt. Nach der Veröffentlichung von einigen hundert Arcadespielen, ist dies nun die zweite größere Veröffentlichung in diesem Bereich.

Commander Keen auf archive.org

Commander Keen auf archive.org

Die Spiele stehen dabei auf der entsprechenden Unterseite zur Verfügung. Sie stehen dabei als Stream zur Verfügung, was bedeutet das man die Spiele mittels des MESS-Emulators im Browser spielen kann. Das Internet Archive verfügt über eine Ausnahmegenehmigung vom DMCA, welche es dem Archiv erlaubt, die Spiele zum Zwecke der Langzeitarchivierung zu erhalten und der Öffentlichkeit bereitzustellen.