Webinhalte verloren? – Die Wayback Machine kann helfen
Wayback Machine: Kurzerklärung
Die Wayback Machine ist ein Archiv, welches die größte Online-Bibliothek der Welt ist und historische Momentaufnahmen von über 300 Milliarden Websites zur verfügung stellt.
Dieses Internet Archive, auch Wayback Machine genannt, sollte jeder Webmaster kennen. Es ist ein nützlicher Helfer, wenn Webinhalte durch Crashs oder Update-Pannen komplett verschwunden sind.
Bei der Wayback Machine handelt es sich um ein gemeinnütziges Projekt, welches im Jahr 1996 ins Leben gerufen wurde. Betreiber ist eine von Brewster Kahle initiierte Non-Profit-Organisation mit Sitz in San Francisco. Zu Beginn agierte das Projekt als reines Internetarchiv. Seit 2007 hat das Projekt den Status einer allgemeinen Bibliothek.
Was ist in der Wayback Machine hinterlegt?
Die meisten Prüftools für Webmaster nutzen die Wayback Machine, um das Alter einer Domain zu ermitteln. Die von dort gelieferten Daten sind üblicherweise sehr zuverlässig. Im Internet Archive finden sich Momentaufnahmen von Website in verschiedenen Stadien. Im Spätherbst 2016 wurde der Bestand offiziell mit mehr als 270 Milliarden Website angegeben. Der Begriff ist hier nicht mit Domains gleichzusetzen, weil dabei auch die gespeicherten Untersites einer Website Berücksichtigung finden. Welche Websites im Internet Archive hinterlegt werden, entscheidet der Dienst Alexa Internet. Er wurde 1996 ebenfalls von Brewster Kahle ins Leben gerufen und gehört seit 1999 zu Amazon. Seit der Übernahme gehören auch die Prelinger Archives zu den Beständen der Online-Bibliothek.
Wie hilft die Wayback Machine bei der Rekonstruktion einer Website?
Normalerweise ist es sehr unwahrscheinlich, dass die Inhalte einer Website komplett verschwinden. Einerseits werden die Artikel in der Regel lokal auf den Rechnern der Verfasser und im Webspace oder auf dem Server gespeichert. Außerdem machen die meisten Webmaster regelmäßig komplette Backups ihrer Websites. Beispielsweise bei WordPress muss dafür lediglich eine Datenbank exportiert werden. Doch es kann durchaus vorkommen, dass sowohl Server als auch lokale Rechner zeitgleich von Ausfällen betroffen sind. Beispiele dafür haben die Pannenupdates für das Betriebssystem Windows 10 im Jahr 2018 geliefert. In diesem Fall ist die Wayback Machine ein guter Anlaufpunkt. Je nach Intervall der Momentaufnahmen lassen sich dort große Teile der Inhalte einer Website zurückgewinnen.
So funktioniert die Wayback Machine
Die Recherche ist sehr einfach gestaltet:
- Geben Sie in das Textfeld Ihre gewünschte Domain ein.
- In einer Kalenderübersicht erscheinen die Daten der einzelnen Indexierungen seit 1996 beziehungsweise der erstmaligen Veröffentlichung (sofern diese für die eingegebene Domain verfügbar sind).
- Nach dem Klick auf ein gekennzeichnetes Datum wird die Website gezeigt, wie sie zu diesem Zeitpunkt aussah.
Die Eingabe eines Suchbegriffs wie gewohnt bei Google ist ebenfalls möglich. Eine Liste der übereinstimmenden Websites für das Keyword wird angezeigt. Der Benutzer klickt auf die gewünschte Seite und fährt dann wie in Punkt 2 angegeben fort.
Ein großer Vorteil der Wayback-Maschine ist, dass die historischen Seiten nicht nur in Form eines Bildes vorliegen, sondern die HTML-Version der Website zum jeweiligen Zeitpunkt wird angezeigt. Es sind also beispielsweise die einzelnen Links anklickbar. Im Gegensatz zum Google-Cache springt das Internet Archive nicht zur aktuellen Online-Version der betreffenden URL, sondern zur jeweiligen Verlaufsseite.
Viel Zeit für die Rekonstruktion mit dem Internet Archive einplanen!
Der Wiederaufbau von Websites auf diese Art kostet viel Zeit, weil jeder Artikel einzeln aufgerufen und kopiert werden muss. Hinzu kommt, dass das Internet Archive streckenweise sehr langsam reagiert. Je nach Wochentag und Uhrzeit kann es mehrere Minuten dauern, bis ein Artikel oder eine Unterseite angezeigt wird. Außerdem sind umfangreiche Nachbearbeitungen möglich, da sämtliche in den Artikeln enthaltenen Links korrigiert werden müssen. Der Rückgriff auf das Internet Archive bei der Rekonstruktion einer Website kann also nur die letzte Notlösung sein.
Die Betreiber der Wayback Machine sind ständig dabei, den Nutzerkomfort zu verbessern. Schon jetzt werden die Inhalte der Hauptserver in San Francisco auf mehrere Server an anderen Standorten gespiegelt. Einer der Spiegelserver befindet sich in der Bibliotheca Alexandrina in Ägypten. Im Jahr 2016 wurde beschlossen, einen weiteren Spiegelserver in Kanada zu installieren.