Web Developer & DesignerKategorie

Wayback Machine – Alte und gelöschte Websites finden

12 min lesen
Wolf-Dieter Fiege

Wie findet man alte oder gelöschte Websites im Internet wieder?

Die Wayback Machine im Internet Archive ist das Werkzeug, um auf die Historie der Online-Welt zuzugreifen. Dieses gemeinnützige Projekt speichert mehr als 839 Milliarden Webseiten sowie zusätzliche Medien. Im Internet Archive sind Schnappschüsse von über 839 Milliarden Webseiten gespeichert, und die Sammlung wächst kontinuierlich.

Abbildung 1: Im Internet Archive sind Schnappschüsse von mehr als 391 Milliarden Webseiten gespeichert – und es wächst weiter.
Im Internet Archive sind Schnappschüsse von mehr als 391 Milliarden Webseiten gespeichert – und es wächst weiter.

Die Bibliothek enthält Momentaufnahmen der entsprechenden Websites, die die HTML-Version einer Seite zeigen, wobei einzelne Elemente sogar anklickbar sind. Die Wayback Machine ist nur ein Teil des Internet Archive.

Hintergrund zum Internet Archive

Das Internet Archive, in dem sich die Wayback Machine befindet, wurde 1996 als gemeinnütziges Projekt gegründet. Das Ziel ist es, digitale Daten möglichst barrierefrei und langfristig zu archivieren. Die Bibliothek der Wayback Machine des Internet Archive enthält neben den Momentaufnahmen von Websites auch über 46,1 Millionen kostenlose Bücher und Texte, 11 Millionen Videos, 14 Millionen Audiodateien, 1 Million Computerprogramme und 4,8 Millionen Bilddateien. Darüber hinaus stehen über 25 Millionen wissenschaftliche Arbeiten zur Verfügung. Der Datenbestand wächst jeden Monat um rund 20 Terabyte, was auch für SEO-Zwecke von Interesse ist. Die Wayback Machine archiviert täglich über eine Milliarde öffentliche Webseiten, was ihre umfangreiche Reichweite und Bedeutung für die Web-Erhaltung unterstreicht.

Das Internet Archive hat sich zudem der Mission verschrieben, den Zugang zu digitalen Inhalten für blinde oder anders beeinträchtigte Menschen zu gewährleisten. Es betont sein Engagement für Barrierefreiheit und Inklusivität in der digitalen Archivierung. Zudem ermöglicht das Internet Archive-Nutzern, URLs manuell zu archivieren, was die Benutzerbeteiligung und das Engagement erhöht.

Eine aktuelle Studie zeigt, dass 25 % der zwischen 2013 und 2023 veröffentlichten Webseiten verschwunden sind, wobei 38 % der Webseiten aus dem Jahr 2013 nicht mehr funktionieren. Besonders besorgniserregend ist, dass 8 % der im Jahr 2023 veröffentlichten Webseiten bis Oktober desselben Jahres bereits nicht mehr verfügbar waren. Diese Statistiken verdeutlichen die entscheidende Rolle der Wayback Machine bei der Bewahrung der digitalen Geschichte.

Das Internet Archive sieht sich jedoch auch finanziellen Herausforderungen, technischen Problemen, Cyberangriffen und rechtlichen Auseinandersetzungen gegenüber. Eine kürzliche gerichtliche Entscheidung bezüglich der Ausleihe digitaler Buchkopien könnte die finanzielle Stabilität und die Betriebsabläufe des Internet Archive beeinträchtigen. Diese Umstände bieten wichtigen Kontext für die Nutzer und verdeutlichen die Fragilität der digitalen Infrastruktur.

Ja, das Internet Archive bietet fast ausschließlich lizenzfreie Inhalte an. Die Inhalte werden ohne Urheberrechtsanspruch gespeichert.

Die Suche nach alten und gelöschten Websites

Die Bibliothek der Wayback Machine lässt sich einfach mithilfe des Suchfelds durchsuchen. Hier trägst du die Domain ein, zum Beispiel: de.godaddy.com.

Abbildung 2: So sieht das Suchergebnis für https://www.godaddy.com/de-de aus
So sieht das Suchergebnis in der Wayback Machine im Internet Archive für https://www.godaddy.com/de-de
aus.

So sieht das Suchergebnis in der Wayback Machine im Internet Archive für https://www.godaddy.com/de-de aus: Zwischen dem 27. Mai 2011 und dem 11. November 2019 (dem Tag, an dem dieser Artikel erstellt wurde) wurde die Website 1.117 Mal gecrawlt. Die Zahl aus dem Internet Archive der Wayback Machine entspricht nicht der Anzahl tatsächlicher Aktualisierungen. Klicke auf ein markiertes Datum, um den Stand der Website zu diesem Zeitpunkt anzuschauen.

Abbildung 3: Startseite von GoDaddy im April 2014
Startseite von GoDaddy im April 2014.
Abbildung 4: Startseite GoDaddy im März 2016
Startseite GoDaddy im März 2016.

Wayback Machine: Die Historie des Internets durchstöbern

Statt einer URL kannst du auch einen Suchbegriff eingeben, ähnlich wie bei Suchmaschinen. In der Folge wird eine Liste passender Websites angezeigt.

Einschränkungen der Wayback Machine?

Teilweise fehlen Webseiten, und die Seiten sind nicht immer vollständig. Wenn JavaScript verwendet wurde, ist die Darstellung nicht immer optimal, und größere Bilder fehlen häufig.

Den vorherigen Inhalt von 404-Fehlerseiten anzeigen

Wenn du im Internet nach Informationen suchst, landest du manchmal auf einer 404-Fehler-Seite. Dies passiert, wenn der Website-Betreiber den Inhalt der Seite gelöscht hat, du jedoch noch auf den Link zur URL klicken konntest. Falls du wissen möchtest, welche Informationen hier zu finden waren, trage die URL in die Wayback Machine ein und starte die Suche. Eine praktische Alternative ist die Installation der Wayback Machine Extension für die Browser ChromeFirefox oder Safari. Wenn du bei der Recherche auf eine 404-Seite stößt, wird automatisch in der Wayback Machine nach einer archivierten Kopie gesucht und diese angezeigt. Die Wayback Machine erkennt zahlreiche Fehlercodes wie 404, 410, 500, 502 und 520.

Wayback Machine: Kann ich verlorene Websites wiederherstellen?

Ja, die Chancen sind gut. Wenn deine Website Opfer eines Hackerangriffs wurde oder du aus Versehen eine oder mehrere Seiten gelöscht hast, kannst du mit der Wayback Machine des Internet Archive wahrscheinlich auf ältere Versionen deiner Website zugreifen und die Informationen für die Wiederherstellung nutzen – ganz ohne eigenes Backup.

Wusstest du, dass du bei einem Managed WordPress-Hosting-Produkt von GoDaddy eine kostenlose Staging-Umgebungen erhältst (ab Managed WordPress Deluxe). Mit der Staging-Umgebung kannst du alle Website-Änderungen in Ruhe teste, bevor sie live gehen. Erfahre mehr über Managed WordPress-Hosting.

Die Wayback Machine des Internet Archive zeigt, wer einen Inhalt zuerst veröffentlicht hat

Das Netz ist voller doppelter Inhalte, wobei Website-Betreiber einfach Inhalte anderer Websites übernehmen. Die Frage ist dann: Wer hat von wem abgeschrieben, und wer ist der wahre Urheber des Texts? Mit der Wayback Machine lässt sich unter Umständen nachweisen, wann der eigene Text erstmals veröffentlicht wurde – und wann der eines Konkurrenten. Bei Urheberstreitigkeiten akzeptieren Gerichte meist die Schnappschüsse der Wayback Machine des Internet Archive.

FAQ zur Wayback Machine

Was ist die Wayback Machine?

Die Wayback Machine ist ein Dienst, der Zugriff auf ein öffentlich und kostenfrei zugängliches Webseiten-Archiv erlaubt. „Way back“ bedeutet auf Englisch umgangssprachlich „vor langer Zeit“, steckt aber auch in „the way back“ – dem Weg zurück. Der Name ist Programm: Über die Wayback Machine kannst du alte Versionen von Webseiten abrufen. Diese werden vom Internet Archive gespeichert, wobei die ältesten aus dem Jahr 1996 stammen, dem Geburtsjahr des Projekts.

Wer betreibt die Wayback Machine?

Die Wayback Machine wird vom Internet Archive betrieben, einer in den USA ansässigen gemeinnützigen Organisation. Die Archivierung alter Internetseiten war die erste Mission des Internet Archive. Mittlerweile ist das Internet Archive in den USA als richtige Bibliothek anerkannt und hat es sich zum Ziel gesetzt, alle möglichen digitalen Medien und Formate zu archivieren. Dazu gehören neben Webseiten und digitalen Büchern auch Audiodateien, Videos und Software.

Wie funktioniert die Wayback Machine?

Das Webseiten-Archiv des Internet Archive speist sich aus den Daten von verschiedenen Crawlern. Diese kleinen Programme durchsuchen das Internet, ähnlich wie Suchmaschinen. Dort, wo sie das dürfen, archivieren und indexieren sie Website-Inhalte und erzeugen einen Website-Schnappschuss. Der zugehörige Index, der alle diese historischen Versionen von Webseiten auffindbar macht, ist ein sogenannter dreidimensionaler Index. Das bedeutet, dass sowohl die Inhalte verschiedener URLs indexiert werden als auch die Zeiten, zu denen die Schnappschüsse dieser Inhalte angefertigt wurden.

Wie kann ich die Wayback Machine nutzen, um ältere Versionen von Websites anzusehen?

Besuche einfach die Startseite der Wayback Machine und gib im Suchfeld die URL der Seite ein, deren historische Versionen du betrachten möchtest – z. B. https://www.godaddy.de. Nun erscheint zunächst eine Zeitleiste, auf der du sehen kannst, zu welchen Jahren es Inhalte gibt. Wenn du auf ein Jahr klickst, wird im Kalender angezeigt, an welchen Tagen in diesem Jahr ein Schnappschuss der Webseite abgespeichert wurde. Fährst du mit der Maus über eines der markierten Kalenderdaten, wird ein Kasten mit Datum und Uhrzeit angezeigt. Klickst du auf eine Uhrzeit, wirst du auf die Seite weitergeleitet, die dir den Inhalt der URL genau zu diesem Zeitpunkt zeigt.

Abbildung: Snapshot Wayback Machine
Gibt es eine Möglichkeit, die gesamte Historie einer Website mit der Wayback Machine einzusehen?

Wie du in der Kalenderansicht sehen kannst, ist die Archivierung nicht lückenlos. Je nach Webseite sind mehr oder weniger Schnappschüsse gespeichert. Oft gibt es auch Jahre, für die von einer bestimmten Webseite gar nichts abgespeichert ist. Du kannst also im Prinzip die ganze Historie einer Webseite seit 1996 abrufen (beziehungsweise seit dem Datum, als sie online gegangen ist), aber nicht lückenlos.

Welche Arten von Inhalten werden von der Wayback Machine archiviert?

Über die Wayback Machine sind die Inhalte von Webseiten zugänglich. Dies funktioniert am besten mit statischen Seiten oder mit dynamischen Seiten, die normales HTML generieren. Dynamische Seiten, deren Darstellung hauptsächlich von JavaScript oder anderen Plugins abhängt, werden zwar auch archiviert, können aber oft nicht korrekt angezeigt werden. Das Internet Archive archiviert auch andere digitale Medien wie Bücher, Videos, Audiodateien und Software. Darüber hinaus stehen über 46 Millionen E-Books zur Verfügung.

Kann ich Websites, die nicht mehr online sind, mithilfe der Wayback Machine wiederherstellen?

Die Wayback Machine archiviert nicht nur alte Versionen von existierenden Webseiten, sondern auch Webseiten, die mittlerweile gelöscht sind. Diese können in der Wayback Machine angesehen werden, aber es gibt keine automatisierte Funktion, mit der der Inhaber einer gelöschten Webseite diese aus der Wayback Machine wiederherstellen könnte. Du kannst dir jedoch die gelöschte Seite in der Wayback Machine ansehen und die Inhalte manuell übernehmen.

Wie oft wird die Wayback Machine aktualisiert und wie aktuell sind die gespeicherten Daten?

Das ist unterschiedlich und hängt von der Webseite ab sowie davon, wie oft diese von verschiedenen Crawlern besucht wird. Die Aktualität der Daten kannst du bei jedem Schnappschuss genau sehen, da der Zeitpunkt des Schnappschusses auf die Sekunde genau angegeben wird.

Welche Tools und Funktionen bietet die Wayback Machine für Recherchezwecke?

Neben der bereits erwähnten Kalenderfunktion gibt es noch andere Funktionen, die du unterhalb des Suchfeldes findest: In Collections findest du die Schnappschüsse nach Quelle sortiert – also aus welchem Crawler oder welcher anderen Quelle sie stammen. Mit Changes kannst du zwei Schnappschüsse vergleichen und dir die Unterschiede anzeigen lassen. Unter Summary kannst du dir Statistiken für die gewählte Webseite anzeigen lassen, beispielsweise, wie viele Schnappschüsse in bestimmten Zeiträumen erstellt wurden. Unter Site Map erstellt die Wayback Machine grafisch aufbereitete Sitemaps für die archivierten Webseiten. Unter URLs wird dir detailliert aufgelistet, welche URLs für die Webseite archiviert wurden.

Gibt es Datenschutzbedenken im Zusammenhang mit der Verwendung der Wayback Machine?

Das ist nicht ganz einfach zu beantworten, da das Internet Archive in den USA ansässig ist und in den USA und in Europa unterschiedliche Datenschutzgesetze gelten. Auf jeden Fall werden Inhalte der Wayback Machine und des Internet Archive nicht dadurch öffentlicher Besitz, dass sie dort archiviert sind. Datenschutz und Urheberrecht gelten weiterhin. Wenn du in der Wayback Machine etwas findest, das personenbezogene Daten von anderen enthält oder Inhalte, für die andere Menschen das Urheberrecht besitzen, darfst du es nicht auf deiner Webseite veröffentlichen. Wenn du deine eigenen Rechte im Datenschutz oder dein Urheberrecht durch Inhalte in der Wayback Machine verletzt siehst, kannst du dich an den Internet Archive Copyright Agent wenden, der die Anfrage prüft und die Inhalte gegebenenfalls aus dem Archiv entfernt.

Kann ich Websites aus der Wayback Machine herunterladen oder extrahieren?

Wenn du die alte Version einer Webseite in der Wayback Machine anzeigst, kannst du in deinem Browser den Quelltext anzeigen, Textinhalte herauskopieren, Bilder abspeichern und alles machen, was du mit deinem Browser auch auf einer aktuellen Webseite tun kannst, um die Inhalte zu extrahieren. Außerdem gibt es auf GitHub ein kostenloses Tool, den Wayback Machine Downloader, das allerdings nur für fortgeschrittene Nutzer geeignet ist, die mit der Kommandozeile und der Programmiersprache Ruby arbeiten können.

Welche Einschränkungen oder Begrenzungen gibt es bei der Nutzung der Wayback Machine?

Wie bereits erwähnt, befreit die Wayback Machine dich nicht von der Verantwortung, Datenschutz und Urheberrecht zu beachten. Nur weil du einen Inhalt in der Wayback Machine findest, heißt das nicht, dass er frei verwendbar ist. Die Geschäftsbedingungen des Internet Archive besagen außerdem, dass du es nur zu Forschungs- und Recherchezwecken nutzen darfst.

Gibt es eine Möglichkeit, meinen eigenen Webinhalt in der Wayback Machine zu archivieren?

Ja, direkt auf der Startseite der Wayback Machine gibt es unter der Überschrift „Save Page Now“ die Möglichkeit, eine URL direkt hinzuzufügen. Du wirst dann auf die Seite weitergeleitet, auf der du deine Anfrage bestätigen und auswählen kannst, ob auch Fehlerseiten (z. B. 404) mitgespeichert werden sollen. Du musst dafür keinen eigenen Account bei der Wayback Machine haben, und die URL, die du anmeldest, muss nicht unbedingt deine eigene sein.

Welche anderen ähnlichen Dienste zur Webarchivierung gibt es neben der Wayback Machine?

Es gibt den alternativen Dienst archive.today. Dieser hat nicht die überwältigende Menge an Daten wie die Wayback Machine, bietet aber einen kleinen, feinen Unterschied: Während in der Wayback Machine keine Seiten archiviert werden, die keine Crawler zulassen, sind solche Seiten in archive.today trotzdem vertreten, und zwar mit einem Screenshot.

Das Internet Archiv Wayback Machine - Fazit

Die Wayback Machine ist ein praktisches, hilfreiches und informatives Werkzeug, um die Entwicklung von Webseiten nachzuvollziehen. Webseiten repräsentieren Wissen oder Meinungen, die zu einer bestimmten Zeit wichtig waren. Auf diese Weise gewinnst du nicht nur Einblicke in die Historie des Webs, sondern auch in gesellschaftliche Entwicklungen.

Quellen und weitere Artikel zum Thema

Dieser Artikel ist am 11.11.2019 erschienen und wurde am 19.02.2024 sowie dem 09.10.2024 aktualisiert.

Bildnachweis: Unsplash

Products Used