Zur Archivierung von Webseiten existieren einige Lösungen. So z.B. die Nutzung der Archivierungsmöglichkeiten vom Internet Archive. In meinem Fall wollte ich allerdings, für eine Recherche, mehrere Webseiten lokal archivieren. Natürlich kann die Webseite über Browser eigenen Funktionalitäten gespeichert werden. Auch der Ausdruck bzw. die Generierung eines PDFs aus dem Ausdruck ist möglich. Wesentlich einfacher funktioniert die Archivierung von Webseiten mit dem Firefox Add-On SingleFile.
Mit diesem Add-On ist es möglich eine Webseite in einer einzelnen HTML-Datei zu speichern. Bilder und andere Inhalte werden dabei in die HTML-Datei mit übernommen. Nach der Installation des Add-Ons kann über den entsprechenden Button einfach die Archivierung einer Webseite angestossen werden. Die erzeugte HTML-Datei wird dabei automatisch heruntergeladen.
Die Erweiterung selbst wird auf GitHub entwickelt und ist unter der AGPL3 lizenziert. Damit handelt es sich bei der Erweiterung um freie Software. Neben der Firefox-Variante kann die Erweiterung auch unter Chrome genutzt werden.
Die Mediendateien mit in die HTML? Ist das sinnvoll? Vor zig Jahren hatte ich mal ein/e Plugin-/Softwarelösung gefunden, die Webseiten in ihrer originalen Struktur inkl. Unterordner und interner links downloaden konnte. Man hatte dann alles lokal auf der Platte. Ich vermute mal, php & Co. gab es damals noch nicht. War ganz praktisch, wenn man nur an den Mediendateien interessiert war. ;-)
Kommt, wie immer auf den Anwendungsfall an ;) In meinem Fall wollte ich bestimmte Quellen, also hauptsächlich Text und Bilder archivieren. Da ich dann gut 100 Quellen herumzuliegen hatte, wollte ich die gerne als einzelne Datei und nicht durchmischt mit hundert anderen Sachen und Strukturen. Sprich pro Seite eine Datei, das Ganze ließ sich dann gut wegsortieren.
BTW – Zum Thema Webseiten mit Struktur herunterladen: https://seeseekey.net/archive/10482/