Webseiten archivieren mit HTTrack

Mit Hilfe der Software HTTrack Website Copier kann man ganze Webseiten archivieren und sie ohne Internetverbindung aufrufen. Die komplette Webseite inklusive etwaiger Medieninhalte ist auf dem archivierten Stand abrufbar.

Beachtet werden sollte, dass sich HTTrack im normalen Modus an die Konfiguration der robots.txt hält. Seiten, welche Beispielsweise von Suchmaschinen nicht indiziert werden wollen, werden auf diese Art und Weise nicht archiviert. Hierfür muss dieses Verhalten gesondert deaktiviert werden.

Für den mobilen Gebrauch existiert eine App, welche im Play-Store heruntergeladen werden kann.

Vorgehen

Die einfachste und schnellste Art eine Webseite zu spiegeln kann mit folgendem Befehl erreicht werden:

httrack "http://www.reneknipschild.net/" -O "/tmp/www.reneknipschild.net" "+*.reneknipschild.net/*" -v

Auf diese Weise wird die komplette Webseite http://www.reneknipschild.net/ heruntergeladen und im Verzeichnis /tmp/www.reneknipschild.net gespeichert.

Für weitere, speziellere Anwendungsfälle gibt das folgende Kommando Hilfestellung:

httrack --help

Konkrete Anwendungsbeispiele werden im Manual unter der URL https://www.httrack.com/html/fcguide.html geklärt.

GUI

Für die verschiedenen Betriebssysteme existieren neben der oben beschriebenen Befehlszeilenversion Programme mit grafischer Bedienoberfläche. Für Windows existiert das Programm WinHTTrack, die Linux GUI wird über das Programm WebHTTrack zur Verfügung gestellt.

HTTrack bietet auch hier ein gutes Manual an, welches Schritt für Schritt das Vorgehen erklärt.

Links

comp/www/httrack.txt · Zuletzt geändert: 01.03.2017, 13:47 Uhr von wikiredaktion@reneknipschild.de
 
Falls nicht anders bezeichnet, ist der Inhalt dieses Wikis unter der folgenden Lizenz veröffentlicht: CC Attribution-Share Alike 3.0 Unported
rkWiki wird freundlich bereitgestellt von
René Knipschild – Custom Software Development, Ihr Partner in Sachen IT-Beratung & individueller Software-Entwicklung. www.IT-Beratung-Nordhessen.de – Made in Germany
Copyleft inverted copyright sign 2012-2022 René Knipschild | www.reneknipschild.net | Impressum | Datenschutz