Webseiten mirroren mit wget

Wget kennen viele schon, die ihre ersten Schritte mit Linux gemacht haben. 😉

Tatsächlich kann man mit dem praktischen tool, aber noch viel mehr machen, z.B. eine ganze Webseite herunterladen „spiegeln“.

Und so gehts; einfach an der Konsole diesen Befehl einfügen:

wget -mk http://www.example.com/

Der paramter ‚-m‘ sagt, dass ihr grundsätzlich die Seite mirroren wollt und ‚-k‘ wandelt in den Seite links die z.B. auf http://www.example.com/css/main.css verweise in lokale links a’la: css/main.css um.

Achtung bei grossen Websites
Falls ihr grosse Webseiten herunterladet solltet ihr zusätzlich den parameter ‚-w 20‘ angeben um die Webseite nicht zu überlasten!
Tip: Blockierte Webseiten
Es gibt Seiten, die gewisse User-Agent wie z.B. „wget“ den Zugriff auf die Seiten verweigern.
Doch nicht verzagen: Einfach den parameter:

--user-agent Mozilla/4.0

beim wget Kommando anfügen und die Webseite lässt uns passieren! 😉

Dieser Tip stammt von der Seite: FOSSwire: FOSSwire Create a mirror of a website with Wget und blog.emeidi.com: Kleine wget-Tricks

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.