Vytvořte offline kopii webu pomocí Wget na Windows a Linux
Vytvořte offline zrcadlovou kopii webu pomocí Wget na Windows a Linux
Někdy potřebujete získat kopii webové stránky, kterou lze procházet, abyste k ní měli přístup offline, vložili ji na USB klíč nebo ji dokonce nahráli do smartphonu a četl ji, když létáte nebo cestujete. I když je v moderních prohlížečích a operačních systémech snadné uložit webovou stránku do PDF, může být nepříjemné zpracovávat každou jednotlivou stránku. Tady přichází wget.
Wget je správce stahování s otevřeným zdrojovým kódem. Je to konzolová aplikace vyvinutá primárně pro Linux, ale úspěšně portovaná na jiné OS, včetně Windows a MacOS.
Pokud wget neznáte, určitě byste to měli zkusit. Je to velmi silné. Umožňuje načítání souborů z webových stránek pomocí HTTP, HTTPS a FTP, internetových protokolů, které dnes používáme. Jeho chování je řízeno argumenty příkazového řádku.
Wget podporuje řadu možností pro načítání souborů na pomalých nebo nestabilních připojeních, včetně opakování, pokračování tam, kde skončilo, a další. Podporuje soubor „robots.txt“, takže může fungovat jako webový prohledávač. Dokáže načíst pouze upravené soubory, podporuje zástupné znaky, limity typů souborů a běžné přípony.
Wget podporuje rekurzivní získávání HTML webových stránek a FTP serverů, což vám umožňuje vytvořit zrcadlo webových stránek. Zde je návod, jak to lze provést.
Než budete pokračovat, musíte si stáhnout aplikaci wget.
Získejte Wget na Windows
Obvykle používám binární soubory z těchto zdrojů:
- Věčně nuda
- SourceForge
Oba dělají svou práci.
Získejte Wget na Linuxu
Použijte správce balíčků vašeho distribuce. Několik příkladů (spustit je jako kořen):
Debian/Ubuntu/Mint:
apt install wget
CentOS/Redhat
yum nainstalovat wget
Arch Linux
pacman -Sy wget
Void Linux
xbps-install -S wget
Chcete-li vytvořit offline kopii webu pomocí Wget,
- Otevřeno příkazový řádek / terminál.
- V systému Windows zadejte úplnou cestu k souboru wget.exe.
- V systému Linux zadejte pouze wget.
- Nyní zadejte následující argumenty, abyste získali následující příkaz:
wget --mirror --convert-links --adjust-extension --page-quires --no-parent https://site-to-download.com
- Nahradit
https://site-to-download.com
část se skutečnou adresou URL webu, kterou chcete zrcadlit.
Jsi hotov!
Zde jsou přepínače, které používáme:
-
--zrcadlo
- používá řadu možností, aby bylo stahování rekurzivní. -
--ne-rodič
– Neprocházejte nadřazený adresář, abyste získali pouze část webu. -
--konvertovat-odkazy
- zajistí, aby všechny odkazy správně fungovaly s offline kopií. -
náležitosti stránky
- stáhněte si soubory JS a CSS, abyste zachovali původní styl stránky při procházení místního zrcadla. -
--adjust-extension
- přidá k souborům příslušné přípony (např. html, css, js), pokud byly načteny bez nich.
A je to.