Maak een offline kopie van een site met Wget op Windows en Linux
Maak een offline mirror-kopie van een site met Wget op Windows en Linux
Soms heeft u een doorbladerbare kopie van een website nodig, zodat u deze offline kunt openen, op een USB-stick kunt zetten of zelfs naar uw smartphone kunt uploaden en deze tijdens het vliegen of reizen kunt lezen. Hoewel het in moderne browsers en besturingssystemen gemakkelijk is om een webpagina in PDF op te slaan, kan het vervelend zijn om elke afzonderlijke pagina te verwerken. Hier komt wget.
Wget is een open-source downloadmanager. Het is een console-app die voornamelijk voor Linux is ontwikkeld, maar met succes is geport naar andere besturingssystemen, waaronder Windows en MacOS.
Als u niet bekend bent met wget, moet u het zeker eens proberen. Het is erg krachtig. Hiermee kunnen bestanden van websites worden opgehaald met HTTP, HTTPS en FTP, de internetprotocollen die we tegenwoordig gebruiken. Het gedrag wordt bepaald door opdrachtregelargumenten.
Wget ondersteunt verschillende opties om bestanden op langzame of onstabiele verbindingen op te halen, inclusief nieuwe pogingen, doorgaan waar het gebleven was en meer. Het ondersteunt het bestand "robots.txt", dus het kan werken als een webcrawler. Het kan alleen gewijzigde bestanden ophalen, ondersteunt jokertekens, bestandstypelimieten en reguliere extensies.
Wget ondersteunt het recursief ophalen van HTML-websites en FTP-servers, zodat u een websitespiegeling kunt maken. Hier is hoe het kan.
Voordat u doorgaat, moet u de wget-app downloaden.
Wget op Windows downloaden
Ik gebruik meestal binaire bestanden van deze bronnen:
- Eeuwig Verveeld
- BronForge
Beiden doen hun werk.
Wget op Linux downloaden
Gebruik de pakketbeheerder van je distro. Enkele voorbeelden (run ze als root):
Debian/Ubuntu/Mint:
apt installeer wget
CentOS/Redhat
yum installeer wget
Arch Linux
pacman -Sy wget
Linux ongeldig maken
xbps-install -S wget
Om een offline kopie van een site te maken met Wget,
- Open opdrachtprompt / terminal.
- Typ in Windows het volledige pad naar het bestand wget.exe.
- Typ in Linux gewoon wget.
- Typ nu de volgende argumenten om de volgende opdracht te krijgen:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Vervang de
https://site-to-download.com
gedeelte met de daadwerkelijke site-URL waarvan u een spiegel wilt maken.
Je bent klaar!
Dit zijn de schakelaars die we gebruiken:
-
--spiegel
- past een aantal opties toe om de download recursief te maken. -
--geen-ouder
– Kruip niet in de bovenliggende map om alleen een deel van de site te krijgen. -
--convert-links
- zorgt ervoor dat alle links correct werken met de offline kopie. -
--pagina-vereisten
- download JS- en CSS-bestanden om de originele paginastijl te behouden bij het bladeren door een lokale spiegelserver. -
--aanpassing-extensie
- voegt de juiste extensies (bijv. html, css, js) toe aan bestanden als ze zonder deze werden opgehaald.
Dat is het.