Lag frakoblet kopi av et nettsted med Wget på Windows og Linux
Lag frakoblet speilkopi av et nettsted med Wget på Windows og Linux
Noen ganger må du få en søkbar kopi av en nettside, slik at du kan få tilgang til den offline, sette på en USB-pinne eller til og med laste opp til smarttelefonen din og lese den når du flyr eller reiser. Selv om det er enkelt i moderne nettlesere og operativsystemer å lagre en nettside til PDF, kan det være irriterende å behandle hver enkelt side. Her kommer wget.
Wget er en åpen kildekode-nedlastingsbehandler. Det er en konsoll-app utviklet primært for Linux, men vellykket portert på andre operativsystemer, inkludert Windows og MacOS.
Hvis du ikke er kjent med wget, bør du definitivt prøve det. Den er veldig kraftig. Den tillater å hente filer fra nettsider ved hjelp av HTTP, HTTPS og FTP, Internett-protokollene vi bruker i disse dager. Oppførselen kontrolleres av kommandolinjeargumenter.
Wget støtter en rekke alternativer for å hente filer på trege eller ustabile tilkoblinger, inkludert forsøk på nytt, fortsette der det forlot, og mer. Den støtter "robots.txt"-filen, så den kan fungere som en webcrawler. Den kan kun hente modifiserte filer, støtter jokertegn, filtypegrenser og vanlige utvidelser.
Wget støtter rekursiv henting av HTML-nettsteder og FTP-servere, slik at du kan lage et nettstedspeil. Her er hvordan det kan gjøres.
Før du fortsetter, må du hente wget-appen.
Få Wget på Windows
Jeg bruker vanligvis binærfiler fra disse kildene:
- Evig kjedelig
- SourceForge
Begge gjør jobben sin.
Få Wget på Linux
Bruk distroens pakkebehandling. Noen eksempler (kjør dem som rot):
Debian/Ubuntu/Mint:
apt install wget
CentOS/Redhat
nam installer wget
Arch Linux
pacman -Sy wget
Ugyldig Linux
xbps-install -S wget
For å lage en frakoblet kopi av et nettsted med Wget,
- Åpen ledeteksten / terminal.
- På Windows skriver du inn hele banen til wget.exe-filen.
- På Linux skriver du bare wget.
- Skriv inn følgende argumenter for å få følgende kommando:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Bytt ut
https://site-to-download.com
del med den faktiske nettadressen du vil lage et speil av.
Du er ferdig!
Her er bryterne vi bruker:
-
--speil
- bruker en rekke alternativer for å gjøre nedlastingen rekursiv. -
--ingen forelder
– Ikke gjennomsøk den overordnede katalogen for kun å få en del av nettstedet. -
--konvertere-lenker
- får alle koblingene til å fungere ordentlig med den frakoblede kopien. -
--sidebehov
- Last ned JS- og CSS-filer for å beholde den originale sidestilen når du blar gjennom et lokalt speil. -
--juster-utvidelse
- legger til de riktige utvidelsene (f.eks. html, css, js) til filer hvis de ble hentet uten dem.
Det er det.