Utwórz kopię witryny w trybie offline za pomocą Wget w systemach Windows i Linux
Utwórz kopię lustrzaną witryny w trybie offline za pomocą Wget w systemach Windows i Linux
Czasami trzeba uzyskać dostępną do przeglądania kopię witryny internetowej, aby móc uzyskać do niej dostęp w trybie offline, włożyć pamięć USB, a nawet przesłać ją do smartfona i przeczytać podczas lotu lub podróży. Chociaż w nowoczesnych przeglądarkach i systemach operacyjnych łatwo jest zapisać stronę internetową w formacie PDF, przetwarzanie każdej strony może być denerwujące. Nadchodzi wget.
Reklama
Wget to menedżer pobierania o otwartym kodzie źródłowym. Jest to aplikacja konsolowa opracowana głównie dla systemu Linux, ale z powodzeniem przeniesiona na inne systemy operacyjne, w tym Windows i MacOS.
Jeśli nie znasz wget, zdecydowanie powinieneś spróbować. Jest bardzo potężny. Umożliwia pobieranie plików ze stron internetowych przy użyciu protokołów HTTP, HTTPS i FTP, protokołów internetowych, których obecnie używamy. Jego zachowanie jest kontrolowane przez argumenty wiersza poleceń.
Wget obsługuje różne opcje pobierania plików przy wolnych lub niestabilnych połączeniach, w tym ponawianie prób, kontynuowanie od miejsca, w którym zostało, i nie tylko. Obsługuje plik „robots.txt”, dzięki czemu może działać jak robot sieciowy. Może pobierać tylko zmodyfikowane pliki, obsługuje symbole wieloznaczne, ograniczenia typów plików i zwykłe rozszerzenia.
Wget obsługuje rekurencyjne pobieranie stron internetowych HTML i serwerów FTP, umożliwiając tworzenie kopii lustrzanych stron internetowych. Oto jak można to zrobić.
Zanim przejdziesz dalej, musisz pobrać aplikację wget.
Pobierz Wget na Windows
Zwykle używam binariów z tych źródeł:
- Wiecznie znudzony
- SourceForge
Obaj wykonują swoją pracę.
Pobierz Wget na Linuksa
Użyj menedżera pakietów swojej dystrybucji. Kilka przykładów (uruchom je jako root):
Debian/Ubuntu/Minta:
trafna instalacja wget
CentOS/Redhat
mniam zainstaluj wget
Arch Linux
pacman -Sy wget
Pustka Linuksa
xbps-install -S wget
Aby wykonać kopię offline witryny za pomocą Wget,
- otwarty wiersz polecenia / terminal.
- W systemie Windows wpisz pełną ścieżkę do pliku wget.exe.
- W systemie Linux wpisz po prostu wget.
- Teraz wpisz następujące argumenty, aby uzyskać następujące polecenie:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Zastąpić
https://site-to-download.com
fragment z rzeczywistym adresem URL witryny, którego kopię lustrzaną chcesz utworzyć.
Gotowe!
Oto przełączniki, których używamy:
-
--lustro
- stosuje szereg opcji, aby pobieranie było cykliczne. -
--brak-rodzica
– Nie przeszukuj katalogu nadrzędnego w celu uzyskania tylko części witryny. -
--konwertuj-linki
- sprawia, że wszystkie linki działają poprawnie z kopią offline. -
--strona-wymagania
- pobierz pliki JS i CSS, aby zachować oryginalny styl strony podczas przeglądania lokalnego serwera lustrzanego. -
--dostosuj rozszerzenie
- dodaje odpowiednie rozszerzenia (np. html, css, js) do plików, jeśli zostały pobrane bez nich.
Otóż to.