Направете офлайн копие на сайт с Wget на Windows и Linux
Направете офлайн огледално копие на сайт с Wget на Windows и Linux
Понякога трябва да получите копие на уеб сайт с възможност за разглеждане, за да можете да получите достъп до него офлайн, да поставите USB флаш или дори да качите на вашия смартфон и да го прочетете, когато летите или пътувате. Въпреки че в съвременните браузъри и операционни системи е лесно да се запише уеб страница в PDF, може да е досадно да се обработва всяка отделна страница. Тук идва wget.
Wget е мениджър за изтегляне с отворен код. Това е конзолно приложение, разработено предимно за Linux, но успешно пренесено на други операционни системи, включително Windows и MacOS.
Ако не сте запознати с wget, определено трябва да опитате. Много е мощен. Позволява извличане на файлове от уеб сайтове чрез HTTP, HTTPS и FTP, интернет протоколите, които използваме в наши дни. Поведението му се контролира от аргументи на командния ред.
Wget поддържа различни опции за извличане на файлове при бавни или нестабилни връзки, включително повторни опити, продължаване откъдето е останало и др. Той поддържа файла "robots.txt", така че може да работи като уеб робот. Може да извлича само модифицирани файлове, поддържа заместващи знаци, ограничения за типове файлове и обикновени разширения.
Wget поддържа рекурсивно извличане на HTML уеб сайтове и FTP сървъри, което ви позволява да направите огледало на уеб сайт. Ето как може да се направи.
Преди да продължите, трябва да получите приложението wget.
Вземете Wget на Windows
Обикновено използвам двоични файлове от тези източници:
- Вечно отегчени
- SourceForge
И двамата си вършат работата.
Вземете Wget на Linux
Използвайте мениджъра на пакети на вашата дистрибуция. Някои примери (изпълни ги като корен):
Debian/Ubuntu/Mint:
apt инсталирате wget
CentOS/Redhat
yum инсталирай wget
Arch Linux
pacman -Sy wget
Анулиране на Linux
xbps-install -S wget
За да направите офлайн копие на сайт с Wget,
- Отвори командния ред / терминал.
- В Windows въведете пълния път до файла wget.exe.
- В Linux въведете само wget.
- Сега въведете следните аргументи, за да получите следната команда:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Заменете
https://site-to-download.com
част с действителния URL адрес на сайта, на който искате да направите огледало.
Ти си готов!
Ето превключвателите, които използваме:
-
--огледало
- прилага редица опции, за да направи изтеглянето рекурсивно. -
--без родител
– Не обхождайте родителската директория, за да получите само част от сайта. -
--convert-links
- прави всички връзки да работят правилно с офлайн копието. -
--page-requisites
- изтегляне на JS и CSS файлове, за да запазите оригиналния стил на страницата при сърфиране в локално огледало. -
--adjust-extension
- добавя подходящите разширения (например html, css, js) към файловете, ако са били извлечени без тях.
Това е.