Faça uma cópia offline de um site com Wget no Windows e Linux
Faça cópia de espelho offline de um site com Wget no Windows e Linux
Às vezes, você precisa obter uma cópia navegável de um site da web, para poder acessá-lo off-line, colocar em um pendrive ou até mesmo fazer o upload para o seu smartphone e lê-lo quando estiver voando ou viajando. Embora seja fácil em navegadores e sistemas operacionais modernos salvar uma página da web em PDF, pode ser irritante processar cada uma das páginas. Aí vem wget.
Wget é um gerenciador de download de código aberto. É um aplicativo de console desenvolvido principalmente para Linux, mas portado com sucesso em outros sistemas operacionais, incluindo Windows e MacOS.
Se você não está familiarizado com o wget, definitivamente deveria experimentá-lo. É muito poderoso. Ele permite buscar arquivos de sites usando HTTP, HTTPS e FTP, os protocolos de Internet que usamos atualmente. Seu comportamento é controlado por argumentos de linha de comando.
O Wget oferece suporte a uma variedade de opções para recuperar arquivos em conexões lentas ou instáveis, incluindo novas tentativas, continuar de onde parou e muito mais. Ele suporta o arquivo "robots.txt", então pode funcionar como um rastreador da web. Ele pode recuperar apenas arquivos modificados, oferece suporte a curingas, limites de tipo de arquivo e extensões regulares.
O Wget suporta a recuperação recursiva de sites HTML e servidores FTP, permitindo que você crie um espelho de site. Veja como isso pode ser feito.
Antes de continuar, você precisa obter o aplicativo wget.
Obtenha o Wget no Windows
Eu geralmente uso binários destas fontes:
- EternallyBored
- SourceForge
Ambos fazem seu trabalho.
Obtenha o Wget no Linux
Use o gerenciador de pacotes da sua distribuição. Alguns exemplos (correr eles como root):
Debian / Ubuntu / Mint:
apt instalar wget
CentOS / Redhat
yum install wget
Arch Linux
pacman -Sy wget
Void Linux
xbps-install -S wget
Para fazer uma cópia offline de um site com Wget,
- Abrir prompt de comando / terminal.
- No Windows, digite o caminho completo para o arquivo wget.exe.
- No Linux, digite apenas wget.
- Agora, digite os seguintes argumentos para obter o seguinte comando:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- Substitua o
https://site-to-download.com
parte com a URL do site real da qual você deseja fazer um espelho.
Você terminou!
Aqui estão as opções que usamos:
-
--espelho
- aplica uma série de opções para tornar o download recursivo. -
--no-parent
- Não rastreie o diretório pai para obter apenas uma parte do site. -
--convert-links
- faz com que todos os links funcionem corretamente com a cópia offline. -
--page-requisites
- baixe arquivos JS e CSS para manter o estilo de página original ao navegar em um espelho local. -
--adjust-extension
- adiciona as extensões apropriadas (por exemplo, html, css, js) aos arquivos se eles foram recuperados sem eles.
É isso.