Windows Tips & News

Faça uma cópia offline de um site com Wget no Windows e Linux

Faça cópia de espelho offline de um site com Wget no Windows e Linux

Às vezes, você precisa obter uma cópia navegável de um site da web, para poder acessá-lo off-line, colocar em um pendrive ou até mesmo fazer o upload para o seu smartphone e lê-lo quando estiver voando ou viajando. Embora seja fácil em navegadores e sistemas operacionais modernos salvar uma página da web em PDF, pode ser irritante processar cada uma das páginas. Aí vem wget.

Wget é um gerenciador de download de código aberto. É um aplicativo de console desenvolvido principalmente para Linux, mas portado com sucesso em outros sistemas operacionais, incluindo Windows e MacOS.

Se você não está familiarizado com o wget, definitivamente deveria experimentá-lo. É muito poderoso. Ele permite buscar arquivos de sites usando HTTP, HTTPS e FTP, os protocolos de Internet que usamos atualmente. Seu comportamento é controlado por argumentos de linha de comando.

O Wget oferece suporte a uma variedade de opções para recuperar arquivos em conexões lentas ou instáveis, incluindo novas tentativas, continuar de onde parou e muito mais. Ele suporta o arquivo "robots.txt", então pode funcionar como um rastreador da web. Ele pode recuperar apenas arquivos modificados, oferece suporte a curingas, limites de tipo de arquivo e extensões regulares.

O Wget suporta a recuperação recursiva de sites HTML e servidores FTP, permitindo que você crie um espelho de site. Veja como isso pode ser feito.

Antes de continuar, você precisa obter o aplicativo wget.

Obtenha o Wget no Windows

Eu geralmente uso binários destas fontes:

  • EternallyBored
  • SourceForge

Ambos fazem seu trabalho.

Obtenha o Wget no Linux

Use o gerenciador de pacotes da sua distribuição. Alguns exemplos (correr eles como root):

Debian / Ubuntu / Mint:

apt instalar wget

CentOS / Redhat

yum install wget

Arch Linux

pacman -Sy wget

Void Linux

xbps-install -S wget

Para fazer uma cópia offline de um site com Wget,

  1. Abrir prompt de comando / terminal.
  2. No Windows, digite o caminho completo para o arquivo wget.exe.
  3. No Linux, digite apenas wget.
  4. Agora, digite os seguintes argumentos para obter o seguinte comando: wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
  5. Substitua o https://site-to-download.com parte com a URL do site real da qual você deseja fazer um espelho.

Você terminou!

Aqui estão as opções que usamos:

  • --espelho - aplica uma série de opções para tornar o download recursivo.
  • --no-parent - Não rastreie o diretório pai para obter apenas uma parte do site.
  • --convert-links - faz com que todos os links funcionem corretamente com a cópia offline.
  • --page-requisites - baixe arquivos JS e CSS para manter o estilo de página original ao navegar em um espelho local.
  • --adjust-extension - adiciona as extensões apropriadas (por exemplo, html, css, js) aos arquivos se eles foram recuperados sem eles.

É isso.

Libere espaço em disco após instalar o Office 2016 Click To Run

Libere espaço em disco após instalar o Office 2016 Click To Run

A Microsoft lançou o Microsoft Office 2016 há alguns dias. Ele usa a tecnologia App-V / Click To ...

Consulte Mais informação

O Microsoft Edge Dev build 90.0.818.0 vem com melhorias de downloads e coleções

O Microsoft Edge Dev build 90.0.818.0 vem com melhorias de downloads e coleções

RECOMENDADO: Clique aqui para corrigir problemas do Windows e otimizar o desempenho do sistemaUma...

Consulte Mais informação

Impeça o Windows 10 de espioná-lo usando apenas o Firewall do Windows

Impeça o Windows 10 de espioná-lo usando apenas o Firewall do Windows

RECOMENDADO: Clique aqui para corrigir problemas do Windows e otimizar o desempenho do sistemaNão...

Consulte Mais informação