Windows Tips & News

Faça uma cópia offline de um site com Wget no Windows e Linux

Faça cópia de espelho offline de um site com Wget no Windows e Linux

Às vezes, você precisa obter uma cópia navegável de um site da web, para poder acessá-lo off-line, colocar em um pendrive ou até mesmo fazer o upload para o seu smartphone e lê-lo quando estiver voando ou viajando. Embora seja fácil em navegadores e sistemas operacionais modernos salvar uma página da web em PDF, pode ser irritante processar cada uma das páginas. Aí vem wget.

Wget é um gerenciador de download de código aberto. É um aplicativo de console desenvolvido principalmente para Linux, mas portado com sucesso em outros sistemas operacionais, incluindo Windows e MacOS.

Se você não está familiarizado com o wget, definitivamente deveria experimentá-lo. É muito poderoso. Ele permite buscar arquivos de sites usando HTTP, HTTPS e FTP, os protocolos de Internet que usamos atualmente. Seu comportamento é controlado por argumentos de linha de comando.

O Wget oferece suporte a uma variedade de opções para recuperar arquivos em conexões lentas ou instáveis, incluindo novas tentativas, continuar de onde parou e muito mais. Ele suporta o arquivo "robots.txt", então pode funcionar como um rastreador da web. Ele pode recuperar apenas arquivos modificados, oferece suporte a curingas, limites de tipo de arquivo e extensões regulares.

O Wget suporta a recuperação recursiva de sites HTML e servidores FTP, permitindo que você crie um espelho de site. Veja como isso pode ser feito.

Antes de continuar, você precisa obter o aplicativo wget.

Obtenha o Wget no Windows

Eu geralmente uso binários destas fontes:

  • EternallyBored
  • SourceForge

Ambos fazem seu trabalho.

Obtenha o Wget no Linux

Use o gerenciador de pacotes da sua distribuição. Alguns exemplos (correr eles como root):

Debian / Ubuntu / Mint:

apt instalar wget

CentOS / Redhat

yum install wget

Arch Linux

pacman -Sy wget

Void Linux

xbps-install -S wget

Para fazer uma cópia offline de um site com Wget,

  1. Abrir prompt de comando / terminal.
  2. No Windows, digite o caminho completo para o arquivo wget.exe.
  3. No Linux, digite apenas wget.
  4. Agora, digite os seguintes argumentos para obter o seguinte comando: wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
  5. Substitua o https://site-to-download.com parte com a URL do site real da qual você deseja fazer um espelho.

Você terminou!

Aqui estão as opções que usamos:

  • --espelho - aplica uma série de opções para tornar o download recursivo.
  • --no-parent - Não rastreie o diretório pai para obter apenas uma parte do site.
  • --convert-links - faz com que todos os links funcionem corretamente com a cópia offline.
  • --page-requisites - baixe arquivos JS e CSS para manter o estilo de página original ao navegar em um espelho local.
  • --adjust-extension - adiciona as extensões apropriadas (por exemplo, html, css, js) aos arquivos se eles foram recuperados sem eles.

É isso.

Atualizações cumulativas para Windows 10, 9 de junho de 2020

Atualizações cumulativas para Windows 10, 9 de junho de 2020

1 respostaA Microsoft está lançando atualizações para todas as versões do Windows 10 com suporte....

Consulte Mais informação

O Microsoft Edge finalmente chegará aos usuários do Linux no próximo mês

O Microsoft Edge finalmente chegará aos usuários do Linux no próximo mês

RECOMENDADO: Clique aqui para corrigir problemas do Windows e otimizar o desempenho do sistemaA M...

Consulte Mais informação

Atualizações cumulativas para Windows 10, 8 de dezembro de 2020

Atualizações cumulativas para Windows 10, 8 de dezembro de 2020

Deixe uma respostaA Microsoft lançou um conjunto de atualizações cumulativas para o Windows 10. A...

Consulte Mais informação