Windows Tips & News

Hacer una copia sin conexión de un sitio con Wget en Windows y Linux

click fraud protection

Haga una copia espejo sin conexión de un sitio con Wget en Windows y Linux

A veces, necesita obtener una copia navegable de un sitio web, para poder acceder a él sin conexión, colocarlo en una memoria USB o incluso cargarlo en su teléfono inteligente y leerlo mientras viaja o viaja. Si bien es fácil en los navegadores y sistemas operativos modernos guardar una página web en PDF, puede resultar molesto procesar cada una de las páginas. Aquí viene wget.

Wget es un administrador de descargas de código abierto. Es una aplicación de consola desarrollada principalmente para Linux, pero que se ha adaptado con éxito a otros sistemas operativos, incluidos Windows y MacOS.

Si no está familiarizado con wget, definitivamente debería intentarlo. Es muy poderoso. Permite buscar archivos de sitios web usando HTTP, HTTPS y FTP, los protocolos de Internet que estamos usando en estos días. Su comportamiento está controlado por argumentos de línea de comando.

Wget admite una variedad de opciones para recuperar archivos en conexiones lentas o inestables, incluidos reintentos, continuar donde lo dejó y más. Es compatible con el archivo "robots.txt", por lo que puede funcionar como un rastreador web. Solo puede recuperar archivos modificados, admite comodines, límites de tipo de archivo y extensiones regulares.

Wget admite la recuperación recursiva de sitios web HTML y servidores FTP, lo que le permite crear un espejo de sitio web. Así es como se puede hacer.

Antes de continuar, debe obtener la aplicación wget.

Obtenga Wget en Windows

Normalmente uso binarios de estas fuentes:

  • Eternamente aburrido
  • FuenteForge

Ambos hacen su trabajo.

Obtenga Wget en Linux

Usa el administrador de paquetes de tu distribución. Algunos ejemplos (ejecutar ellos como raíz):

Debian / Ubuntu / Mint:

apto instalar wget

CentOS / Redhat

yum instalar wget

Arch Linux

pacman -Sy wget

Linux vacío

xbps-install -S wget

Para hacer una copia sin conexión de un sitio con Wget,

  1. Abierto símbolo del sistema / Terminal.
  2. En Windows, escriba la ruta completa al archivo wget.exe.
  3. En Linux, escriba simplemente wget.
  4. Ahora, escriba los siguientes argumentos para obtener el siguiente comando: wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
  5. Reemplace la https://site-to-download.com parte con la URL del sitio real del que desea hacer un espejo.

¡Estás listo!

Estos son los interruptores que usamos:

  • --espejo: aplica una serie de opciones para hacer que la descarga sea recursiva.
  • --no padre - No rastree el directorio principal para obtener solo una parte del sitio.
  • --convert-links - hace que todos los enlaces funcionen correctamente con la copia fuera de línea.
  • --requisitos de página - descargue archivos JS y CSS para conservar el estilo de página original al navegar por un espejo local.
  • --ajustar-extensión - agrega las extensiones apropiadas (por ejemplo, html, css, js) a los archivos si se recuperaron sin ellas.

Eso es todo.

Deshabilitar el inicio del Narrador en Windows 10

Deshabilitar el inicio del Narrador en Windows 10

RECOMENDADO: Haga clic aquí para solucionar problemas de Windows y optimizar el rendimiento del s...

Lee mas

Cambiar el dispositivo de salida de audio para el narrador en Windows 10

Como ya sabrá, Narrator es una aplicación de lectura de pantalla integrada en Windows 10. Narrado...

Lee mas

Desactivar Reiniciar aplicaciones automáticamente después de iniciar sesión en Windows 10

Desactivar Reiniciar aplicaciones automáticamente después de iniciar sesión en Windows 10

Cómo apagar o encender automáticamente las aplicaciones después de iniciar sesión en Windows 10A ...

Lee mas