צור עותק לא מקוון של אתר עם Wget ב-Windows ו-Linux
צור עותק מראה לא מקוון של אתר עם Wget ב-Windows ו-Linux
לפעמים אתה צריך לקבל עותק דפדוף של אתר אינטרנט, כדי שתוכל לגשת אליו במצב לא מקוון, לשים על מקל USB או אפילו להעלות לסמארטפון שלך ולקרוא אותו בזמן טיסה או נסיעה. אמנם קל בדפדפנים ובמערכות הפעלה מודרניות לשמור דף אינטרנט ב-PDF, אבל זה יכול להיות מעצבן לעבד כל עמוד בודד. הנה מגיע wget.
Wget הוא מנהל הורדות בקוד פתוח. זוהי אפליקציית קונסולה שפותחה בעיקר עבור לינוקס, אך הועברה בהצלחה למערכות הפעלה אחרות, כולל Windows ו- MacOS.
אם אתה לא מכיר את wget, אתה בהחלט צריך לנסות את זה. זה מאוד חזק. זה מאפשר שליפת קבצים מאתרי אינטרנט באמצעות HTTP, HTTPS ו-FTP, פרוטוקולי האינטרנט שבהם אנו משתמשים בימים אלה. ההתנהגות שלו נשלטת על ידי ארגומנטים של שורת הפקודה.
Wget תומכת במגוון אפשרויות לאחזור קבצים בחיבורים איטיים או לא יציבים, כולל נסיונות חוזרים, המשך מהיכן שנשאר, ועוד. הוא תומך בקובץ "robots.txt", כך שהוא יכול לעבוד כמו סורק אינטרנט. זה יכול לאחזר קבצים שהשתנו בלבד, תומך בתווים כלליים, מגבלות על סוגי קבצים והרחבות רגילות.
Wget תומך באחזור רקורסיבי של אתרי HTML ושרתי FTP, מה שמאפשר לך ליצור מראה אתר אינטרנט. הנה איך זה יכול להיעשות.
לפני שתמשיך, עליך להשיג את אפליקציית wget.
קבל Wget ב-Windows
אני בדרך כלל משתמש בקבצים בינאריים מהמקורות הבאים:
- משועמם לנצח
- SourceForge
שניהם עושים את עבודתם.
קבל Wget ב-Linux
השתמש במנהל החבילות של ההפצה שלך. כמה דוגמאות (הפעלה אותם כשורש):
דביאן/אובונטו/מינט:
apt התקנת wget
CentOS/Redhat
יאמ התקן את wget
Arch Linux
pacman -Sy wget
בטל לינוקס
xbps-install -S wget
כדי ליצור עותק לא מקוון של אתר עם Wget,
- לִפְתוֹחַ שורת הפקודה / מָסוֹף.
- ב-Windows, הקלד את הנתיב המלא לקובץ wget.exe.
- בלינוקס, הקלד רק wget.
- כעת, הקלד את הארגומנטים הבאים כדי לקבל את הפקודה הבאה:
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://site-to-download.com
- החלף את ה
https://site-to-download.com
חלק עם כתובת האתר האמיתית שברצונך ליצור ממנה מראה.
אתה גמור!
להלן המתגים שבהם אנו משתמשים:
-
--מַרְאָה
- מחיל מספר אפשרויות כדי להפוך את ההורדה רקורסיבית. -
--ללא הורה
– אין לסרוק את ספריית האב כדי לקבל רק חלק מהאתר. -
--המר קישורים
- גורם לכל הקישורים לעבוד כמו שצריך עם העותק הלא מקוון. -
--דף-דרישות
- הורד קובצי JS ו-CSS כדי לשמור על סגנון העמוד המקורי בעת גלישה במראה מקומי. -
--adjust-extension
- מוסיף את ההרחבות המתאימות (למשל html, css, js) לקבצים אם הם אוחזרו בלעדיהם.
זהו זה.