विंडोज और लिनक्स पर Wget वाली साइट की ऑफलाइन कॉपी बनाएं
Windows और Linux पर Wget वाली साइट की ऑफ़लाइन मिरर कॉपी बनाएं
कभी-कभी आपको किसी वेब साइट की ब्राउज़ करने योग्य प्रतिलिपि प्राप्त करने की आवश्यकता होती है, ताकि आप इसे ऑफ़लाइन एक्सेस कर सकें, यूएसबी स्टिक लगा सकें या यहां तक कि अपने स्मार्टफोन पर अपलोड कर सकें और उड़ान या यात्रा करते समय इसे पढ़ सकें। जबकि आधुनिक ब्राउज़र और ऑपरेटिंग सिस्टम में वेब पेज को पीडीएफ में सहेजना आसान है, हर एक पेज को प्रोसेस करना कष्टप्रद हो सकता है। यहाँ wget आता है।
Wget एक ओपन-सोर्स डाउनलोड मैनेजर है। यह मुख्य रूप से लिनक्स के लिए विकसित एक कंसोल ऐप है, लेकिन विंडोज और मैकओएस सहित अन्य ओएस पर सफलतापूर्वक पोर्ट किया गया है।
यदि आप wget से परिचित नहीं हैं, तो आपको इसे निश्चित रूप से आज़माना चाहिए। यह बहुत शक्तिशाली है। यह HTTP, HTTPS और FTP का उपयोग करके वेब साइटों से फ़ाइलें लाने की अनुमति देता है, इंटरनेट प्रोटोकॉल जो हम इन दिनों उपयोग कर रहे हैं। इसका व्यवहार कमांड लाइन तर्कों द्वारा नियंत्रित होता है।
Wget धीमे या अस्थिर कनेक्शन पर फ़ाइलों को पुनः प्राप्त करने के लिए कई विकल्पों का समर्थन करता है, जिसमें पुनर्प्रयास शामिल हैं, जहां से इसे छोड़ा गया है, और बहुत कुछ जारी रखें। यह "robots.txt" फ़ाइल का समर्थन करता है, इसलिए यह वेब क्रॉलर की तरह काम कर सकता है। यह केवल संशोधित फ़ाइलों को पुनः प्राप्त कर सकता है, वाइल्डकार्ड, फ़ाइल प्रकार की सीमा और नियमित एक्सटेंशन का समर्थन करता है।
Wget HTML वेब साइटों और FTP सर्वरों की पुनरावर्ती पुनर्प्राप्ति का समर्थन करता है, जिससे आप एक वेब साइट दर्पण बना सकते हैं। यहां बताया गया है कि यह कैसे किया जा सकता है।
आगे बढ़ने से पहले, आपको wget ऐप प्राप्त करना होगा।
विंडोज़ पर Wget प्राप्त करें
मैं आमतौर पर इन स्रोतों से बायनेरिज़ का उपयोग करता हूं:
- हमेशा के लिए ऊब
- sourceforge
दोनों अपना काम करते हैं।
Linux पर Wget प्राप्त करें
अपने डिस्ट्रो के पैकेज मैनेजर का इस्तेमाल करें। कुछ उदाहरण (रन उन्हें जड़ के रूप में):
डेबियन/उबंटू/मिंट:
उपयुक्त स्थापित wget
सेंटोस/रेडहैट
यम स्थापित wget
आर्क लिनक्स
pacman -Sy wget
शून्य लिनक्स
xbps-इंस्टॉल-एस wget
Wget वाली साइट की ऑफलाइन कॉपी बनाने के लिए,
- खोलना सही कमाण्ड / टर्मिनल.
- विंडोज़ पर, wget.exe फ़ाइल का पूरा पथ टाइप करें।
- लिनक्स पर, बस wget टाइप करें।
- अब, निम्न आदेश प्राप्त करने के लिए निम्न तर्क टाइप करें:
wget --mirror --convert-links --adjust-extension --page-Requires --no-parent https://site-to-download.com
- प्रतिस्थापित करें
https://site-to-download.com
वास्तविक साइट URL वाला भाग जिसका आप दर्पण बनाना चाहते हैं।
आप कर चुके हैं!
यहां वे स्विच हैं जिनका हम उपयोग करते हैं:
-
--आईना
- डाउनलोड को पुनरावर्ती बनाने के लिए कई विकल्प लागू करता है। -
--नो-पैरेंट
- केवल साइट का एक भाग प्राप्त करने के लिए मूल निर्देशिका को क्रॉल न करें। -
--कन्वर्ट-लिंक
- ऑफलाइन कॉपी के साथ सभी लिंक को ठीक से काम करने के लिए बनाता है। -
--पृष्ठ-आवश्यकताएं
- स्थानीय दर्पण ब्राउज़ करते समय मूल पृष्ठ शैली को बनाए रखने के लिए JS और CSS फ़ाइलें डाउनलोड करें। -
--समायोजित-विस्तार
- फाइलों में उपयुक्त एक्सटेंशन (जैसे एचटीएमएल, सीएसएस, जेएस) जोड़ता है यदि उन्हें उनके बिना पुनर्प्राप्त किया गया था।
बस, इतना ही।