আমি একটি ব্লগ যেমন www.example.com
, সঙ্গে আয়না করার চেষ্টা করছি wget
।
আমি নিম্নলিখিত বিকল্পগুলির সাথে উইজেট ব্যবহার করি (শেল ভেরিয়েবলগুলি সঠিকভাবে প্রতিস্থাপন করা হয়):
wget -m -p -H -k -E -np \
-w 1 \
--random-wait \
--restrict-file-names=windows \
-P $folder \
-Q${quota}m \
-t 3 \
--referer=$url \
-U 'Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.8.1.6) Gecko/20070802 SeaMonkey/1.1.4' \
-e robots=off \
-D $domains
-- $url
ব্লগে এমন চিত্রগুলি রয়েছে যা অন্যান্য ডোমেনগুলিতে থাকে।
যদিও আমি -p
বিকল্পটি নির্দিষ্ট করে রেখেছি (লিঙ্কযুক্ত পৃষ্ঠা সম্পদগুলি ডাউনলোড করুন) এই চিত্রগুলি ডাউনলোড করা হচ্ছে না যতক্ষণ না আমি -D
বিকল্পটিতে প্রতিটি ডোমেন নির্দিষ্ট করে উল্লেখ করি ।
আমি যদি -D
বিকল্পটি বাদ দিই তবে উইজেট বাইরের প্রতিটি লিঙ্ক অনুসরণ করবে www.example.com
এবং পুরো ইন্টারনেট ডাউনলোড করবে।
wget
প্রতিটি লিঙ্কের নীচে কেবল প্রতিটি লিঙ্ক অনুসরণ করা www.example.com
এবং প্রতিটি পৃষ্ঠার প্রয়োজনীয় সম্পদগুলি ডাউনলোড করা কি এই একই ডোমেনে থাকে বা না করে আমাকে প্রতিটি ডোমেনকে স্পষ্টভাবে উল্লেখ না করেই ডাউনলোড করা সম্ভব ?
-D $domains
পাশাপাশি উভয়টিকে মুছে ফেলার চেষ্টা করুন -H
। -H
এটি ছাড়া আপনার ডোমেনের মধ্যে থাকা উচিত তবে তারা অন্য কোনও ডোমেনে থাকলেও সরাসরি পৃষ্ঠার সম্পদগুলি পুনরুদ্ধার করতে পারে।
wget -N -E -H -k -K -p
প্রথমটি ব্যবহার করে শেষ করেছি এবং হারিয়ে যাওয়া লিঙ্কযুক্ত চিত্রগুলি আনার জন্য একটি স্ক্রিপ্ট নিয়ে এসেছি।