আমি www.website.com/XYZ এর অধীনে লিঙ্কগুলি ক্রল করতে চাই এবং কেবল www.website.com/ABC এর অধীন থাকা লিঙ্কগুলি ডাউনলোড করতে চাই।
আমি চাইলে ফাইলগুলি পেতে নিম্নলিখিত উইজেট কমান্ডটি ব্যবহার করছি:
wget -I ABC -r -e robots=off --wait 0.25 http://www.website.com/XYZ
আমি যখন উইজেট ব্যবহার করি তখন এটি পুরোপুরি কাজ করে। তবে সমস্যাটি হ'ল আমাকে এই কমান্ডটি একটি সার্ভারে ব্যবহার করতে হবে যার উইজেট 1.11 রয়েছে এবং আমি যখন একই কমান্ডটি ব্যবহার করি তখন এটি অতিরিক্ত ডোমেনগুলি ডাউনলোড করে শেষ করে:
www.website.de
www.website.it
...
আমি কীভাবে এই সমস্যা এড়াতে পারি? আমি ব্যবহার করার চেষ্টা করেছি
--exclude domains=www.website.de,www.website.it
তবে এটি সেই ডোমেনগুলি ডাউনলোড করেই চলেছে।
এছাড়াও নোট করুন যেহেতু আমি যে --no-parent
ফাইলগুলি চাই সেগুলি উচ্চ স্তরের (যেহেতু ওয়েবসাইট / এক্সওয়াইজেডের অধীনে লিঙ্কগুলি ক্রল করে আমি ওয়েবসাইট.com/ABC এর অধীনে ফাইলগুলি চাই) ব্যবহার করতে পারি না ।
কোন ইঙ্গিত?
wget
ডিফল্টরূপে হোস্টগুলি অতিক্রম করা উচিত নয় এবং পুনরাবৃত্ত উইজেট করার সময় আপনার হোস্টগুলি অতিক্রম করার জন্য -H
/ --span-hosts
বিকল্পের প্রয়োজন । "www.website.com" "www.website.de" থেকে সম্পূর্ণ আলাদা হোস্ট।
-H
সর্বদা মূল হোস্টের বাইরে পুনরাবৃত্তি করা প্রয়োজন required নেই -D www.website.com
সহায়তা প্রয়োজন?