আমি কীভাবে সঠিক ডোমেনের সাথে উইজেট মেলে?


1

আমি কোনও সাইটটি আয়না করতে নিম্নলিখিত কমান্ডটি ব্যবহার করছি:

wget -r -p -E -N -l 10 -k -nH -H -Dfoo.com,www.foo.com foo.com

আমার যে সমস্যাটি হচ্ছে তা হ'ল foo.com এ কোথাও foo.com (উদাহরণস্বরূপ newfoo.com) এ শেষ হওয়া ডোমেনগুলির লিঙ্ক রয়েছে এবং উইজেটও সেই সাইটটি মিরর করছে। একটি সঠিক মিলের জন্য ডোমেনগুলি সীমাবদ্ধ করা সম্ভব? আমি www ছাড়া অন্য কোনও সাবডোমেন ক্রল করতে চাই না।

উত্তর:


1

দুর্ভাগ্যক্রমে, কোনও সাইট ক্রল করার সময় উইজেট স্বীকৃত ডোমেনগুলিতে একটি নরম ম্যাচ করে। উদাহরণস্বরূপ নীচের সমস্ত ডোমেন foo.com এর সাথে মিলবে:

  • barfoo.com
  • bar.foo.com
  • anything.can.gohere.foo.com

এই কঠোর ম্যাচের আচরণটি সক্ষম করার জন্য একটি বিকল্প যুক্ত করতে আমি আসলে উইজেট 1.15 এর জন্য একটি প্যাচ তৈরি করেছি । এই প্যাচটি ব্যবহার করে পুরো ডোমেনটি অবশ্যই মিলবে। এটি ডোমেনের অন্যান্য তালিকা যেমন বাদ দেওয়া ডোমেন ইত্যাদির উপর প্রভাব ফেলবে না


এটি হতাশাজনক তবে উত্তর এবং বিশেষত প্যাচের জন্য ধন্যবাদ।
লুক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.