কোনও আলাদা ডোমেনে উইজেট ডাউনলোড পৃষ্ঠা সংস্থান করুন


16

আপনি কীভাবে কোনও সম্পূর্ণ সাইট (ডোমেন এ) ডাউনলোড করতে উইজেট ব্যবহার করবেন যখন এর সংস্থানগুলি অন্য ডোমেনে, (ডোমেন বি) থাকবে?
আমি চেষ্টা করেছিলাম:
wget -r --level=inf -p -k -E --domains=domainA,domainB http://www.domainA


কি দারুন! এত কিছুর পরেও কেউ নেই?
পার্সা

কমান্ডটি কাজ না করার কারণটি হ'ল --domainsনিজে ব্যবহার করা চালু হয় না --span-hosts। যোগ --span-hostsকরা সমস্যার সমাধান করতে পারে। : |
পারসা 1

উত্তর:


14
wget --recursive --level=inf --page-requisites --convert-links --html-extension \
     --span-hosts=domainA,domainB url-on-domainA

আপডেট: আমার মনে আছে উপরের কমান্ডটি অতীতে আমার জন্য কাজ করেছিল (এটি ছিল 2010 এবং আমি তখন উইন্ডোজের জন্য জিএনইউ সরঞ্জামগুলি ব্যবহার করছিলাম ); তবে আমি আজ এটি ব্যবহার করতে চাইলে আমাকে এটিকে নিম্নোক্তটিতে পরিবর্তন করতে হয়েছিল:

wget --recursive --level=inf --page-requisites --convert-links \
     --adjust-extension --span-hosts --domains=domainA,domainB domainA

এর জন্য সংক্ষিপ্ত হাতটি হ'ল: wget -rEDpkH -l inf domainA,domainB domainA

  • -r = --recursive
  • -l <depth> = --level=<depth>
  • -E = --adjust-extension
  • -p = --page-requisites
  • -K = --backup-converted
  • -k = --convert-links
  • -D <domain-list> = --domain-list=<domain-list>
  • -H = --span-hosts
  • -np = --no-parent
  • -U <agent-string> = --user-agent=<agent-string>

জিএনইউ উইজেট ম্যানুয়াল: https://www.gnu.org/software/wget/manual/wget.html


আমি পেয়েছি: উইজেট: - স্প্যান-হোস্টস: domainA,domainB'; use 'বা' অফ ' অবৈধ বুলিয়ান । চালু করার পরে, এটি কাজ করে না।
ম্যাথু ফ্ল্যাশেন

@ ম্যাথেজফ্ল্যাশেন আমি এখানে যা লিখেছি তা আমার পক্ষে কাজ করেছে। আপনি যে যুক্তিগুলি ব্যবহার করেছেন তা সরবরাহ করতে পারেন?
পারসা

আমার আগে ঠিক যে কমান্ডটি চালিয়েছি তা আমার কাছে নেই। যাইহোক, আমার একই সমস্যাটি রয়েছে: wget --recursive --level=inf --page-requisites --convert-links --html-extension --span-hosts=example.org,iana.org example.org আমি দেবিয়ানে জিএনইউ উইজেট 1.13.4 ব্যবহার করছি।
ম্যাথু ফ্ল্যাশেন

3
চেষ্টা করুন --span-hosts --domains=example.org,iana.org- আমার মনে --span-hostsহয় একটি বুলিয়ান হওয়া দরকার এবং তারপরে আপনি --domainsকোন হোস্ট বিস্তৃত করতে হবে তা নির্দিষ্ট করে ব্যবহার করুন ।
এরিক মিল

কনক্লোন, - স্প্যান-হোস্টগুলি হ'ল 1.12 এর একটি বুলিয়ান এবং পরে, আমি এটি জানতাম না। @ ম্যাথেজ ফ্ল্যাশেন, আমি উত্তরটি আপডেট করেছি। যাইহোক, যদি আপনি উইন্ডোজের জন্য জিএনইউ সরঞ্জাম ব্যবহার করেন তবে এটি এখনও 1.11 এবং তার আগে কাজ করবে।
পারসা 1

1

উইজেট - রেকর্ডিভ --level = ইনফ - পৃষ্ঠা-প্রয়োজনীয়তা - কনভার্ট - লিংক - html- এক্সটেনশন


এটি আংশিকভাবে কাজ করে। তবে কোনও কারণে, ইউআরএল (শেষে) একটি পুনর্নির্দেশ করা থাকলে এটি কাজ করবে বলে মনে হয় না। এছাড়াও, এটি কেবল পৃষ্ঠার প্রয়োজনীয়তা নয়, লিঙ্কগুলিও ডাউনলোড করে। এছাড়াও, -r এবং --recursive একই।
ম্যাথু ফ্ল্যাশেন

0
wget --page-requisites --convert-links --adjust-extension --span-hosts --domains domainA,domainB domainA

আপনাকে রোবটস.টেক্সটকে উপেক্ষা করার দরকার হতে পারে (দ্রষ্টব্য, এটি পরিষেবার কিছু শর্তাদি লঙ্ঘন হতে পারে এবং আপনাকে সর্বনিম্ন প্রয়োজনীয় ডাউনলোড করতে হবে)। Https://www.gnu.org/software/wget/manual/wget.html# রবোট- এক্সক্লুশন দেখুন ।


-1

HTTrack ব্যবহার বিবেচনা করুন । উইজেটের চেয়ে অন্য ডোমেনগুলিতে সামগ্রী ক্রল করার সময় এর আরও বিকল্প রয়েছে। --Span- হোস্টস, --ডোমেনস এবং - সাথে উইজেট ব্যবহার করা যেখানে আমার প্রয়োজনের জন্য অপর্যাপ্ত তবে HTTrack কাজটি করেছে। আমার মনে আছে যে অন্যান্য ডোমেনগুলিতে পুনঃনির্দেশের সীমাবদ্ধতাটি সেটাকে অনেক সহায়তা করেছিল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.