আমি সাধারণত httrack
কোনও সাইট থেকে ওয়েব সামগ্রী ডাউনলোড / মিরর করার জন্য ব্যবহার করি ।
$ httrack http://2011.example.com -K -w -O . -%v --robots=0 -c1 %e0
এটি চালানোর পরে আপনার কাছে স্থানীয় এবং ব্রাউজযোগ্য ডিরেক্টরি কাঠামো রয়েছে। উদাহরণ স্বরূপ:
$ ls -l
total 304
-rw-r--r-- 1 saml saml 4243 Aug 17 10:20 backblue.gif
-rw-r--r-- 1 saml saml 828 Aug 17 10:20 fade.gif
drwx------ 3 saml saml 4096 Aug 17 10:20 hts-cache
-rw-rw-r-- 1 saml saml 233 Aug 17 10:20 hts-in_progress.lock
-rw-rw-r-- 1 saml saml 1517 Aug 17 10:20 hts-log.txt
-rw------- 1 saml saml 271920 Aug 17 10:22 hts-nohup.out
-rw-r--r-- 1 saml saml 5141 Aug 17 10:20 index.html
drwxr-xr-x 10 saml saml 4096 Aug 17 10:21 2011.example.com
এটি ডাউনলোড করার সাথে সাথে আপনি নিম্নলিখিত ধরণের আউটপুট দেখতে পাবেন:
Bytes saved: 21,89KiB Links scanned: 12/45 (+4)
Time: 2s Files written: 4
Transfer rate: 2,65KiB/s (2,65KiB/s) Files updated: 1
Active connections: 1 Errors: 7
Current job: parsing HTML file (57%)
request - 2011.example.com/cgi-bin/hostnames.pl 0B / 8,00KiB
এটি ব্যাকগ্রাউন্ডে এবং / অথবা বাতিল এবং পরে পুনরায় শুরু হতে পারে। এটি বৈশিষ্ট্যের দিক থেকে আইসবার্গের কেবলমাত্র টিপ। উভয়ই একটি ডাউনলোড সেট আপ এবং এটি অগ্রগতির সাথে পর্যবেক্ষণের জন্য একটি জিইউআই রয়েছে।
httrack
ওয়েবসাইটে এবং গুগলিংয়ের মাধ্যমে বিস্তৃত ডকুমেন্টেশন রয়েছে ।