আমার এইচটিটিপি এর মাধ্যমে একটি সাইট ছিঁড়ে নেওয়া দরকার। আমার ইমেজগুলি, এইচটিএমএল, সিএসএস এবং জাভাস্ক্রিপ্ট ডাউনলোড করার পাশাপাশি এটি একটি ফাইল সিস্টেমে সাজানো দরকার।
কেউ কি জানেন, এটা কিভাবে করে?
আমার এইচটিটিপি এর মাধ্যমে একটি সাইট ছিঁড়ে নেওয়া দরকার। আমার ইমেজগুলি, এইচটিএমএল, সিএসএস এবং জাভাস্ক্রিপ্ট ডাউনলোড করার পাশাপাশি এটি একটি ফাইল সিস্টেমে সাজানো দরকার।
কেউ কি জানেন, এটা কিভাবে করে?
উত্তর:
wget -erobots=off --no-parent --wait=3 --limit-rate=20K -r -p -U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)" -A htm,html,css,js,json,gif,jpeg,jpg,bmp http://example.com
এটি কনসোলে চলে।
এটি কোনও সাইট দখল করবে, অনুরোধগুলির মধ্যে 3 সেকেন্ড অপেক্ষা করবে, এটি কত দ্রুত ডাউনলোড হবে তা সীমাবদ্ধ করবে যাতে এটি সাইটটিকে হত্যা করে না এবং এমনভাবে মুখোশ দেয় যাতে এটি কেবল ব্রাউজার হিসাবে প্রদর্শিত হয় যাতে সাইটটি আপনাকে কাটা না দেয় site একটি অ্যান্টি-জোঁক প্রক্রিয়া ব্যবহার করে।
-A
আপনি যে ফাইল ফাইলগুলি ডাউনলোড করতে চান তার একটি তালিকা নির্দেশ করে এমন প্যারামিটারটি নোট করুন ।
আপনি অন্য ট্যাগ ব্যবহার -D domain1.com,domain2.com
করতে পারেন, আপনি ডাউনলোড করতে চান এমন কয়েকটি ডোমেনগুলি বোঝাতে যদি তাদের অন্য সার্ভার থাকে বা বিভিন্ন ধরণের ফাইল হোস্ট করার জন্য যা কিছু থাকে। আপনি যদি ফাইলগুলি না পান তবে সমস্ত ক্ষেত্রে এটি স্বয়ংক্রিয় করার কোনও নিরাপদ উপায় নেই।
wget
লিনাক্সে সাধারণত ইনস্টল করা থাকে তবে অন্যান্য ইউনিক্স সিস্টেমের জন্য তুচ্ছভাবে সংকলন করা যায় বা উইন্ডোজের জন্য সহজেই ডাউনলোড করা যায়: GNUwin32 WGET
এটি ভাল এবং না মন্দ জন্য ব্যবহার করুন।
ভাল, নিখরচায় সমাধান: এইচটি ট্র্যাক
এইচটি ট্র্যাক একটি ফ্রি (জিপিএল, বিনামূল্যে / বিনামূল্যে সফটওয়্যার) এবং সহজেই ব্যবহারযোগ্য অফলাইন ব্রাউজার ইউটিলিটি।
এটি আপনাকে ইন্টারনেট থেকে একটি স্থানীয় ডিরেক্টরিতে একটি ওয়ার্ল্ড ওয়াইড ওয়েব সাইট ডাউনলোড করতে, পুনরায় ক্রমান্বয়ে সমস্ত ডিরেক্টরি তৈরি করতে, সার্ভার থেকে আপনার কম্পিউটারে এইচটিএমএল, চিত্র এবং অন্যান্য ফাইল প্রাপ্ত করার অনুমতি দেয়। এইচটি ট্র্যাক মূল সাইটের আপেক্ষিক লিঙ্ক-কাঠামোটি সাজিয়েছে। আপনার ব্রাউজারে কেবল "মিররযুক্ত" ওয়েবসাইটের একটি পৃষ্ঠা খুলুন এবং আপনি লিঙ্ক থেকে লিঙ্কে সাইটটি ব্রাউজ করতে পারেন, যেন আপনি এটি অনলাইনে দেখছেন। এইচটি ট্র্যাক একটি বিদ্যমান মিররযুক্ত সাইট আপডেট করতে পারে এবং বাধা ডাউনলোডগুলি আবার শুরু করতে পারে। এইচটিট্র্যাক সম্পূর্ণরূপে কনফিগারযোগ্য এবং এতে একটি সমন্বিত সহায়তা সিস্টেম রয়েছে।
লিনাক্স সিস্টেমে 'উইজেট' এটি করে, অনেক বেশি।
এটি অন্যান্য বেশ কয়েকটি প্ল্যাটফর্মেও চালিত হয়েছে, যেমন অন্যান্য উত্তরগুলির উল্লেখ রয়েছে।
স্পষ্টতই WGet কয়েকবার উল্লেখ করা হয়েছে। আমি এটির জন্য সেরা ইউআই খুঁজে পেয়েছি
ডাব্লুগেটের জন্য আরও কয়েকটি ইউআই রয়েছে, যার মধ্যে বেশিরভাগ খারাপ ইউআই প্রশ্নের প্রার্থী
আপনাকে উইজেট ব্যবহার করতে হবে - যা বেশিরভাগ প্ল্যাটফর্মের জন্য উপলব্ধ। কার্ল নথিগুলি পুনরাবৃত্তির জন্য অনুরোধ করবে না, যা উইজেটের অন্যতম প্রধান শক্তি।
লিনাক্স: (সাধারণত ডিস্ট্রোতে অন্তর্ভুক্ত) http://www.gnu.org/software/wget/
উইন্ডোজ: http://gnuwin32.sourceforge.net/packages/wget.htm
ম্যাক: http: //www.geekology। co.za/blog/2009/02/macports-compile-and-install-open-source-software-on-mac-os-x/
অনুগ্রহ করে নিশ্চিত করুন যে আপনি ওয়েবসাইটটি হাতুড়ি দিচ্ছেন না - অনুরোধগুলির মধ্যে উপযুক্ত বিলম্ব স্থাপন করুন এবং নিশ্চিত করুন এটি সাইটের পরিষেবার শর্তাদির মধ্যে রয়েছে।
-Adam
প্রকৃতপক্ষে, জিডব্লিউল্লাসার পোস্টে আমার মন্তব্য অনুসরণ করে, আমি কেবল মনে করেছি যে আমি GnuWin32 ইনস্টল করেছি এবং নিশ্চিত যে এটিতে উইজেটের একটি উইন্ডোজ পোর্ট রয়েছে।
http://sourceforge.net/projects/gnuwin32/
GnuWin32 provides Win32-versions of GNU tools,
or tools with a similar open source licence.
The ports are native ports, that is they rely
only on libraries provided with any 32-bits
MS-Windows operating system, such as
MS-Windows 95 / 98 / 2000 / NT / XP
আমি কয়েক বছর আগে এটি ব্যবহার করেছি এবং এটি ভাল কাজ করেছে। উইন্ডোজ শুধুমাত্র। অ্যাডওয়্যার হিসাবে ব্যবহৃত হয় তবে আর স্পষ্টত:
wget --random-wait -r -p -e robots=off -U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)" --limit-rate=20k -b http://www.example.com
-p
: প্যারামিটার উইজেটকে চিত্র সহ সমস্ত ফাইল অন্তর্ভুক্ত করতে বলে।-e robots=off
: সাইট রোবটসটেক্সট বিধি উপেক্ষা করুন-U "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1)"
: ব্যবহারকারী এজেন্ট স্ট্রিং--random-wait
: কালো তালিকাভুক্ত হওয়া এড়ান--limit-rate=20k
: এটি যে হারে ফাইল ডাউনলোড করে তা সীমাবদ্ধ করে।-b
: লগ আউট পরে উইজেট অবিরত।
-c
(বা --continue
) বিকল্পও যুক্ত করি।
আমি মনে করি আইডিএম সাইট গ্রাবার সেরা সমাধান, এখানে টেলিপোর্ট প্রোও রয়েছে
ফ্রি ডাউনলোড ম্যানেজার সম্পূর্ণ ওয়েব সাইটগুলিও ডাউনলোড করতে পারে।
উইন্ডোজ শুধুমাত্র আমি মনে করি।