আমি এই ওয়েবপৃষ্ঠাটি এবং এটির লিঙ্কযুক্ত সমস্ত পৃষ্ঠা সংরক্ষণ করতে চাই । এবং সংরক্ষিত ওয়েবপৃষ্ঠাগুলির মধ্যে একই লিঙ্ক থাকার আশা করি।
প্রতিটি লিঙ্কযুক্ত পৃষ্ঠাগুলি খোলার ও সংরক্ষণ করার পরিবর্তে কিছু উপায় আছে?
আমি এই ওয়েবপৃষ্ঠাটি এবং এটির লিঙ্কযুক্ত সমস্ত পৃষ্ঠা সংরক্ষণ করতে চাই । এবং সংরক্ষিত ওয়েবপৃষ্ঠাগুলির মধ্যে একই লিঙ্ক থাকার আশা করি।
প্রতিটি লিঙ্কযুক্ত পৃষ্ঠাগুলি খোলার ও সংরক্ষণ করার পরিবর্তে কিছু উপায় আছে?
উত্তর:
আপনি উইজেট কমান্ড লাইন ইউটিলিটি দিয়ে যা করতে চান তা করতে পারেন । আপনি যদি এটির -r
বিকল্পটি সরবরাহ করেন তবে এটি পুনরুক্তরূপে ওয়েব পৃষ্ঠাগুলি ডাউনলোড করবে। উদাহরণ স্বরূপ:
wget -r http://mat.gsia.cmu.edu/orclass/integer/integer.html
এটি সেই ওয়েবপৃষ্ঠা এবং এর সাথে লিঙ্কযুক্ত যে কোনও কিছু ডাউনলোড করবে। আপনি এটি কেবলমাত্র কয়েকটি নির্দিষ্ট স্তরের পুনরাবৃত্তি করতে পারেন, এটি করার জন্য, আপনি কেবল -r
একটি সংখ্যা সরবরাহ করেন। যেমন:
wget -r 5 http://mat.gsia.cmu.edu/orclass/integer/integer.html
এই থ্রেডটি এখন পুরানো, তবে অন্যরা এটির দিকে নজর দিতে পারে। আপনাকে ধন্যবাদ, ওয়াফার্স, আমাকে সঠিক দিকে নির্দেশ করার জন্য তবে ওয়াফার্সের উত্তরটি প্রসারিত করার জন্য: উইজেটের একটি আধুনিক সংস্করণে লিঙ্কগুলি পুনরাবৃত্তি করার জন্য এবং তাদের স্থানীয় আপেক্ষিক লিঙ্কগুলি প্যাচ করার জন্য অনেকগুলি কার্যকর বিকল্প রয়েছে যাতে আপনি একটি স্থানীয় অনুলিপি নেভিগেট করতে পারেন একটি ওয়েব সাইটের। পুনরাবৃত্তি করতে -r বিকল্পটি ব্যবহার করুন, স্থানীয় লিঙ্কগুলিকে প্যাচ করার জন্য -k বিকল্পটি, আসলটি ব্যতীত অন্য ডোমেনগুলিতে প্রবেশের -H বিকল্পটি, কোন ডোমেনগুলিতে আপনাকে সীমাবদ্ধ করার জন্য -D বিকল্পটি সীমাবদ্ধ করার জন্য -l বিকল্পটি ব্যবহার করুন পুনরাবৃত্তির গভীরতা এবং আপনার traversal এর পাতাগুলিতে সঠিকভাবে প্রদর্শন করার জন্য প্রয়োজনীয় সমস্ত কিছু রয়েছে তা নিশ্চিত করার জন্য -p বিকল্পটি। উদাহরণস্বরূপ, নীচে একটি পৃষ্ঠা ডাউনলোড করা হবে এবং এটির সাথে সাথে লিঙ্ক করা সমস্ত কিছু, এটি স্থানীয়ভাবে ব্রাউজযোগ্য করে তুলবে,
wget -r -l 1 -p -k -H -D domain.com,relateddomain.com http://domain.com/page/in/domain
উপরের মত একটি কমান্ড ব্যবহার করে, আমি বহিরাগত লিঙ্কগুলি সহ, আমার স্থানীয় ডিস্কে এক্সট্রেনাস ডেটা ডাউনলোড না করে একটি উইকি পৃষ্ঠার একটি অংশ ডাউনলোড করতে সক্ষম হয়েছি। এখন, আমি যখন আমার ব্রাউজারে মূল পৃষ্ঠাটি খুলি, তখন আমি ইন্টারনেট সংযোগ ছাড়াই গাছটিতে চলাচল করতে পারি। একমাত্র বিরক্তি ছিল মূল পৃষ্ঠাটি উপ-ডিরেক্টরিগুলিতে সমাহিত হয়েছিল এবং এটি প্রদর্শন করতে সুবিধাজনক করার জন্য আমাকে একটি শীর্ষ স্তরের পুনর্নির্দেশ পৃষ্ঠা তৈরি করতে হয়েছিল। এটি সঠিক হয়ে উঠতে কিছু ট্রায়াল-এন্ড ত্রুটি নিতে পারে। উইজেট ম্যান পৃষ্ঠা পড়ুন এবং পরীক্ষা করুন।
আপনি এইচটি ট্র্যাকের মতো একটি ওয়েবসাইট ক্রলার ব্যবহার করতে পারেন যা বিনামূল্যে।
ওয়েবসাইট থেকে;
[এইচটি ট্র্যাক] আপনাকে ইন্টারনেট থেকে একটি স্থানীয় ডিরেক্টরিতে একটি ওয়ার্ল্ড ওয়াইড ওয়েব সাইট ডাউনলোড করতে, পুনরায় ক্রমান্বয়ে সমস্ত ডিরেক্টরি তৈরি করতে, সার্ভার থেকে আপনার কম্পিউটারে এইচটিএমএল, চিত্র এবং অন্যান্য ফাইল প্রাপ্ত করার অনুমতি দেয়। এইচটি ট্র্যাক মূল সাইটের আপেক্ষিক লিঙ্ক-কাঠামোটি সাজিয়েছে। আপনার ব্রাউজারে কেবল "মিররযুক্ত" ওয়েবসাইটের একটি পৃষ্ঠা খুলুন এবং আপনি লিঙ্ক থেকে লিঙ্কে সাইটটি ব্রাউজ করতে পারেন, যেন আপনি এটি অনলাইনে দেখছেন।