পরামিতিগুলির সাথে লিঙ্কগুলি অনুসরণ না করে কীভাবে উইজেট দিয়ে ডাউনলোড করবেন


11

আমি একটি সিডিতে অন্তর্ভুক্তির জন্য দুটি সাইট ডাউনলোড করার চেষ্টা করছি:

http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info

আমার যে সমস্যা হচ্ছে তা হ'ল এগুলি উভয়ই উইকি are উদাহরণস্বরূপ ডাউনলোড করার সময়:

wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/

আমি প্রচুর ফাইল পাই কারণ এটি ... ... ক্রিয়া = সম্পাদনা ...? ক্রিয়া = ডিফ এবং সংস্করণ = ... এর মতো লিঙ্কগুলিও অনুসরণ করে

কেউ কি এর কাছাকাছি যাওয়ার কোনও উপায় জানেন?

আমি কেবল বর্তমান পৃষ্ঠাগুলি চাই, ছবি ছাড়া এবং ভিন্নতা ইত্যাদি চাই want

পুনশ্চ:

wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex

এটি বার্কলির পক্ষে কাজ করেছে তবে Boinc-wiki.info এখনও আমাকে সমস্যা দিচ্ছে: /

PPS:

এর সাথে সর্বাধিক প্রাসঙ্গিক পৃষ্ঠাগুলি হিসাবে উপস্থিত বলে আমি পেয়েছি:

wget -r -k -nv  -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info

সুপারইউজার এবং সার্ভারফাল্ট সার্ভারফল্ট
ব্রায়ান

আমার এটি কোথায় পোস্ট করা উচিত?
টাই-ফাইটার

এইটাই সঠিক স্থান. এটি কোনও সার্ভারের প্রশ্ন নয়।
ডেভিড জেড

তবুও আমি সার্ভারফল্টে আরও ভাল উত্তর পেয়েছি;)
টাই-ফাইটার

উত্তর:


5

উইজেটের নতুন সংস্করণ (v.1.14) এই সমস্ত সমস্যার সমাধান করে।

--reject-regex=....কোয়েরি স্ট্রিংগুলি পরিচালনা করতে আপনাকে নতুন বিকল্পটি ব্যবহার করতে হবে ।

মনে রাখবেন যে আমি নতুন ম্যানুয়ালটিতে এই নতুন বিকল্পগুলি অন্তর্ভুক্ত করতে পারি নি তাই আপনাকে সহায়তা আদেশটি ব্যবহার করতে হবে wget --help > help.txt


4
wget --reject-regex '(.*)\?(.*)' http://example.com

( --reject-type posixডিফল্টরূপে) wgetঅন্যান্য মন্তব্য অনুসারে শুধুমাত্র সাম্প্রতিক (> = 1.14) সংস্করণগুলির জন্য কাজ করে ।

সাবধান থাকুন যে মনে হয় আপনি --reject-regexপ্রতি wgetকল প্রতি একবার ব্যবহার করতে পারবেন । এটি হ'ল, |যদি আপনি বেশ কয়েকটি রেইজেক্সে নির্বাচন করতে চান তবে আপনাকে একটি একক রেজেক্সে ব্যবহার করতে হবে:

wget --reject-regex 'expr1|expr2|…' http://example.com

সংস্করণ প্রয়োজনীয়তা সম্পর্কে সত্য হতে পারে। আমার v1.12 ছিল এবং বিকল্পটি বৈধ ছিল না। V1.15 এ আপগ্রেড করার পরে এটি ছিল।
ইউনজেন

|("পাইপ") প্রতীক ব্যবহার করে রেজেক্স বিকল্পটি জিএনইউ উইজেট 1.16 দিয়ে আমার জন্য কাজ করছে না।
সাম্পাব্লুকুপার

0
wget -R "*?action=*"

এটি ?action=এর নামে থাকা যেকোনো কিছু বাদ দেবে ।


3
"নোট, এছাড়াও, সেই প্রশ্নের ক্যারি স্ট্রিংগুলি (প্রশ্ন চিহ্ন ('?') দিয়ে URL এর শেষে শুরু হওয়া স্ট্রিংগুলি নিয়ম গ্রহণ / প্রত্যাখ্যান করার জন্য ফাইলের নাম হিসাবে অন্তর্ভুক্ত করা হয়নি, যদিও এগুলি আসলে নির্বাচিত নামটিতে অবদান রাখবে) স্থানীয় ফাইলের জন্য এটি প্রত্যাশিত যে ভবিষ্যতের উইগেটের সংস্করণ কোয়েরি স্ট্রিংগুলির সাথে মিলের জন্য একটি বিকল্প সরবরাহ করবে। "
টাই-ফাইটার

হুম, আমি অবশ্যই এটি মিস করেছি দেখে মনে হচ্ছে আপনি উইজেটের সাহায্যে এটি করতে পারবেন না যদি এটি এমনকি যদি না জেনে থাকে যে তারা বিভিন্ন ফাইল। আমি একটি ভিন্ন প্রোগ্রাম প্রস্তাব।
ডাইসেটসু

-3

আমি বলব যে একটি পাবলিক উইকির সাইটকে ফাঁস করা খারাপ অভ্যাস, কারণ এটি এতে অতিরিক্ত চাপ দেয়।

যদি কোনও উইকি সর্বজনীন হয় এবং সাইটের মালিকরা সামগ্রীটি ভাগ করে নিতে আপত্তি করেন না, তবে তারা সাধারণত ডাউনলোডযোগ্য ব্যাকএন্ড (ডাটাবেস বা যাই হোক না কেন) ডাম্প সরবরাহ করে। সুতরাং আপনি কেবল ডেটা প্যাকটি ডাউনলোড করবেন, একই উইকি ইঞ্জিনের স্থানীয় উদাহরণ স্থাপন করবেন, এতে ডেটা আমদানি করুন এবং একটি স্থানীয় অনুলিপি পাবেন। এর পরে, আপনি যদি চান, আপনি স্থানীয়ভাবে জোঁক করতে পারেন।


এখানে দ্বিতীয় সেকেন্ড আছে। যেমন- w 5. gnu.org/software/wget/manual/html_node/…
বারলপ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.