আমি কোনও ইউআরএল থেকে সমস্ত চিত্র একক ফোল্ডারে ডাউনলোড করতে কীভাবে ব্যবহার করব?


133

আমি কোনও ওয়েবসাইট থেকে সমস্ত চিত্র ডাউনলোড করতে উইজেট ব্যবহার করছি এবং এটি দুর্দান্ত কাজ করে তবে এটি সাইটের সাব-ফোল্ডারগুলির সাথে সাইটের মূল আদিক্রমকে সংরক্ষণ করে এবং তাই চিত্রগুলি চারদিকে ডটেড। এমন কোনও উপায় আছে যাতে এটি সমস্ত চিত্রগুলি কেবল একটি ফোল্ডারে ডাউনলোড করতে পারে? এই মুহূর্তে আমি যে বাক্য গঠনটি ব্যবহার করছি তা হ'ল:

wget -r -A jpeg,jpg,bmp,gif,png http://www.somedomain.com

উত্তর:


194

এটা চেষ্টা কর:

wget -nd -r -P /save/location -A jpeg,jpg,bmp,gif,png http://www.somedomain.com

এখানে আরও কিছু তথ্য দেওয়া হল:

-ndডিরেক্টরি হায়ারার্কি (যেমন কোনও ডিরেক্টরি নেই ) তৈরি করা বাধা দেয় ।

-rপুনরাবৃত্তি পুনরুদ্ধার সক্ষম করে। আরও তথ্যের জন্য রিকার্সিভ ডাউনলোড দেখুন ।

-P ডিরেক্টরি উপসর্গ সেট করে যেখানে সমস্ত ফাইল এবং ডিরেক্টরি সংরক্ষণ করা হয়।

-Aকেবলমাত্র কিছু নির্দিষ্ট ফাইলের পুনরুদ্ধারের জন্য একটি শ্বেতলিস্ট সেট করে। স্ট্রিংস এবং নিদর্শনগুলি গ্রহণ করা হয়, এবং উভয়ই কমা দ্বারা পৃথক করা তালিকায় ব্যবহার করা যেতে পারে (উপরে বর্ণিত হিসাবে)। আরও তথ্যের জন্য ফাইলের প্রকারগুলি দেখুন ।


5
এটি আসলে আমার পক্ষে কাজ করে নি। আমার সেভ লোকেশন ছিল "।" এবং এটি সেখানে পুরো সাইটের শ্রেণিবিন্যাসের অনুলিপি করেছে।
বাটাল বুট্কাস

2
@ বাটলবাটকাস মনে হচ্ছে গ্রহণযোগ্য -Aবিকল্পের সাথে আপনার আরও কিছুটা গোলমাল দরকার , ফাইলের ধরণের উইজেট ডকুমেন্টেশন দেখুন । এছাড়াও, আপনি যদি বর্তমান ডিরেক্টরিতে ডাউনলোড করছেন তবে আপনি ডিরেক্টরি উপসর্গ -Pবিকল্পটি সরাতে পারেন । আপনি যদি একক ফাইল প্রকার যেমন jpg এর মতো ডাউনলোড করেন তবে এর মতো কিছু ব্যবহার করুন wget -r -A.jpg http://www.domain.com। এ উন্নত উদাহরণ যে Wget- এর ডকুমেন্টেশন প্রদান করে।
জন

-nd উপরের সাথে যুক্ত করা এটি কার্যকর করে। আপনি একাধিক-এ পতাকা নির্দিষ্ট করতে পারেন যেমন-A "*foo*" -A "*bar*"
ইয়াবলারগো

1
ব্যবহার করতে ভুলবেন না --level=infবা --level=9999999999কারণ wgetকাজ নাশকতার কারণে সর্বোচ্চ পুনরাবৃত্তির গভীরতা স্তর ডিফল্ট সম্ভাবনা থাকে 5
ব্যবহারকারী 619271

127
wget -nd -r -l 2 -A jpg,jpeg,png,gif http://t.co
  • -nd: কোনও ডিরেক্টরি নেই (বর্তমান ডিরেক্টরিতে সমস্ত ফাইল সংরক্ষণ করুন; -P directory লক্ষ্য ডিরেক্টরি পরিবর্তন করে)
  • -r -l 2: পুনরাবৃত্তির স্তর 2
  • -A: গৃহীত এক্সটেনশনগুলি
wget -nd -H -p -A jpg,jpeg,png,gif -e robots=off example.tumblr.com/page/{1..2}
  • -H: স্প্যান হোস্ট (উইজেট ডিফল্টরূপে বিভিন্ন ডোমেন বা সাবডোমেন থেকে ফাইল ডাউনলোড করে না)
  • -p: পৃষ্ঠার প্রয়োজনীয়তা (প্রতিটি পৃষ্ঠায় চিত্রের মতো সংস্থানসমূহ অন্তর্ভুক্ত)
  • -e robots=off: কমান্ড এক্সিকিউট করুন robotos=offযেন এটি .wgetrcফাইলের অংশ । এর ফলে রোবট বর্জন বন্ধ হয়ে যায় যার অর্থ আপনি রোবটস.টেক্সট এবং রোবট মেটা ট্যাগগুলি উপেক্ষা করেন (আপনার সাথে কীভাবে আসে এর প্রভাবগুলি আপনার জানা উচিত, যত্ন নিন)।

উদাহরণ: .jpgএকটি অনুকরণীয় ডিরেক্টরি তালিকা থেকে সমস্ত ফাইল পান :

$ wget -nd -r -l 1 -A jpg http://example.com/listing/

13

আমি একটি শেলসক্রিপ্ট লিখেছি যা একাধিক ওয়েবসাইটগুলির জন্য এই সমস্যাটি সমাধান করে: https://github.com/eduardschaeli/wget-image-scraper

(উইজেটের সাথে ইউআরএলগুলির একটি তালিকা থেকে চিত্রগুলি স্ক্র্যাপ করে)


দুর্দান্ত কাজ করেছেন ধন্যবাদ
জারেড মার্টিন

9

আর একবার চেষ্টা কর:

wget -nd -r -P /save/location/ -A jpeg,jpg,bmp,gif,png http://www.domain.com

এবং এটি সমস্ত অতিরিক্ত তথ্য মোছা না হওয়া পর্যন্ত অপেক্ষা করুন


এটি আমার পক্ষে কাজ করছে না। wget -nd -r -P /Users/duraiamuthan/Downloads/images/ -A jpeg,jpg,bmp,gif,png http://www.forbes.com/profile/mark-zuckerberg/
ভিভো

5

ম্যান পৃষ্ঠা অনুসারে -P পতাকাটি হ'ল:

-P উপসর্গ --directory-prefix = উপসর্গ ডিরেক্টরি উপসর্গ উপসর্গ সেট করুন। ডিরেক্টরি উপসর্গটি হ'ল ডিরেক্টরি যেখানে অন্য সমস্ত ফাইল এবং উপ-ডিরেক্টরিগুলি সংরক্ষণ করা হবে, অর্থাৎ পুনরুদ্ধার গাছের শীর্ষে। ডিফল্ট হয়। (বর্তমান ডিরেক্টরি)

এর অর্থ এটি কেবল গন্তব্য নির্দিষ্ট করে তবে ডিরেক্টরি গাছটি কোথায় সংরক্ষণ করতে হবে। এটি কেবল একটি ডিরেক্টরিতে গাছটিকে সমতল করে না । হিসাবে উল্লিখিত পূর্বে উল্লিখিত পতাকা আসলে এটি করে।

@ ভবিষ্যতে জন পতাকাটি কী করে তা বর্ণনা করা উপকারী হবে তাই আমরা বুঝতে পারি যে কীভাবে কাজ করে।


2

প্রস্তাবিত সমাধানগুলি চিত্রগুলি ডাউনলোড করার জন্য উপযুক্ত এবং যদি আপনি যে ডিরেক্টরিটি ব্যবহার করছেন তখন সমস্ত ফাইল সংরক্ষণ করার পক্ষে এটি যথেষ্ট হয়। তবে আপনি যদি সাইটের সমস্ত শ্রেণিবদ্ধ গাছ পুনরুত্পাদন না করে একটি নির্দিষ্ট ডিরেক্টরিতে সমস্ত চিত্র সংরক্ষণ করতে চান তবে জন দ্বারা প্রস্তাবিত লাইনে "কাট-ডায়ারস" যুক্ত করার চেষ্টা করুন।

wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://www.boia.de --cut-dirs=1 --cut-dirs=2 --cut-dirs=3

এক্ষেত্রে কাট-ডায়াররা আপনার উল্লিখিত ডিরেক্টরিতে থাকা সমস্ত ফাইল সংরক্ষণ করে ওয়েবসাইটের বায়ুক্রমিক গাছের গভীরতার তৃতীয় স্তরের অবধি উইজেটকে সাব-ডিরেক্টরিগুলি তৈরি করা থেকে বিরত রাখবে if একটি গভীর কাঠামো সহ সাইটগুলির সাথে ডিল করছে।


-7

উইজেট ইউটিলিটি এইচটিটিপি, এইচটিটিপিএস এবং এফটিপি এর মতো বহুল ব্যবহৃত প্রোটোকল ব্যবহার করে ওয়ার্ল্ড ওয়াইড ওয়েব (ডাব্লুডাব্লুডাব্লু) থেকে ফাইলগুলি পুনরুদ্ধার করে। উইজেট ইউটিলিটি অবাধে উপলব্ধ প্যাকেজ এবং লাইসেন্স জিএনইউ জিপিএল লাইসেন্সের অধীনে। এই ইউটিলিটিটি উইন্ডোজ এবং ম্যাক ওএস সহ যে কোনও ইউনিক্সের মতো অপারেটিং সিস্টেম ইনস্টল করতে পারে। এটি একটি ইন্টারঅ্যাক্টিভ কমান্ড লাইন সরঞ্জাম। উইজেটের প্রধান বৈশিষ্ট্য হ'ল এটি দৃust়তা। এটি এমনভাবে ডিজাইন করা হয়েছে যাতে এটি ধীর বা অস্থির নেটওয়ার্ক সংযোগে কাজ করে। নেটওয়ার্ক সমস্যার কারণে উইজেট স্বয়ংক্রিয়ভাবে ডাউনলোড শুরু করে। পুনরাবৃত্তভাবে ফাইলও ডাউনলোড করে। ফাইলটি পুরোপুরি পুনরুদ্ধার না হওয়া পর্যন্ত এটি চেষ্টা চালিয়ে যাবে।

লিনাক্স মেশিনে উইজেট ইনস্টল করুন সুডো এপ-গেট ইনস্টল করুন

আপনি যেখানে ফাইল ডাউনলোড করতে চান সেখানে একটি ফোল্ডার তৈরি করুন। sudo mkdir myimages সিডি মাইমেজেস

ওয়েবপৃষ্ঠায় ডান ক্লিক করুন এবং উদাহরণস্বরূপ আপনি যদি চিত্রের অবস্থান চান তবে চিত্রের উপর ডান ক্লিক করুন এবং চিত্রের অবস্থানটি অনুলিপি করুন। যদি একাধিক চিত্র থাকে তবে নীচে অনুসরণ করুন:

যদি একবারে ওয়েব থেকে ডাউনলোড করার জন্য 20 টি চিত্র থাকে তবে ব্যাপ্তি 0 থেকে 19 পর্যন্ত শুরু হয়।

wget হয় http://joindiaspora.com/img {0..19} .jpg


2
আপনার উত্তরটি ব্যাখ্যা করে যে উইজেটটি কী এবং ক্রমানুসারে সংখ্যাযুক্ত চিত্রগুলি ডাউনলোড করতে কীভাবে এটি ব্যবহার করবেন ... এটি মূল প্রশ্নের সাথে সম্পর্কিত নয়।
অ্যালাস্টার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.