উইজেট ব্যবহার করে কীভাবে একটি সম্পূর্ণ ডিরেক্টরি এবং সাব ডিরেক্টরিগুলি ডাউনলোড করবেন?

143

আমি কোনও প্রকল্পের জন্য ফাইলগুলি ডাউনলোড করার চেষ্টা করছি wget, কারণ সেই প্রকল্পের এসভিএন সার্ভার আর চলছে না এবং আমি কেবল একটি ব্রাউজারের মাধ্যমে ফাইলগুলি অ্যাক্সেস করতে সক্ষম হয়েছি। সমস্ত ফাইলের জন্য বেস URL গুলি একই রকম the

http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/ *

wgetএই সংগ্রহস্থলের সমস্ত ফাইল ডাউনলোড করতে আমি কীভাবে (বা অন্য কোনও অনুরূপ সরঞ্জাম) ব্যবহার করতে পারি , যেখানে "tzivi" ফোল্ডারটি মূল ফোল্ডার এবং এর অধীনে বেশ কয়েকটি ফাইল এবং সাব-ফোল্ডার (2 বা 3 স্তর পর্যন্ত) রয়েছে?

— code4fun
সূত্র

3

আপনার প্রয়োজনীয় ফাইলগুলির লিঙ্কের তালিকা সহ সার্ভারের কোনও ওয়েব-পৃষ্ঠা না থাকলে আপনি এটি করতে পারবেন না।

— এডি_ইম

1

আপনি ফাইলের নাম জানেন?

— করলি হরভথ

না, আমি সমস্ত ফাইলের নাম জানি না the আমি পুনরাবৃত্তির বিকল্পটি দিয়ে উইজেটের চেষ্টা করেছি তবে এটি কোনও কাজ করে না s কারণ সার্ভারের কোনও সূচিপত্র HTML ফাইল নেই যা সমস্ত অভ্যন্তরীণ লিঙ্কগুলি তালিকাভুক্ত করে।

— fun

আপনি কি উইজেটের মিররিং বিকল্পটি ব্যবহার করে দেখেছেন?

— টমাসজ এনগুইন

193

আপনি এটি শেল ব্যবহার করতে পারেন:

wget -r --no-parent http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/

প্যারামিটারগুলি হ'ল:

-r     //recursive Download

এবং

--no-parent // Don´t download something from the parent directory

আপনি যদি পুরো সামগ্রীটি ডাউনলোড করতে না চান তবে আপনি ব্যবহার করতে পারেন:

-l1 just download the directory (tzivi in your case)

-l2 download the directory and all level 1 subfolders ('tzivi/something' but not 'tivizi/somthing/foo')

ইত্যাদি। আপনি যদি কোনও -lবিকল্প প্রবেশ করান না তবে স্বয়ংক্রিয়ভাবে wgetব্যবহার করবেন will-l 5

আপনি যদি কোনও -l 0sertোকান তবে আপনি পুরো ইন্টারনেট ডাউনলোড করুন, কারণ wgetএটি খুঁজে পাওয়া প্রতিটি লিঙ্ক অনুসরণ করবে।

19

দুর্দান্ত, তাই পরবর্তী পাঠকের জন্য সহজ করার জন্য: wget -r -l1 --no-parent http://www.stanford.edu/~boyd/cvxbook/cvxbook_additional_exercises/আমার কাছে উত্তর ছিল। আপনার উত্তর ধন্যবাদ।

— isomorphismes

2

আমি উপরের কমান্ডটি সমস্ত ফাইল থেকে পেতে চেষ্টা করেছিলাম http://websitename.com/wp-content/uploads/2009/05তবে index.htmlযা পেলাম তা একটি ফাইল যা কিছুই ছিল না। আমি কী মিস করেছি তা আমি বুঝতে পারি না।

— বিবেক টোদি

@ আপ: নোট করুন যে উইজেট লিঙ্কগুলি অনুসরণ করে, সুতরাং আপনার ডিরেক্টরি তালিকা প্রয়োজন;)

11

আমি জানি এটি বেশ পুরানো। তবে আমি যা দরকারী মনে করি তা হ'ল -e robots=offস্যুইচ। ;)

— ম্যাথিয়াস ডব্লিউ।

2

আপনি "আমি গুরুত্বপূর্ণ কিছু ভুলে গেছি" এবং সরানো উত্তরটি কেন সরিয়ে দেবেন না ???

— ব্যবহারকারী 1271772

16

আপনি এটি শেল ব্যবহার করতে পারেন:

wget -r -nH --cut-dirs=7 --reject="index.html*" \
      http://abc.tamu.edu/projects/tzivi/repository/revisions/2/raw/tzivi/

প্যারামিটারগুলি হ'ল:

-r recursively download

-nH (--no-host-directories) cuts out hostname 

--cut-dirs=X (cuts out X directories)

— রাজীব যাদব
সূত্র

4

কমান্ড ব্যবহার করুন

wget -m www.ilanni.com/nexus/content/

— lanni654321
সূত্র

3

wget -r --no-parent URL --user=username --password=password

ডাউনলোডের জন্য আপনার ব্যবহারকারীর নাম এবং পাসওয়ার্ড থাকলে শেষ দুটি বিকল্প areচ্ছিক, অন্যথায় সেগুলি ব্যবহার করার দরকার নেই।

আপনি https://www.howtogeek.com/281663/how-to-use-wget-the-ultimate-command-line-downloading-tool/ লিঙ্কে আরও বিকল্প দেখতে পারেন

— Sarkar_lat_2016
সূত্র

1

আপনি এই আদেশটি ব্যবহার করতে পারেন:

wget --mirror -pc --convert-links -P ./your-local-dir/ http://www.your-website.com

যাতে আপনি যে ওয়েবসাইটটি ডাউনলোড করতে চান তার সঠিক আয়না পান

— baobab33
সূত্র

1

এই লিঙ্কটি সবেমাত্র আমাকে সেরা উত্তর দিয়েছে:

$ wget --no-clobber --convert-links --random-wait -r -p --level 1 -E -e robots=off -U mozilla http://base.site/dir/

কবজির মতো কাজ করেছেন।

— নেলিংটন মেডেইরোস
সূত্র

-1

এইটা কাজ করে:

wget -m -np -c --no-check-certificate -R "index.html*" "https://the-eye.eu/public/AudioBooks/Edgar%20Allan%20Poe%20-%2"

— হাইপ লুং
সূত্র