উত্তর:
আপনি wget
পৃষ্ঠাটি ডাউনলোড করতে কমান্ডটি ব্যবহার করতে পারেন এবং এটিকে একটি পরিবর্তনশীল হিসাবে এটি পড়তে পারেন:
content=$(wget google.com -q -O -)
echo $content
আমরা সেই -O
বিকল্পটি ব্যবহার করি wget
যা আমাদের সেই ফাইলটির নাম নির্দিষ্ট করতে দেয় যা wget
পৃষ্ঠার সামগ্রীগুলি ফেলে দেয়। আমরা -
স্ট্যান্ডার্ড আউটপুট এ ডাম্প পেতে এবং পরিবর্তনশীল মধ্যে এটি সংগ্রহ নির্দিষ্ট content
। আপনি -q
উইজেটের আউটপুট বন্ধ করতে শান্ত বিকল্পটি যুক্ত করতে পারেন ।
আপনি পাশাপাশি হিসাবে কার্ল কমান্ড ব্যবহার করতে পারেন :
content=$(curl -L google.com)
echo $content
আমরা -L
যে পৃষ্ঠার জন্য অনুরোধ করছি সে পৃষ্ঠাটি সরে যেতে পারে বলে আমাদের বিকল্পটি ব্যবহার করতে হবে । কোন ক্ষেত্রে আমাদের নতুন অবস্থান থেকে পৃষ্ঠাটি নেওয়া দরকার। -L
অথবা --location
বিকল্প আমাদের সাথে সাহায্য করে।
src
সঠিক উপাদানটির বৈশিষ্ট্যটি বের করতে হবে , তারপরে পৃষ্ঠাটি ডাউনলোড করতে হবে । আপনি যদি টিকিট ইনস্টল করেন , এই কমান্ডটি এটি করা উচিত:curl -s http://ww1.watchop.io/manga2/read/one-piece/1/4 | tq -j -a src "#imgholder a img" | xargs wget
convert_links = on
সাথে গ্রহণ করছে না -O-
। এটি ত্রুটির সাথে ব্যর্থ হচ্ছে -k can be used together with -O only if outputting to a regular file.
। এটা আশা করা হয়?
কমান্ড লাইন থেকে পৃষ্ঠা পাওয়ার অনেকগুলি উপায় রয়েছে ... তবে আপনি কোড উত্স বা পৃষ্ঠাটি নিজেই চান তা এটি নির্ভর করে:
আপনার যদি কোড উত্সের প্রয়োজন হয়:
কার্ল সহ:
curl $url
উইজেট সহ:
wget -O - $url
তবে আপনি যদি ব্রাউজার দিয়ে যা দেখতে পান তা পেতে চাইলে লিংকগুলি কার্যকর হতে পারে:
lynx -dump $url
আমি মনে করি আপনি এই সামান্য সমস্যার জন্য এতগুলি সমাধান খুঁজে পেতে পারেন, সম্ভবত আপনাকে এই আদেশগুলির জন্য সমস্ত ম্যান পৃষ্ঠা পড়তে হবে। এবং $url
আপনার ইউআরএল দ্বারা প্রতিস্থাপন করতে ভুলবেন না :)
শুভকামনা :)
নেই wget
আদেশ বা curl
।
আপনি এখন উইজেটের সাহায্যে ডাউনলোড করা ফাইলটি ব্যবহার করতে পারেন। অথবা আপনি কার্ল দিয়ে একটি স্ট্রিম পরিচালনা করতে পারেন।
সংস্থানসমূহ:
আপনার যদি এলডাব্লুপি ইনস্টল করা থাকে তবে এটি " জিইটি " নামক একটি বাইনারি সরবরাহ করে ।
Http:// http://example.com পান <! ডক্টইপ এইচটিএমএল পাবলিক "- // ডাব্লু 3 সি // ডিটিডি এইচটিএমএল 4.01 ট্রানজিশনাল // EN"> <Html> Er <HEAD> <মেটা http-برابر = "সামগ্রী-প্রকার" সামগ্রী = "পাঠ্য / এইচটিএমএল; চরসেট = utf-8"> <TITLE> উদাহরণ ওয়েব পৃষ্ঠা </ translation> </ Head> <Body> এর <p> আপনি & quot; উদাহরণ.com & quot ;, টাইপ করে এই ওয়েব পৃষ্ঠায় পৌঁছেছেন, করুন & quot; example.net করুন & quot; & quot; example.org করুন & quot বা & quot; উদাহরণ.edu & quot; আপনার ওয়েব ব্রাউজারে। </ p> <p> এই ডোমেনের নামগুলি ডকুমেন্টেশনে ব্যবহারের জন্য সংরক্ষিত এবং উপলভ্য নয় নিবন্ধনের জন্য। <a href="http://www.rfc-editor.org/rfc/rfc2606.txt"> আরএফসি দেখুন 2606 </a>, বিভাগ 3। </ P> </ Body> </ Html>
wget -O-
, curl
এবং lynx -source
একইরকম আচরণ করে।
আপনি কাঁচা ডেটা ব্যবহার করতে curl
বা wget
পুনরুদ্ধার করতে পারেন বা w3m -dump
কোনও ওয়েব পৃষ্ঠার একটি সুন্দর পাঠ্য উপস্থাপনা ব্যবহার করতে পারেন।
$ foo=$(w3m -dump http://www.example.com/); echo $foo
You have reached this web page by typing "example.com", "example.net","example.org" or "example.edu" into your web browser. These domain names are reserved for use in documentation and are not available for registration. See RFC 2606, Section 3.