আপনার যদি এই অন্যান্য সরঞ্জামগুলি ইনস্টল না করা থাকে তবে কেবলমাত্র উইজেট এবং পৃষ্ঠায় কোনও সারণী পাঠ্য এবং লিঙ্কগুলির কোনও ফর্ম্যাটিং নেই, যেমন উত্স কোড বা ফাইলগুলির একটি তালিকা, আপনি এই জাতীয় সেড ব্যবহার করে এইচটিএমএলটি স্ট্রিপ করতে পারেন:
wget -qO- http://address/of/page/you/want/to/view/ | sed -e 's/<[^>]*>//g'
এটি পৃষ্ঠার উত্সটি STDOUT এ ছুঁড়ে ফেলার জন্য ব্যবহার করে এবং কোনও <> জোড়া এবং তাদের মধ্যে যে কোনও কিছু কেটে ফেলার জন্য সেজেট ব্যবহার করে।
তারপরে আপনি যে ফাইলটি তৈরি করতে চান সেটি সেড কমান্ডের আউটপুট পুনর্নির্দেশ করতে পারবেন>:
wget -qO- http://.../ | sed -e 's/<[^>]*>//g' > downloaded_file.txt
এনবি: আপনি দেখতে পাচ্ছেন যে যে ফাইলটি আপনি চান না তাতে অতিরিক্ত শ্বেত স্পেস রয়েছে (উদাহরণস্বরূপ লাইনগুলি কয়েকটি কলামকে ইন্ডেন্ট করা হয়)
আপনার টেক্সট এডিটরটি ফাইলটি পরিপাটি করার জন্য ব্যবহার করা সবচেয়ে সহজ হতে পারে (অথবা আপনি সি উত্স কোডটি ডাউনলোড করার সাথে সাথে কোনও উত্স ফর্ম্যাটার)।
আপনার যদি ফাইলের প্রতিটি লাইনে একই সরল কাজটি করতে হয় তবে সেড কমান্ডে এটি করার জন্য একটি কমান্ড অন্তর্ভুক্ত করতে পারেন (এখানে একটি শীর্ষস্থানীয় স্থান সরিয়ে নেওয়া):
wget -qO- http://.../ | sed -e 's/<[^>]*>//g;s/^ //g' > downloaded_stripped_file.txt
.c
। এটি শক্ত নয়, তবে এটি পৃষ্ঠার কাঠামোর উপর নির্ভর করে। আপনি যদি কোনও লিঙ্ক সরবরাহ করেন তবে কেউ আপনাকে সঠিক কোড দিয়ে সহায়তা করবে। অন্যথায়sed
বাperl
আপনার বন্ধু হয়।