যদি লাইন-বাই-লাইন তুলনা করা গ্রহণযোগ্য হয়, তবে নিম্নলিখিতগুলিতে কোন লাইনে ফাইলটিতে নকল করা হয়েছে textএবং প্রত্যেকটি কতবার প্রদর্শিত হবে তা নিম্নলিখিতটি জানিয়ে দেবে :
sort text | uniq -c | grep -vE '^\s*1 '
উদাহরণ হিসাবে,
$ cat text
alpha
beta
alpha
gamma
alpha
beta
$ sort text | uniq -c | grep -vE '^\s*1 '
3 alpha
2 beta
সাধারণ ইউনিক্স সরঞ্জাম ব্যবহার করে, ইনপুট পরীক্ষার বিন্যাসটি অনুচ্ছেদ-অনুসারে-অনুচ্ছেদে বা বাক্য-বাক্য বাক্য তুলনার তুলনায়, ইনপুট পরীক্ষার বিন্যাসটি খুব জটিল নয় বলে ধরে নেওয়া যায়।
পুনরাবৃত্তি অনুচ্ছেদগুলি সন্ধান করা
মনে করুন যে আমাদের ফাইলটিতে textরয়েছে:
This is a paragraph.
This is another
paragraph
This is
a paragraph.
Last sentence.
নিম্নলিখিত অনুচ্ছেদে চিহ্নিত করা হয়েছে যে কোন অনুচ্ছেদে একাধিকবার প্রদর্শিত হবে:
$ awk -v RS="" '{gsub(/\n/," "); print}' text | sort | uniq -c | grep -vE '^\s*1 '
2 This is a paragraph.
এটি awkপাঠ্যগুলিকে অনুচ্ছেদে বিভক্ত করার জন্য ব্যবহার করে (ফাঁকা রেখার দ্বারা বর্ণিত), নিউলাইনগুলিকে স্পেসে রূপান্তরিত করে এবং তারপরে অনুচ্ছেদে গণনা করার জন্য ইউনিকের জন্য অনুচ্ছেদে প্রতি এক লাইন আউটপুট পাস করে।
উপরেরটি জিএনইউ দিয়ে পরীক্ষা করা হয়েছিল awk। অন্যান্যগুলির awkজন্য, অনুচ্ছেদ (রেকর্ড) সীমানা হিসাবে ফাঁকা রেখাগুলি সংজ্ঞায়নের পদ্ধতি পৃথক হতে পারে।
vimdiffআপনার জন্য এখানে প্রশ্ন করতে পারবেন আপনার