যদি লাইন-বাই-লাইন তুলনা করা গ্রহণযোগ্য হয়, তবে নিম্নলিখিতগুলিতে কোন লাইনে ফাইলটিতে নকল করা হয়েছে text
এবং প্রত্যেকটি কতবার প্রদর্শিত হবে তা নিম্নলিখিতটি জানিয়ে দেবে :
sort text | uniq -c | grep -vE '^\s*1 '
উদাহরণ হিসাবে,
$ cat text
alpha
beta
alpha
gamma
alpha
beta
$ sort text | uniq -c | grep -vE '^\s*1 '
3 alpha
2 beta
সাধারণ ইউনিক্স সরঞ্জাম ব্যবহার করে, ইনপুট পরীক্ষার বিন্যাসটি অনুচ্ছেদ-অনুসারে-অনুচ্ছেদে বা বাক্য-বাক্য বাক্য তুলনার তুলনায়, ইনপুট পরীক্ষার বিন্যাসটি খুব জটিল নয় বলে ধরে নেওয়া যায়।
পুনরাবৃত্তি অনুচ্ছেদগুলি সন্ধান করা
মনে করুন যে আমাদের ফাইলটিতে text
রয়েছে:
This is a paragraph.
This is another
paragraph
This is
a paragraph.
Last sentence.
নিম্নলিখিত অনুচ্ছেদে চিহ্নিত করা হয়েছে যে কোন অনুচ্ছেদে একাধিকবার প্রদর্শিত হবে:
$ awk -v RS="" '{gsub(/\n/," "); print}' text | sort | uniq -c | grep -vE '^\s*1 '
2 This is a paragraph.
এটি awk
পাঠ্যগুলিকে অনুচ্ছেদে বিভক্ত করার জন্য ব্যবহার করে (ফাঁকা রেখার দ্বারা বর্ণিত), নিউলাইনগুলিকে স্পেসে রূপান্তরিত করে এবং তারপরে অনুচ্ছেদে গণনা করার জন্য ইউনিকের জন্য অনুচ্ছেদে প্রতি এক লাইন আউটপুট পাস করে।
উপরেরটি জিএনইউ দিয়ে পরীক্ষা করা হয়েছিল awk
। অন্যান্যগুলির awk
জন্য, অনুচ্ছেদ (রেকর্ড) সীমানা হিসাবে ফাঁকা রেখাগুলি সংজ্ঞায়নের পদ্ধতি পৃথক হতে পারে।
vimdiff
আপনার জন্য এখানে প্রশ্ন করতে পারবেন আপনার