দ্বিতীয় ক্ষেত্র সীমিত শব্দ ধারণকারী মুদ্রণ লাইন


0

আমি ফর্ম একটি প্রতীক টেবিল আছে

M07UP49A0870I422.wav    <s> haraa keelaa <bn> </s>
M07UP49A0870I423.wav    <s> <horn> jau <babble>  </s>
M07UP49A0861C86105.wav  <s> waa khaada aadi kaa upayoga laabhadaayaka paaya gayaa hai  </s>
M07UP49A0861C86106.wav  <s> aadi kisaan apnee stara para bhii taiyaara kara sakatee hai </s>
M07UP49A0861C86107.wav  <s> kii gobara kaa upayoga kandxee banaakara iindhana kee ruupa mee kiyaa jaata hai <bang> </s>
M07UP49A0861C86108.wav  <s> geehuun kii phasala kii katxaayii kee baada <horn> kheeto ko aaga lagaakara saapha kiyaa jaata hai <babble> </s>
M07UP49A0861C86109.wav  <s> badxqii maatraa mee jiiwaanqu jalakara nashtxa ho jaataa hai <babble> </s>

স্পষ্ট হিসাবে, এই ফাইল দুটি কলাম রয়েছে। প্রথম কলামটি অডিও ফাইলের নাম (.wav এক্সটেনশন সহ) এবং দ্বিতীয় কলামটি অডিও ফাইলের প্রতিলিপি

দ্বিতীয় কলামটি 4 টির বেশি শব্দ ধারণ করে না বলে মনে করা হয় (ট্যাগ ব্যতীত; ট্যাগগুলি ট্যাগ করা হয় & lt; & gt;)।

উদাহরণস্বরূপ, দ্বিতীয় লাইন বিবেচনা। এই লাইনটি শুধুমাত্র একটি শব্দ আছে যেমন Jau (মনে রাখবেন যে

<s> 
</s> 
<babble> 
<horn> 

শব্দ গণনা অন্তর্ভুক্ত করা হয় না কারণ তারা ট্যাগ)।

মূলত, যেকোনো লাইনের মধ্যে, দ্বিতীয় কলামের একটি শব্দটি এমন একটি স্ট্রিং যা ঘিরে নেই & lt; & gt;।

এখন আমার কাজটি শুধুমাত্র সেই লাইন খুঁজে বের করে যা দ্বিতীয় কলামে 4 টির বেশি শব্দ নেই।

আপনার সুবিধার জন্য, এখানে প্রত্যাশিত আউটপুট

M07UP49A0870I422.wav    <s> haraa keelaa <bn> </s>
M07UP49A0870I423.wav    <s> <horn> jau <babble>  </s>

আমি নিম্নলিখিত আউটপুট পেয়েছিলাম কারণ দ্বিতীয় কলামটিতে শুধুমাত্র দুটি শব্দ হর এবং কিলা রয়েছে এবং দ্বিতীয় লাইনটি দ্বিতীয় কলামে শুধুমাত্র এক শব্দ যেমন জাউ।

এই লাইন ছাড়া অন্য লাইনগুলি তাদের দ্বিতীয় কলামে 4 টির বেশি শব্দ ধারণ করে ..

উত্তর:


0

যদি আপনার কাছে চতুর ক্ষেত্রগুলি থাকে না (যেমন ট্যাগের ভিতরে লক্ষণগুলি থেকে বেশি পালিয়ে যায়), তখন এটি awk জন্য একটি সাধারণ কাজ:

$ awk '{ words=0;  for (i=2; i<=NF; ++i) { if ( $i !~ /^<[^>]+>$/) ++words}; if (words <= 4) print }'  input.txt
M07UP49A0870I422.wav    <s> haraa keelaa <bn> </s>
M07UP49A0870I423.wav    <s> <horn> jau <babble>  </s>

0
$ perl -n -e "print unless / \w+ \w+ \w+ \w+ \w+ /" Snowbell
M07UP49A0870I422.wav    <s> haraa keelaa <bn> </s>
M07UP49A0870I423.wav    <s> <horn> jau <babble>  </s>
$ 

বা, আরো flexibly (কিন্তু আরো obscurely)

$ perl -n -e 'print unless (scalar ( ()= $_ =~ / \w+ /g) > 4)' Snowbell
M07UP49A0870I422.wav    <s> haraa keelaa <bn> </s>
M07UP49A0870I423.wav    <s> <horn> jau <babble>  </s>
$

পরেরটি যদি সহজ না হয় তবে "নয় & gt; 4" কখনও "না & gt; 22" এর মতো কিছু হয়ে যায়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.