আমার কাছে একটি টেক্সট ডকুমেন্ট রয়েছে যাতে পাঠ্যের ভার থাকে যা প্রতিটি অক্ষরের পরে অতিরিক্ত স্থান যুক্ত করে দেয়!
উদাহরণ:
T h e b o o k a l s o h a s a n a n a l y t i c a l p u r p o s e w h i c h i s m o r e i m p o r t a n t…
দৃশ্যরূপে:
T␣h␣e␣␣b␣o␣o␣k␣␣a␣l␣s␣o␣␣h␣a␣s␣␣a␣n␣␣a␣n␣a␣l␣y␣t␣i ␣c␣a␣l␣␣p␣u␣r␣p␣o␣s␣e␣␣w␣h␣i␣c␣h␣␣i␣s␣␣m␣o␣r␣e␣␣i␣ m␣p␣o␣r␣t␣a␣n␣t ...
নোট করুন যে প্রতিটি বর্ণের পরে একটি অতিরিক্ত স্থান রয়েছে, সুতরাং পর পরের শব্দের মধ্যে দুটি স্থান রয়েছে।
এমন কোনও উপায় আছে যা আমি পেতে awk
বা sed
অতিরিক্ত স্থানগুলি মুছতে পারি? (দুর্ভাগ্যক্রমে এই পাঠ্য নথিটি বিশাল এবং ম্যানুয়ালি যেতে খুব দীর্ঘ সময় লাগবে))
আমি প্রশংসা করি যে এটি সম্ভবত একটি সহজ বাশ স্ক্রিপ্টের সাথে সমাধান করার জন্য আরও জটিল সমস্যা কারণ এখানে কিছু ধরণের পাঠ্য স্বীকৃতিও প্রয়োজন।
আমি কীভাবে এই সমস্যার কাছে যেতে পারি?
echo 't h i s i s a n e x a m p l e' | sed 's/ //g'
echo 'T h i s ; i s .a n 9 8 e x a m p l e' | perl -pe 's/[a-z]\K (?=[a-z])//ig'