আমার কাছে কয়েক লক্ষ লাইনের এক্সএমএল ফাইল রয়েছে যা আমার প্রয়োজন নেই এমন ডেটা পূর্ণ। আমি হাজার হাজার অপ্রাসঙ্গিক লাইনগুলি মুছে ফেলার একটি উপায় খুঁজছি এবং সচেতন আমি এটি একটি রেইজেক্সের সাথে অনুসন্ধান-প্রতিস্থাপনের মাধ্যমে করা যেতে পারে। তবে আমার রেজেক্স দক্ষতা মূলত অস্তিত্বহীন।
ফাইলটি এক্সএমএল অনুগত তাই প্রতিটি লাইন ট্যাগ দিয়ে শুরু হয় এবং শেষ হয়। দস্তাবেজ জুড়ে কয়েকবার পুনরাবৃত্তি হওয়া একটি উদাহরণ ব্লক:
<g:payment_accepted>Visa</g:payment_accepted>
<g:payment_accepted>Cash</g:payment_accepted>
<g:payment_accepted>MasterCard</g:payment_accepted>
<g:payment_accepted>Check</g:payment_accepted>
<g:payment_accepted>WireTransfer</g:payment_accepted>
সুতরাং এই দৃষ্টান্তে আমি উদাহরণগুলি সন্ধানের জন্য একটি রেজেেক্স চাই:
<g:payment_accepted>WILDCARD_ANYTHING_IN_BETWEEN</g:payment_accepted>
আমি যখন বুঝতে পারি একটি ওয়ার্কিং রেইগেক্স হয়ে যায়, তখন আমি নথিতে অন্য পুনরাবৃত্ত ট্যাগ ব্লকের জন্য এটি টুইট করতে পারি। তবে কোথায় শুরু করবেন তা ধারণা নেই।