একাধিক লাইন বিস্তৃত পাঠ্যের বিপরীতে মিলে যাওয়ার সময় পাইথন রেজেক্সটি কাজ করতে আমার কিছুটা সমস্যা হচ্ছে। উদাহরণ পাঠ্যটি ('\ n' একটি নতুন লাইন)
some Varying TEXT\n
\n
DSJFKDAFJKDAFJDSAKFJADSFLKDLAFKDSAF\n
[more of the above, ending with a newline]\n
[yep, there is a variable number of lines here]\n
\n
(repeat the above a few hundred times).
আমি দুটি জিনিস ক্যাপচার করতে চাই: 'কিছু_ভরিয়িং_একটি' অংশ, এবং বড় হাতের লেখার সমস্ত লাইন যা তার নীচে দুটি লাইনে আসে একটি ক্যাপচারে (আমি পরে নতুন লাইনের চরিত্রগুলি বের করতে পারি)। আমি কয়েকটি পদ্ধতির সাথে চেষ্টা করেছি:
re.compile(r"^>(\w+)$$([.$]+)^$", re.MULTILINE) # try to capture both parts
re.compile(r"(^[^>][\w\s]+)$", re.MULTILINE|re.DOTALL) # just textlines
এবং এর সাথে অনেক ভাগ্য নেই ভাগ্যের সাথে। শেষটি একের পর এক পাঠ্যের লাইনের সাথে মিলছে বলে মনে হচ্ছে যা আমি সত্যিই চাই না। আমি প্রথম অংশটি ধরতে পারি, কোনও সমস্যা নেই, তবে আমি বড় আকারের পাঠ্যের 4-5 লাইন ধরতে পারি না। খালি লাইন না আসা পর্যন্ত আমি ম্যাচ.group (1) কে কিছু_ভরিয়িং_টেক্সট এবং গোষ্ঠী (2) লাইন 1 + লাইন 2 + লাইন 3 + ইত্যাদি হতে চাই।
যদি কারও কৌতূহল হয়, তবে এটি অ্যামিনোসাইডগুলির ক্রম যা প্রোটিন তৈরি করে।