নিয়মিত প্রকাশ \ p {L} এবং \ p {N


106

আমি নিয়মিত প্রকাশে নতুন এবং নিম্নলিখিত নিয়মিত প্রকাশটি দেওয়া হয়েছে:

(\p{L}|\p{N}|_|-|\.)*

আমি জানি * এর অর্থ এবং | এর অর্থ "বা" এবং সেটি es পালিয়ে যায়।

তবে আমি কী জানি না \p{L} এবং এর \p{N}অর্থ । আমি এর জন্য গুগল অনুসন্ধান করেছি, ফলাফল ছাড়াই ...

কেউ আমাকে সাহায্য করতে পারেন?


আমি এটিও গুগল করেছি, তবে আমি এই ফলাফল পেয়েছি ।
এমসি সম্রাট

উত্তর:


160

\p{L}"চিঠি" বিভাগে একক কোড পয়েন্টের সাথে মেলে।
\p{N}যে কোনও স্ক্রিপ্টে কোনও ধরণের সংখ্যাসূচক চরিত্রের সাথে মেলে।

সূত্র: নিয়মিত- এক্সপ্রেসন.ইনফো

আপনি যদি নিয়মিত প্রকাশের সাথে প্রচুর পরিমাণে কাজ করতে যাচ্ছেন তবে আমি সেই সাইটটিকে বুকমার্ক করার পরামর্শ দেব, এটি খুব দরকারী।


দ্রুত উত্তর জন্য thx :)। তবে কি রেগেক্সটি 10 ​​টি মিলবে? আমি একটি অনলাইন রেজেক্স ম্যাচার চেষ্টা করেছি: regexpal.com
ডায়ামারডক

@ ব্যবহারকারী 1093774: আমি মনে করি না রেজেক্সপাল সমর্থন করে \p{}তবে হ্যাঁ, এটি মিলবে match
সার্বারবাস

1
এই সিনট্যাক্সটি আধুনিক ইউনিকোড রেজেক্স বাস্তবায়নের জন্য সুনির্দিষ্ট, যা সমস্ত দোভাষী তাদের স্বীকৃতি দেয় না। আপনি নিরাপদে \ a-zA-Z} (ascii স্বরলিপি) বা {\ w} (পার্ল / ভিম স্বরলিপি) দ্বারা \ p {L replace প্রতিস্থাপন করতে পারেন; এবং \ p {N} দ্বারা {0-9} (ascii) বা {\ d} (পার্ল / ভিএম)। আপনি যদি এই সমস্তটির সাথে মিলে যেতে চান তবে কেবল করুন: {a-zA-Z0-9} + বা {\ w \ d} +
রাফায়েল বেকেল

16
রাফায়েল, আমি 'আত সম্মত হন যে আপনি নিরাপদে প্রতিস্থাপন করতে পারেন \p{L}দ্বারা {a-zA-Z}{a-zA-Z}উদাহরণস্বরূপ, কোনও বর্ণিত চরিত্রের সাথে মেলে না, যেমন é, যা পুরো ফরাসিতে ব্যবহৃত হয়। সুতরাং এগুলি কেবলমাত্র নিরাপদে প্রতিস্থাপনযোগ্য যদি আপনি নিশ্চিত হন যে আপনি কেবল ইংরেজী প্রক্রিয়াকরণ করবেন এবং অন্য কিছুই নয়।
রল্ফ

এটি কোড পয়েন্ট বা কোড ইউনিটের সাথে মেলে? stackoverflow.com/a/27331885/4928642
Qwertiy

30

এগুলি ইউনিকোড সম্পত্তি শর্টকাটগুলি ( \p{L}ইউনিকোড অক্ষরের \p{N}জন্য, ইউনিকোড অঙ্কগুলির জন্য)। তারা। নেট, পার্ল, জাভা, পিসিআরই, এক্সএমএল, এক্সপ্যাথ, জে জি সোফট, রুবি (১.৯ এবং উচ্চতর) এবং পিএইচপি ( ৫.১.০ থেকে ) সমর্থিত

যে কোনও হারে, এটি একটি খুব অদ্ভুত রেজেক্স। যখন কোনও অক্ষর শ্রেণি পর্যাপ্ত হয় তখন আপনার বিকল্প ব্যবহার করা উচিত নয়:

[\p{L}\p{N}_.-]*

এর এক্সএক্সএল এক্সএক্সএল - আমি নিজেই
রেজেক্সকে সংকুচিত

ক্যাপচারিং প্রথম বন্ধনী ব্যবহার করা হয়েছে তা বাদে আরইএস আসলে একই জিনিসটি সংকলন করবে (ভাল, যে কোনও অপ্টিমাইজিং আরই ইঞ্জিন যা \p{…}প্রথম স্থানে এস্কেপ সিকোয়েন্স স্টাইল সমর্থন করে )।
ডোনাল ফেলো

এটি দেখতে XRegExp ইউনিকোড প্লাগইনের মতো। যা যদি তাই হয় তবে কোনও ভাষায় কোনও আলফা-সংখ্যাসূচক হবে
টিম

ধন্যবাদ, সমর্থনকারী ভাষার তালিকা কার্যকর ছিল, অজানা ছিল যে সেখানে সীমাবদ্ধতা রয়েছে (বেশিরভাগ রেজেক্স'ই জিনিসগুলি "সার্বজনীন")।
হোল্ডঅফহাঙ্গার

@ হোল্ডঅফ হ্যাঙ্গার: দুর্ভাগ্যক্রমে, এটি থেকে দূরে। এজন্যই রেগেক্সবাডির মতো সরঞ্জামের বাজার রয়েছে। একবার দেখুননিয়মিত- এক্সপ্রেশন.নোফো / রেফবাসিক এইচটিটিএমএল , আপনি রেজেক্স স্বাদের মধ্যে সূক্ষ্ম এবং না-সূক্ষ্ম পার্থক্য দেখে অবাক হবেন ...
টিম পিটজেকার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.