আপনি এই চেকটি আরও ভাল করতে পারেন:
>>> import unicodedata
>>> unicodedata.category("'").startswith("P")
True
>>> unicodedata.category("’").startswith("P")
True
ইউনিকোড বিভাগে পি * বিশেষত বিরামচিহ্নের জন্য :
সংযোজক (পিসি), ড্যাশ (পিডি), প্রাথমিক উদ্ধৃতি (পাই), চূড়ান্ত উদ্ধৃতি (পিএফ), খোলা (পিএস), বন্ধ (পিই), অন্যান্য (পো)
পরিপূর্ণ সংগ্রহ প্রস্তুত করতে, যা আপনি পরবর্তী সময়ে দ্রুত সদস্যতা যাচাইয়ের জন্য ব্যবহার করতে পারেন, একটি সেট বোধগম্যতা ব্যবহার করুন:
>>> import sys
>>> from unicodedata import category
>>> codepoints = range(sys.maxunicode + 1)
>>> punctuation = {c for i in codepoints if category(c := chr(i)).startswith("P")}
>>> "'" in punctuation
True
>>> "’" in punctuation
True
পুরানো পাইথন সংস্করণগুলির সমতুল্য এখানে অ্যাসাইনমেন্ট এক্সপ্রেশনটির পাইথন 3.8++ প্রয়োজন:
chrs = (chr(i) for i in range(sys.maxunicode + 1))
punctuation = set(c for c in chrs if category(c).startswith("P"))
সাবধান থাকুন যে অন্য কয়েকটি চরিত্র string.punctuationআসলে ইউনিকোড বিভাগের প্রতীকটিতে রয়েছে । আপনি চাইলে এগুলিতে যুক্ত করাও সহজ।