আমার সমস্ত অ- ASCII (\ x00- \ x7F) অক্ষর স্থানের সাথে প্রতিস্থাপন করতে হবে। আমি অবাক হয়েছি যে পাইথনে এটি মৃত-সহজ নয়, যদি না আমি কিছু মিস করি। নিম্নলিখিত ফাংশনটি কেবল সমস্ত ASCII অক্ষর মুছে ফেলে:
def remove_non_ascii_1(text):
return ''.join(i for i in text if ord(i)<128)
এবং এটি একটি অক্ষর কোড পয়েন্টের বাইটের পরিমাণ অনুসারে ফাঁকা পরিমাণের সাথে (যেমন –
অক্ষরটি 3 স্পেস দিয়ে প্রতিস্থাপন করা হয়েছে) অ-এসসিআইআই অক্ষরকে প্রতিস্থাপন করে:
def remove_non_ascii_2(text):
return re.sub(r'[^\x00-\x7F]',' ', text)
আমি কীভাবে সমস্ত অ ASCII অক্ষরকে একটি একক স্থানের সাথে প্রতিস্থাপন করতে পারি?
এর অগণ্য এর অনুরূপ তাই প্রশ্ন , কোনটি ঠিকানা চরিত্র প্রতিস্থাপন হিসাবে বিরোধিতা করার stripping , এবং অতিরিক্ত সমস্ত অ-ASCII নয় এমন অক্ষর একটি নির্দিষ্ট অক্ষর মোকাবেলার।
–
। এটা এই লোক ।