আমি সম্ভবত এটি বেশ বিতর্কিত প্রশ্নটি জিজ্ঞাসা করতে যাচ্ছি: "সর্বাধিক জনপ্রিয় এনকোডিংগুলি ইউটিএফ -16 কে ক্ষতিকারক হিসাবে বিবেচনা করা উচিত?"
কেন আমি এই প্রশ্ন জিজ্ঞাসা?
ইউটিএফ -16 আসলে একটি পরিবর্তনশীল দৈর্ঘ্যের এনকোডিং হয় তা সম্পর্কে কতজন প্রোগ্রামার সচেতন? এর মাধ্যমে আমার অর্থ এই যে এখানে কোড পয়েন্ট রয়েছে যা সারোগেট জোড় হিসাবে উপস্থাপিত হয়, একাধিক উপাদান নেয়।
আমি জানি; প্রচুর অ্যাপ্লিকেশন, ফ্রেমওয়ার্ক এবং এপিআইগুলি ইউটিএফ -16 ব্যবহার করে, যেমন জাভার স্ট্রিং, সি # এর স্ট্রিং, উইন 32 এপিআই, কিউটি জিউআই লাইব্রেরি, আইসিইউ ইউনিকোড লাইব্রেরি ইত্যাদি। তবে, এই সবের সাথে প্রসেসিংয়ে প্রচুর বেসিক বাগ রয়েছে বিএমপি-এর বাইরে থাকা অক্ষরের (যে অক্ষরগুলি দুটি ইউটিএফ -16 উপাদান ব্যবহার করে এনকোড করা উচিত)।
উদাহরণস্বরূপ, এই অক্ষরগুলির মধ্যে একটি সম্পাদনা করার চেষ্টা করুন:
- 𝄞 ( U + 1D11E ) মিউজিকাল সিম্বল জি CLEF
- U ( U + 1D565 ) গাণিতিক ডাবল- স্ট্রাক ছোট ছোট টি
- U ( U + 1D7F6 ) ম্যাথমেটিকাল মোনস্পেস ডিজিট জিরো
- 𠂊 ( U + 2008A ) হ্যান চরিত্র
আপনি কোন ফন্টগুলি ইনস্টল করেছেন তার উপর নির্ভর করে আপনি কিছু মিস করতে পারেন। এই অক্ষরগুলি সমস্ত বিএমপির বাইরে (বেসিক বহুভাষিক প্লেন)। আপনি যদি এই অক্ষরগুলি দেখতে না পান তবে আপনি তাদের ইউনিকোড অক্ষর রেফারেন্সে দেখার চেষ্টা করতে পারেন ।
উদাহরণস্বরূপ, উইন্ডোগুলিতে এই অক্ষরগুলির অন্তর্ভুক্ত ফাইলের নাম তৈরি করার চেষ্টা করুন; ইউটিএফ -16 ব্যবহার করে এমন বিভিন্ন অ্যাপ্লিকেশনগুলিতে তারা কীভাবে আচরণ করে তা দেখতে "ব্যাকস্পেস" দিয়ে এই অক্ষরগুলি মুছার চেষ্টা করুন। আমি কিছু পরীক্ষা করেছি এবং ফলাফলগুলি বেশ খারাপ:
- অপেরা তাদের সম্পাদনা করতে সমস্যা (ব্যাকস্পেসে প্রয়োজনীয় 2 টি প্রেস মুছুন)
- নোটপ্যাড তাদের সাথে সঠিকভাবে ডিল করতে পারে না (ব্যাকস্পেসে প্রয়োজনীয় 2 টি প্রেস মুছুন)
- উইন্ডো সংলাপগুলিতে ভাঙা ফাইলগুলির নাম সম্পাদনা (ব্যাকস্পেসে প্রয়োজনীয় 2 টি প্রেস মুছুন)
- সমস্ত কিউটি 3 অ্যাপ্লিকেশনগুলি সেগুলি মোকাবেলা করতে পারে না - একটি চিহ্নের পরিবর্তে দুটি খালি স্কোয়ার দেখান ।
- বিএমপির
u'X'!=unicode('X','utf-16')
বাইরের অক্ষরে এক্স থাকলে কিছু প্ল্যাটফর্মে সরাসরি ব্যবহৃত হলে পাইথন এ জাতীয় অক্ষরগুলিকে ভুলভাবে এনকোড করে । - পাইথন 2.5 ইউনিকোডেটা এই অক্ষরগুলির বৈশিষ্ট্য পেতে ব্যর্থ হয় যখন পাইথনটি ইউটিএফ -16 ইউনিকোড স্ট্রিং দিয়ে সংকলিত হয়।
- স্ট্যাকওভারফ্লো এই ইউনিকোড অক্ষর হিসাবে সরাসরি সম্পাদনা করা থাকলে এই অক্ষরগুলি পাঠ্য থেকে সরিয়ে ফেলবে বলে মনে হয় (এই অক্ষরগুলি এইচটিএমএল ইউনিকোড পলায়ন ব্যবহার করে দেখানো হয়)।
- উইনফোর্ডস টেক্সটবক্স ম্যাক্সলেংথের সাথে সীমাবদ্ধ থাকলে অবৈধ স্ট্রিং তৈরি করতে পারে ।
দেখে মনে হচ্ছে যে ইউটিএফ -16 ব্যবহার করে এমন অ্যাপ্লিকেশনগুলিতে এই জাতীয় বাগগুলি খুঁজে পাওয়া চূড়ান্ত সহজ।
সুতরাং ... আপনি কি মনে করেন যে ইউটিএফ -16 কে ক্ষতিকারক হিসাবে বিবেচনা করা উচিত?