ইউনিকোডে কিছু চরিত্রের সংমিশ্রণের একাধিক উপস্থাপনা থাকে।
উদাহরণ হিসেবে বলা যায়, চরিত্র একটি হিসাবে প্রতিনিধিত্ব করা যেতে পারে
- "ä", এটি কোডপয়েন্ট ইউ + 00E4 (
c3 a4
ইউটিএফ -8 এনকোডিংয়ে দুটি বাইট ), বা হিসাবে - "ä", এটি হ'ল দুটি কোডপয়েন্টগুলি ইউ + 0061 ইউ + 0308 (
61 cc 88
ইউটিএফ -8 এ তিন বাইট )।
ইউনিকোড স্ট্যান্ডার্ড অনুযায়ী, দুটি উপস্থাপনা সমান হলেও বিভিন্ন "নরমালাইজেশন ফর্ম" এ, ইউএএক্স # 15 দেখুন: ইউনিকোড নরমালাইজেশন ফর্মগুলি ।
ইউনিক্স টুলবক্সে সব ধরণের পাঠ্য রূপান্তরের সরঞ্জাম রয়েছে, সেড , ট্র , আইকনভি , পার্ল মাথায় আসে to কমান্ড-লাইনে কীভাবে আমি দ্রুত এবং সহজ এনএফ রূপান্তর করতে পারি?
perl -MUnicode::Normalization -e 'print NFC(
... Er কি এখানে এখন আসে ...