আমি জানি এই প্রশ্নটি পুরানো এবং ইতিমধ্যে একটি স্বীকৃত উত্তর রয়েছে, তবে আমি কয়েকটি উদাহরণ দিতে চাই (আশা করি এটি কারওর পক্ষে কার্যকর হবে)।
আমি যতদূর জানি পুরানো এএসসিআইআই চরিত্রগুলি প্রতিটি চরিত্রের জন্য একটি বাইট নিয়েছিল।
ঠিক। আসলে, যেহেতু এএসসিআইআই 7-বিট এনকোডিং, তাই এটি 128 কোডগুলি (যার মধ্যে 95 টি মুদ্রণযোগ্য) সমর্থন করে, সুতরাং এটি কেবলমাত্র অর্ধ বাইট ব্যবহার করে (যদি এটি কোনও ধারণা দেয়)।
একটি ইউনিকোড চরিত্রের কতটি বাইট প্রয়োজন?
ইউনিকোড কেবল কোডপয়েন্টগুলিতে অক্ষরগুলি মানচিত্র করে। এটি কীভাবে এনকোড করা যায় তা নির্ধারণ করে না। একটি পাঠ্য ফাইলে ইউনিকোড অক্ষর থাকে না, তবে বাইটস / অকটেটগুলি ইউনিকোড অক্ষরকে উপস্থাপন করতে পারে।
আমি ধরে নিয়েছি যে একটি ইউনিকোড অক্ষর যে কোনও ভাষা থেকে প্রতিটি সম্ভাব্য চরিত্র ধারণ করতে পারে - আমি কি সঠিক?
না, তবে প্রায়। তাই মূলত হ্যাঁ কিন্তু এখনও নেই।
সুতরাং চরিত্র অনুযায়ী এটি কত বাইট প্রয়োজন?
আপনার দ্বিতীয় প্রশ্ন হিসাবে একই।
এবং ইউটিএফ -7, ইউটিএফ -6, ইউটিএফ -16 ইত্যাদি কী বোঝায়? তারা কি কোনও ধরণের ইউনিকোড সংস্করণ রয়েছে?
না, সেগুলি এনকোডিং। এগুলি সংজ্ঞায়িত করে যে কীভাবে বাইটস / অক্টেটগুলি ইউনিকোড অক্ষর উপস্থাপন করতে পারে।
উদাহরণ দুটি। যদি তাদের মধ্যে কিছু আপনার ব্রাউজারে প্রদর্শিত না হতে পারে (সম্ভবত ফন্টগুলি তাদের সমর্থন করে না), একটি চিত্র দেখতে http://codepoints.net/U+1F6AA
( 1F6AA
হেক্সে কোডপয়েন্টের সাথে প্রতিস্থাপন করুন) যান ।
- U + 0061 ল্যাটিন ছোট ছোট একটি:
a
- Nº: 97
- ইউটিএফ -8: 61
- ইউটিএফ -16: 00 61
- U + 00A9 কপিরাইট সাইন:
©
- Nº: 169
- ইউটিএফ -8: সি 2 এ 9
- ইউটিএফ -16: 00 এ 9
- U + 00AE নিবন্ধিত সাইন:
®
- Nº: 174
- ইউটিএফ -8: সি 2 এই
- ইউটিএফ -16: 00 এই
- ইউ + 1337 এথিয়পিক সিলিবেল PHWA:
ጷ
- Nº: 4919
- ইউটিএফ -8: ই 1 8 সি বি 7
- ইউটিএফ -16: 13 37
- U + 2014 ইম ড্যাশ:
—
- Nº: 8212
- ইউটিএফ -8: ই 2 80 94
- ইউটিএফ -16: 20 14
- U + 2030 পারের মিল সাইন:
‰
- Nº: 8240
- ইউটিএফ -8: ই 2 80 বি 0
- ইউটিএফ -16: 20 30
- U + 20AC ইউরো স্বাক্ষর:
€
- Nº: 8364
- ইউটিএফ -8: ই 2 82 এসি
- ইউটিএফ -16: 20 এসি
- U + 2122 ট্রেড মার্ক সাইন:
™
- Nº: 8482
- ইউটিএফ -8: E2 84 এ 2
- UTF-16: 21 22
- ইউ + 2603 স্নোম্যান:
☃
- Nº: 9731
- ইউটিএফ -8: E2 98 83
- ইউটিএফ -16: 26 03
- U + 260E কালো টেলিফোন:
☎
- Nº: 9742
- ইউটিএফ -8: E2 98 8E
- ইউটিএফ -16: 26 0 ই
- বৃষ্টিপাতের সাথে ইউ + 2614 আমব্রেলা:
☔
- Nº: 9748
- ইউটিএফ -8: ই 2 98 94
- ইউটিএফ -16: 26 14
- U + 263A সাদা স্মাইলিং ফ্যাক্স:
☺
- Nº: 9786
- ইউটিএফ -8: E2 98 বিএ
- ইউটিএফ -16: 26 3 এ
- U + 2691 কালো পতাকা:
⚑
- Nº: 9873
- ইউটিএফ -8: ই 2 9 এ 91
- ইউটিএফ -16: 26 91
- ইউ + 269 বি এটম সিমবোল:
⚛
- Nº: 9883
- ইউটিএফ -8: ই 2 9 এ 9 বি
- ইউটিএফ -16: 26 9 বি
- U + 2708 আকাশপথ:
✈
- Nº: 9992
- ইউটিএফ -8: ই 2 9 সি 88
- ইউটিএফ -16: 27 08
- ইউ + 271E সাদা শ্বেত ল্যাটিন ক্রস:
✞
- Nº: 10014
- ইউটিএফ -8: E2 9C 9E
- UTF-16: 27 1E
- U + 3020 পোস্টাল মার্ক ফ্যাক্স:
〠
- Nº: 12320
- ইউটিএফ -8: E3 80 এ 0
- ইউটিএফ -16: 30 20
- U + 8089 সিজেকে ইউনিফাইড আইডিয়াগ্রাফ -8089
肉
- Nº: 32905
- ইউটিএফ -8: E8 82 89
- ইউটিএফ -16: 80 89
- ইউ + 1F4A9 পাই এর পাইল:
💩
- Nº: 128169
- UTF-8: F0 9F 92 A9
- ইউটিএফ -16: ডি 8 ডি ডিসি এ 9
- U + 1F680 রকেট:
🚀
- Nº: 128640
- ইউটিএফ -8: এফ 0 9 এফ 9 এ 80
- ইউটিএফ -16: ডি 8 ডি ডিই 80
ঠিক আছে আমি বহন করছি ...
মজার ঘটনা: