উইকিপিডিয়া নিবন্ধ অনুসারে , ইউটিএফ -8 এর এই ফর্ম্যাটটি রয়েছে:
প্রথম কোড শেষ কোড বাইট বাইট 1 বাইট 2 বাইট 3 বাইট 4 পয়েন্ট পয়েন্ট ব্যবহৃত ইউ +0000 ইউ + 007F 1 0XXXXXx ইউ + 0080 ইউ + 07 এফএফ 2 110 এমএক্সএক্সএক্সএক্স 10 এক্সএক্সএক্সএক্সএক্সএক্স ইউ + 0800 ইউ + এফএফএফএফ 3 1110XXX 10XXXX 10xxxxxx xx ইউ + 10000 ইউ + 1 এফএফএফএফএফ 4 11110xxx 10XXXX 10XXXX 10xxxxxx এক্স মানে এই বিটটি কোড পয়েন্ট নির্বাচন করতে ব্যবহৃত হয়।
এটি প্রতিটি ধারাবাহিকতা বাইটে দুটি বিট এবং প্রথম বাইটে এক বিট অপচয় করে। ইউটিএফ -8 নীচের মতো এনকোড করা হয় না কেন?
প্রথম কোড শেষ কোড বাইট বাইট 1 বাইট 2 বাইট 3 পয়েন্ট পয়েন্ট ব্যবহৃত ইউ +0000 ইউ + 007F 1 0XXXXXx ইউ + 0080 ইউ + 3 এফএফএফ 2 10 এমএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্স ইউ + 0800 ইউ + 1 এফএফএফএফএফ 3 110 এমএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্স
বেসিক বহুভাষিক প্লেনের বাইরে কোড পয়েন্ট বা কোড পয়েন্টের সীমা [U + 800, U + 3FFF] এর বাইরে থাকলে এটি একটি বাইট সংরক্ষণ করতে পারে।
ইউটিএফ -8 কেন আরও কার্যকর উপায়ে এনকোড করা হয়নি?