এই কারণগুলি যা আমি মনে করি ইউটিএফ -8 বা অন্য ইউনিকোড উপস্থাপনাটি স্ক্রিপ্টিং ভাষার জন্য মূল রূপটি এনকোডিং রুবি নয়, যা মূলত জাপানে উন্নত হয়েছিল:
- কারণ 1: হান একীকরণ । চরিত্রটি সেট করে ("বর্ণমালা" এখানে সঠিক হবে কিনা তা নিশ্চিত নয়) ব্যবহৃত চীন, কোরিয়া এবং জাপান সব সম্পর্কিত, সাধারণ ইতিহাস থেকে বিবর্তিত হয়েছে, বিবরণ সম্পর্কে নিশ্চিত নয়। ইউনিকোড কনসোর্টিয়াম 3তিহাসিক একই চরিত্রের সমস্ত রূপগুলি (চাইনিজ, জাপানি এবং কোরিয়ান) এনকোড করতে কেবলমাত্র একটি একক ইউনিকোড কোড পয়েন্ট নষ্ট করার সিদ্ধান্ত নিয়েছে, এমনকি তার চেহারাটি 3 টি ভাষায় ভিন্ন হলেও। তাদের যুক্তি হ'ল, পাঠ্যটি প্রদর্শন করতে ব্যবহৃত ফন্টের মাধ্যমে উপস্থিতি নির্ধারণ করা উচিত।
স্পষ্টতই, এই যুক্তিটি জাপানি ব্যবহারকারীরা যেমনটি হাস্যকর বলে মনে করেছিলেন তেমনি এটি ইংরেজী পাঠকদের পক্ষে যুক্তিযুক্ত হতে হবে যে, যেহেতু লাতিন বর্ণমালা গ্রীক বর্ণমালা থেকে উদ্ভূত হয়েছে, গ্রীক বর্ণমালার জন্য একটিমাত্র কোড পয়েন্ট থাকা যথেষ্ট " α "এবং ল্যাটিন" এ ", এবং ব্যবহারের ফন্টের মাধ্যমে উপস্থিতিটি স্থির করা যাক। ("Β" = "বি", "γ" = "জি" ইত্যাদির জন্য একই)
(দ্রষ্টব্য যে আমি যদি গ্রীক অক্ষরগুলি স্ট্যাকেক্সচেঞ্জে এখানে অন্তর্ভুক্ত করতে পারতাম না)
- কারণ 2: অক্ষর অক্ষরের রূপান্তর।
ইউনিকোড থেকে অক্ষর রূপান্তর করতে লেগ্যাসি জাপানীজ এনকোডিংগুলি এবং পিছনে সারণীগুলির প্রয়োজন, অর্থাত ইউনিকোড কোড-পয়েন্ট মান থেকে উত্তরাধিকার কোড পয়েন্ট মান এবং এর বিপরীতে কোনও সাধারণ গণনা নেই। রূপান্তরকালে কিছু তথ্যের ক্ষতি হয় কারণ একটি এনকোডিংয়ের সমস্ত কোড পয়েন্টের অন্য এনকোডিংয়ে একটি অনন্য উপস্থাপনা থাকে না।
আরও কারণ দেওয়া যেতে পারে যে আমি আর মনে নেই।