এম্বেডেড সিস্টেম প্রকল্পের জন্য এসই এশীয় চরসেটগুলি ধারণ করার জন্য নিখুঁত, ন্যূনতম প্রয়োজনীয়তা কী?


14

আমি এমন একটি সংস্থার জন্য কাজ করি যা আমরা প্রস্তুত যে পণ্যগুলিতে এমবেডেড কম্পিউটার সিস্টেমগুলিকে একীভূত করতে শুরু করেছি। আমাদের কাছে পণ্যগুলির বিস্তৃত পরিসীমা রয়েছে এবং সেগুলি বিশ্বজুড়ে বিতরণ করা হয়। অতিরিক্তভাবে, আমরা কয়েকটি ইন্টিগ্রেটেড বোর্ড ডিজাইন করেছি যা সিস্টেমে ফ্লাশ করা ফার্মওয়্যারের উপর নির্ভর করে একাধিক উদ্দেশ্যে পরিবেশন করতে পারে। এইভাবে আমাদের আমাদের বিভিন্ন পণ্যগুলির জন্য আমাদের কম্পিউটারের হার্ডওয়্যারটিকে নতুন করে ডিজাইন করতে হবে না - আমাদের কেবলমাত্র নির্দিষ্ট পণ্যের প্রয়োজন মেটাতে ফার্মওয়্যার স্তরটি আবার লিখতে হবে।

এই হার্ডওয়্যার সীমাবদ্ধতার কারণে, আমাদের হার্ডওয়্যার পরিবর্তন করা কংগ্রেসের কাজ করে তবে নতুন সফ্টওয়্যার লেখা অনেক সহজ।

আমাদের পণ্যগুলির একটির একটি নতুন প্রয়োজনীয়তা রয়েছে যা আমাদের পূর্বে প্রয়োগ করতে হয়নি, যা ব্যবহারকারী-ইনপুটযুক্ত পাঠ্যের প্রয়োজন।

বর্তমানে, আমরা সংস্থানগুলিতে আন্তর্জাতিক পাঠ্য সংরক্ষণ করতে সক্ষম হয়েছি এবং শুধুমাত্র প্রয়োজনীয় ফন্টের অক্ষরগুলি বিট-ম্যাপ করা চিত্রগুলিতে সংকলিত। এর অর্থ হ'ল আমরা চীনা ও জাপানি পাঠ্যের মতো উচ্চ-মতাদর্শী ভাষাগুলিকে ন্যূনতম পরিমাণে সঞ্চয় করতে সক্ষম হয়েছি কারণ আমরা কেবলমাত্র সম্পূর্ণ ভাষার সেটটির খুব অল্প শতাংশ ব্যবহার করি।

যেহেতু এই নতুন পণ্যটির জন্য আমাদের ব্যবহারকারীদের পাঠ্য ইনপুট করতে হবে, তাই আমাদের একটি বিস্তৃত অক্ষর সেটটি প্রয়োগ করতে হবে। মূলত একজন পিসি বিকাশকারী হিসাবে, আমি এএসসিআইআই, ইউনিকোড, ইউটিএফ -8 ইত্যাদির সাথে বেশ পরিচিত, তবে, এই ভাষার কোনও একটির সম্পূর্ণ চরিত্রের সেট প্রয়োগ করা সম্ভব নয় কারণ আমাদের বোর্ডে সীমিত পরিমাণে এফআরএম রয়েছে have হরফ ডেটা সংরক্ষণ করতে।

আমার পরিচালনটি আশা করছেন যে এখানে একটি ন্যূনতম চরিত্র সেট রয়েছে যা উচ্চ মতাদর্শিক ভাষার জন্য ব্যবহার করা যেতে পারে। আমি বিশ্বাস করি জাপানীজদের (হীরাগানা?) ফোনেটিক বর্ণমালা আছে কি চীনা, কোরিয়ান, ভিয়েতনামী ইত্যাদি ভাষার জন্যও একই রকমের ফোনেটিক বর্ণমালা রয়েছে এবং যদি তাই হয়, তবে এই ভাষাগুলি কি এই জাতীয় সংকীর্ণ চরিত্রের সাথে যোগাযোগ করতে পারে? আমি নিশ্চিত যে এই প্রশ্নের উত্তর "একেবারে, না" তবে এটি জিজ্ঞাসা করার মতো একটি প্রশ্ন।

ম্যানেজমেন্ট একটি "নরম" প্রয়োজনীয়তা সেট করেছে যা আমাদের কাছে সাধারণ ব্যবহারে সমস্ত প্রধান ভাষা কভার করে প্রায় 8,000 অক্ষরের একটি সীমিত অক্ষর সেট থাকতে পারে। যদি এটি সম্ভব না হয় তবে আমাদের সীমিত হার্ডওয়্যার সংস্থানগুলির ভিত্তিতে আমাদের চাহিদা পূরণের জন্য বিকল্প পদ্ধতির কিছু ফর্ম সন্ধান করতে হবে।

আমি নিশ্চিত যে এই সমস্যাটি আগে সমাধান করা উচিত ছিল। একটি বিস্তৃত ফন্ট এবং চরিত্রের এনকোডিং সিস্টেমের প্রয়োজনের সময় কি এমন সীমাবদ্ধতার মধ্যে কাজ করার অভিজ্ঞতা আছে? যদি তা হয়, তবে আপনি কোন জ্ঞানের নাগেট অফার করতে পারেন?


কোরিয়া বা জাপান উভয়ই এসই এশিয়ার অংশ নয়। এগুলি ই এশিয়ার অন্তর্ভুক্ত course অবশ্যই যদি আপনি এস, এসই এবং ই এশিয়া বোঝাতে চান তবে দয়া করে এটি লিখুন।
লালালা

উত্তর:


25

এটি একটি চমৎকার প্রশ্ন।

আপনার উত্তর একবারে একটি ভাষা মোকাবেলা করতে;

ভিয়েতনামী

ভিয়েতনামি আর ভাববাদী চরিত্র ব্যবহার করে না, তবে এর ল্যাটিন সেটটি বেশ প্রশস্ত: এটি কত ডায়রিটিক্স ব্যবহার করে তা উদাহরণের দিকে দেখুন:

তিঙ্গ ভিয়াত, হায় ভাইগা এনজি, ল এনজিওএন সিজি এনজিও ভাইট (এনজিই কিন্) এবং ল্যাং এনজিএন এনজিএইচ চাঁচ থিক ভিটি নাম। Ày là tiếng mẹ ủ c ka Khảng 85% dưn cư Việt Nam, cớng với gần ba triệu người viảt hải ngoại, mà phần lớn là người Mỹ gốc việt। তিঙ ভিয়াত কান ল্যাংগান এনজিও থ্যা হ্যা সিএ সি সি সি সি সি সি সি সি সি সি সি সি সি টিসি ভিটি নাম।

কারণটি হ'ল প্রতিটি ভিয়েতনামের সিলেলেবলের ছয়টি সুরের চিহ্ন রয়েছে যা উচ্চারণ করতে প্রভাবিত করে - একটি অ-মানক ব্যঞ্জনা গ্লাইফ এবং ছয়টি অ-মানক স্বরযুক্ত হওয়া ছাড়াও।

ইউনিকোড স্বরগুলির উপরে স্বর চিহ্ন রচনা করে; যদি আপনার গ্লিফগুলি রচনার দক্ষতা থাকে তবে আপনার কেবল ভিয়েতনামীদের জন্য 13 টি অতিরিক্ত গ্লিফ প্রয়োজন , তবে তা না হলে আপনার 1 অতিরিক্ত ব্যঞ্জনবর্ণ + 12 স্বর * 6 টোন + 6 নতুন স্বর টোনলেস = 79 অতিরিক্ত গ্লাইফের প্রয়োজন হবে, ডাউনচেসে এবং বড় হাতের।

কোরিয়ান

কোরিয়ান খারাপ খবর। কোরিয়ান হঙ্গুল নামক একটি বর্ণমালা লেখা হলেও এটি প্রযুক্তিগতভাবে মাত্র 68 টি বর্ণের (য্যামো নামে পরিচিত) বর্ণমালা হওয়ার পরে প্রকৃতপক্ষে অক্ষর আকারের ব্লকগুলিতে লেখা ছিল যা জামো থেকে তৈরি।

কোরিয়ান পাঠ্যটি কীভাবে দেখায় তার একটি উদাহরণ:

한글 또는 조선 글 은 한국어 의 고유 문자 로서, 1443 년 조선 제 4 대 임금 세종 이 훈민정음 (訓 民 正音) 이라는 이름 으로 창제 하여 1446 년 에 반포 하였다 하였다 이후 한문 을 고수 하는 사대부 들 에게는 경시 되기도 하였으나 하였으나, 조선 왕실 과 일부 양반층 과 서민층 을 중심 으로 으로 지다가 지다가 1894 갑오 갑오 에서 에서 한국 의 공식적인 나라 가 되었고, 1910 년대 에 이르러 한글 학자 인 주시경 이 '한글' 하였다 을 사용 하였다।

ইউনিকোডে 11,172 টি ব্লক অক্ষর সম্পন্ন হয়েছে - তবে আপনি যদি চূড়ান্ত "ব্লকগুলি" নিজেই রচনার জন্য লজিকটি কোড করতে রাজি হন তবে আপনি অক্ষর সেটটিতে খুব বেশি সঞ্চয় করতে পারবেন।

মূলত, সমস্ত অক্ষর দুটি বিভাগে বিভক্ত হতে পারে - ব্যঞ্জনবর্ণ + স্বর এবং ব্যঞ্জনবর্ণ + স্বর + ফাইনাল, যেখানে ফাইনাল স্বর, ব্যঞ্জনাত্মক বা সংমিশ্রিত হতে পারে। সিভি সিলেবলগুলি বাম দিকে সি এবং ডানদিকে ভি দিয়ে নির্মিত হয়; সিভিএফ ব্যঞ্জনবর্ণগুলি শীর্ষে সিভি ব্লক (বাম থেকে ডান) এবং নীচে চূড়ান্ত সমন্বিত composed

সুতরাং, মূলত, আপনার প্রয়োজন:

  • ১৯ টি সূচনা, দুটি রূপে
  • 21 টি শিরোনাম দুটি রূপে
  • 28 ফাইনাল

মোট 108 টি চিহ্নের জন্য । (আমি সম্পূর্ণ নিশ্চিত নই যে কোরিয়ান ভাষায় কোনও "লিগাচার" নেই, যাতে কখনও কখনও একটি নির্মিত ব্লক উপাদানগুলির সংমিশ্রণের চেয়ে আলাদা দেখায়, তবে এটি আমাদের পক্ষে সবচেয়ে ভাল)

জাপানি

আপনি যেমনটি সঠিকভাবে লক্ষ্য করেছেন, জাপানিদের একটি ফোনেটিক বর্ণমালা রয়েছে - তবে বাস্তবে, কেবল একটি নয়, দুটি! হিরাগানা এবং কাতাকানা দুটি সিলেলেবল রয়েছে, উভয়ই একই সিলেলেবল রয়েছে, তবে বিভিন্ন প্রসঙ্গে ব্যবহৃত হয় (কাতাকানা বিদেশী শব্দের জন্য ব্যবহৃত হয়, হিরাগানাকে ব্যাকরণের জন্য ব্যবহৃত হয়)।

দুঃখের বিষয় (আমাদের উদ্দেশ্যে), জাপানিরা কেবলমাত্র এই দুটি বর্ণমালা - চীনা অক্ষর বা কঞ্জি ব্যবহার করে পুরোপুরি লিখতে প্রায় অসম্ভব যেহেতু তারা এই প্রসঙ্গে পরিচিত, যে কোনও জাপানি লেখার জন্য প্রয়োজনীয়।

বাধ্যতামূলক লেখার উদাহরণ:

仮 名 (か な) と は, 漢字 を も と に し て 日本 で 作 ら れ た 文字 の こ と। 現在 一般 に は 平 仮 名 と 片 仮 名 の こ と を 指 す। 表音文字 の 一種 で あ り, 基本 的 に 1 字 が 1 音節 をあ ら わ す 音節 文字 に 分類 さ れ る। 漢字 に 対 し て 和 字 (わ じ) と も 言 う। た だ し 和 字 は 和 製 漢字 を 意味 す る 事 も あ る।

কঞ্জি ছাড়াও, আপনার দুটি চীনা ফোনেটিক বর্ণমালা + 7 সাধারণ কঞ্জি যা মানচিত্রে চীনা নেই তা মানচিত্রের জন্য 103 গ্লিফ লাগবে।

সিকেজে বিরামচিহ্ন

এটির জন্য বিশেষজ্ঞ নন, তবে চীনা এবং জাপানিজ উভয়ই শাস্ত্রীয়, পূর্ব এশিয়ান বিরামচিহ্ন ব্যবহার করে। ইউনিকোডে সিজেকে বিরামচিহ্ন এবং চিহ্নগুলিতে উত্সর্গীকৃত 64 টি প্রতীক রয়েছে ।

চীনা

সুতরাং, আমাদের "বাজেট" এ আমাদের 636363১ টি অক্ষর বাকী রয়েছে। এটি কি চীনা চরিত্রগুলি কভার করার জন্য যথেষ্ট হবে?

漢字 為 上古 時代 的 華夏族 人 所 發明 創製 並 作 改進, 目前 确切 歷史 可 追溯 至 約 公元前 1300 年 商朝 的 甲骨文, 籀文, 金文। 再到 秦朝 的 小篆, 發展 至 漢朝 隸 變,至 唐代 楷 化為 今日 所 用 的 手寫 字體 標準 -। 正楷 汉字 是 迄今为止 连续 使用 时间 最长 的 主要 文字, 也是 上古 时期 各大 文字 体系 中 唯一 传承 至今 的 文字, 期間 ​​東亞 諸國 都有 一定 程度 地 自行創製 漢字।

100,000 টিরও বেশি অক্ষরের অস্তিত্ব থাকা সত্ত্বেও চীনা চরিত্র সম্পূর্ণরূপে আচ্ছাদন করা অসম্ভব , সক্রিয়ভাবে ব্যবহৃত উপসেটটি আরও ছোট। 2000-3000 টি অক্ষর সাধারণ সাক্ষরতার জন্য যথেষ্ট বলে মনে হয় (এইচএসকে, টোফেল-এর মতো ম্যান্ডারিন চাইনিজ পরীক্ষা, তার উচ্চ স্তরের জন্য এইচএসকে অ্যাডভান্সড ২৮০০ টি অক্ষরের জ্ঞান প্রয়োজন), শিক্ষিত ব্যক্তির জন্য ৪০০০০-৫০০০ অক্ষরই যথেষ্ট are

সরল ও andতিহ্যবাহী অক্ষর রয়েছে তা মনে রেখে (পূর্বে পিআরসি ব্যবহৃত হয়, আধুনিক - তাইওয়ান ভাষায়), যা অনেকগুলি চরিত্রের জন্য পৃথক , বাকি 00 76০০ টি প্রতীক, আমি বলব, বেশিরভাগ ব্যবহারের ক্ষেত্রে আবৃত করার জন্য যথেষ্ট হবে উভয় অক্ষর।

যদি আপনার কোন প্রশ্ন থাকে তাহলে জিজ্ঞাসা নির্দ্বিধায়!


5
কি দারুন. এসওতে পোস্ট করা যে কোনও প্রশ্নের পক্ষে আমি সম্ভবত এটি পেয়েছি সম্ভবত সেরা উত্তর। আমি আজ আগে এই প্রশ্নটি পরিবর্তন করেছি কারণ এটি বকেয়া ছিল। আমাদের প্রয়োজনীয়তাগুলি কিছুটা পরিবর্তিত হয়েছে তবে আমি আমাদের পণ্যগুলির প্রকৃতিটিও জানি এবং ভবিষ্যতে এটি কোনও অজানা সময়ে প্রয়োজন হওয়ার পূর্বেই আমি প্রত্যাশা করি। আপনি +1 এবং উত্তর ভোট পান। আমি আশা করি এর চেয়েও বেশি পয়েন্ট আপনাকে দিতে পারতাম। ধন্যবাদ 1,000,000!
আরএলএইচ

থাইয়ের প্রতি ভালোবাসা নেই?
লালালা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.