রোমান সংখ্যার জন্য কেন আমি ইউনিকোডের বিশেষ অক্ষরগুলি ব্যবহার করব?


43

এটি রোমান সংখ্যার জন্য ইউনিকোড চরিত্রগুলির বিষয়ে এই প্রশ্নের মন্তব্যে উত্থিত একটি প্রশ্নের উত্তর দেওয়ার জন্য:

আইআই, আইআই-আইআই, আইআই-আইআই, আইইআই, ইত্যাদি টাইপ করার স্বাভাবিক পদ্ধতির চেয়ে কেন এটি প্রয়োজনীয় বা পছন্দের?

শুরু থেকে শুরু করার জন্য, ইউনিকোডের নম্বর ফর্ম ব্লকে, রোমান সংখ্যার জন্য কোড পয়েন্ট রয়েছে যা প্রথম নজরে স্ট্যান্ডার্ড ক্যাপিটাল লাতিন বর্ণ বা সংমিশ্রণের (U + 2160 - U + 217F) এর সাথে খুব মিল রয়েছে। উদাহরণস্বরূপ, ইউ + 2165 (রোমান অঙ্ক সিক্স) দেখতে অনেকটা ষষ্ঠ (ল্যাটিন ক্যাপিটাল লেটার ভি এবং লাতিন ক্যাপিটাল লেটার আই) এর মতো দেখাচ্ছে।

সুতরাং, প্রশ্ন উত্থাপিত হয় কেন একজনকে এই অঙ্কগুলি উপস্থাপন করতে এবং পরবর্তীকালে টাইপ করুন Louis VIIনা কেন Louis Ⅶ? স্পষ্টতই, কোনও বিশেষ অক্ষর ব্যবহার করে ফন্টগুলির সাথে সামঞ্জস্যের সমস্যাগুলি এড়ানো যায় না যা তাদের সমর্থন করে না। তবে আমি যদি জানি যে টেক্সটটি এমন একটি ফন্টের সাথে রেন্ডার করা হবে যা এই চরিত্রগুলিকে সমর্থন করে তবে আমি কেন সেগুলি ব্যবহার করে বিরক্ত করব?

উত্তর:


56

অনেক ফন্টে আপনি অবশ্যই রোমান সংখ্যার জন্য ইউনিকোড অক্ষর ব্যবহার এবং স্টার্ডার্ড ল্যাটিন বর্ণগুলি থেকে তাদের রচনা করার মধ্যে খুব কমই পার্থক্য খুঁজে পাবেন। উদাহরণস্বরূপ, নিচের শোগুলি Louis VII(শীর্ষে) এবং Louis Ⅶ(নীচে, রোমান সংখ্যার জন্য কোডপয়েন্ট ব্যবহার করে) ফ্রিস্যান্সের সাথে রেন্ডার করা হয়েছে:

এখানে চিত্র বর্ণনা লিখুন

ব্যবধানে একটি ছোট পার্থক্য ছাড়াও, যা সম্ভবত উদ্দেশ্যমূলক ছিল না, আউটপুটটি অভিন্ন।

এখানে দেজাভু সানগুলির সাথে একই পাঠ্য রেন্ডার করা হয়েছে:

এখানে চিত্র বর্ণনা লিখুন

চরিত্রগুলি এখনও অভিন্ন দেখায় তবে ব্যবধানে যথেষ্ট পার্থক্য রয়েছে। পরেরটি রোমান সংখ্যার জন্য পছন্দনীয় কিনা এটি স্বাদের বিষয় হতে পারে তবে নিয়মিত সমস্ত ক্যাপগুলির জন্য এটি অবশ্যই কর্নিংয়ের পক্ষে পছন্দ নয়।

লিনাক্স লিবার্টিন আরও এক ধাপ এগিয়ে:

এখানে চিত্র বর্ণনা লিখুন

এখানে রোমান সংখ্যাগুলি মূলধন বর্ণগুলির চেয়ে কিছুটা ছোট, এইভাবে হরফের আরবি সংখ্যাগুলির সাথে মিলে। সর্বাধিক গুরুত্বপূর্ণভাবে, তারা সংযুক্ত থাকে, প্রায়শই হাতে আঁকানো রোমান সংখ্যায় পাওয়া এমন একটি বৈশিষ্ট্য পুনরুত্পাদন করে।

এখন, কিছু এখনও তর্ক করতে পারে যে উপরের কোনও উন্নতি হয়নি বা তারা চেষ্টা করার মতো নয় worth সুতরাং এখানে একটি কেস দেওয়া হয়েছে, যেখানে ইউনিকোড অক্ষর ব্যবহার না করা ভয়াবহ ফলাফল আনবে:

এখানে চিত্র বর্ণনা লিখুন

(দ্রষ্টব্য যে সংখ্যার ছোট আকার কিছু প্রকৃত typeতিহাসিক টাইপসেটিং প্রতিফলিত করে)) স্ক্রিপ্ট বা ক্যালিগ্রাফিক ফন্টগুলির জন্যও অনুরূপ কিছু ঘটতে পারে।

রোমান সংখ্যার জন্য নির্দিষ্ট ইউনিকোড পয়েন্ট ব্যতীত পরবর্তী সমস্যাটি দ্রবীভূত করা কেবলমাত্র এর মাধ্যমে সম্ভব হবে:

  • একটি জটিল ওপেনটাইপ বৈশিষ্ট্য (বা অনুরূপ) ব্যবহার করে যা মূলধনী অক্ষরের ক্রম রোমান অঙ্ক কিনা তা সনাক্ত করার চেষ্টা করে। এটি অনিবার্যভাবে শব্দগুলির সাথে সমস্যা সৃষ্টি করবে যা বৈধ রোমান সংখ্যাও হতে পারে।

  • একটি সাধারণ ওপেনটাইপ বৈশিষ্ট্য ব্যবহার করে, যা প্রতিটি রোমান অঙ্কের জন্য ম্যানুয়ালি সক্রিয় করা দরকার।

  • ইউনিকোডের ব্যক্তিগত-ব্যবহারের ক্ষেত্র ব্যবহার করা। সামঞ্জস্যতার সমস্যাগুলি সম্ভবত দুটি ফন্টের মধ্যে স্যুইচ করার সময়ও দেখা দেয় যা উভয়ই রোমান সংখ্যার সমর্থন করে।

ইউনিকোডের দৃষ্টিকোণ থেকে, মূলধন লাতিন অক্ষর এবং রোমান সংখ্যার মধ্যে বিশাল শব্দার্থগত পার্থক্য ইতিমধ্যে রোমান সংখ্যাগুলির পৃথক এনকোডিংয়ের পক্ষে যথেষ্ট হওয়া উচিত।


রোমান সংখ্যাগুলি কোন সংক্ষিপ্ত বিবরণ এবং সূচনা থেকে পৃথক কোন সমস্যা সৃষ্টি করে, উভয়ই সঠিকভাবে হরফ ফন্টের দ্বারা পরিচালিত হবে ছোট ক্যাপগুলির একটি সেট অন্তর্ভুক্ত? আমি প্রত্যাশা করব যে যেখানে "VII" ছোট ছোট ক্যাপগুলি না দিয়ে বড় হাতের অক্ষর ব্যবহার করে দেখানো উচিত, যেখানে "ন্যাটো" বা "প্রধানমন্ত্রী" একইভাবে দেখানো উচিত। যদিও "VII" এর সাথে ক্রসবারগুলি সংযুক্ত করার উপায় থাকা খুব ভাল তবে "ভিআইপি" নয়, আমি নিশ্চিত না যে পাঠ্যের মধ্যে অঙ্কগুলি ব্যবহার করার সময় ক্রসবারগুলি সংযুক্ত করা উচিত ।
সুপারক্যাট

খুব ভাল আপনার বর্ধিত শব্দার্থকে কিছুটা যুক্ত করেছে তবে আপনি যদি নিজের উত্তরে অন্তর্ভুক্ত করতে চান তবে সোয়া করতে এবং নিখুঁতভাবে আমার মুছে ফেলতে বোধ করেন।
joojaa

@ সুপের্যাট: আপনি কী লক্ষ্য করছেন তা আমি ঠিক নিশ্চিত নই, তবে আমার অভিজ্ঞতায় আধুনিক টাইপোগ্রাফিতে রোমান সংখ্যার সর্বদা মূলধনের আকার থাকে, তবে জার্মান ছাড়া অন্য ভাষাগুলিতে সমস্ত ক্যাপ সংক্ষেপণের জন্য ছোট ক্যাপগুলি ব্যবহার করা অনুমেয়। ব্ল্যাকলেটার টাইপোগ্রাফিতে আপনি সমস্ত ক্যাপ সংক্ষিপ্তসার এবং রোমান সংখ্যার জন্য একটি রোমান ফন্ট ব্যবহার করতেন তবে কখনও কখনও আপনি ছোট রোম্যান অঙ্কগুলি (উপরে হিসাবে) এবং কিছু বিশেষ অনুষ্ঠানের জন্য ব্ল্যাকলেটর অল ক্যাপ ব্যবহার করতেন।
Wrzlprmft

@Wrzlprmft: আমি আশা করব যে রোমান সংখ্যাগুলি "প্রধানমন্ত্রী" বা "ন্যাটো" এর মতো জিনিসগুলির মতো আকারের মুদ্রিত হবে; কিছু প্রসঙ্গে, এই জাতীয় জিনিসগুলি পুরো আকারের রাজধানী হিসাবে মুদ্রিত হয়, তবে অন্যগুলিতে এগুলি খুব বেশি দাঁড়ায়। যদি কোনও ফন্টে মূল হরফের সেট থাকে যাঁর নকশা, বাকী ফন্টের সাথে সম্পর্কিত, "প্রধানমন্ত্রী" বা "ন্যাটো" এর জন্য উপযুক্ত ছিল, আমি মনে করি এটি রোমান সংখ্যার জন্যও উপযুক্ত হবে।
সুপারক্যাট 5'15

@ সুপের্যাট: নিয়মিত রোমান ফন্টের জন্য, হ্যাঁ (যদিও এটি করা সবচেয়ে ভাল হবে কিনা তা নিয়ে কেউ বিতর্ক করতে পারে)। তবে ব্ল্যাকলেটার এবং স্ক্রিপ্ট ফন্টের কী হবে? এছাড়াও, আপনি এটি থেকে কি উপসংহার?
Wrzlprmft

27

টিএল; ডিআর ইউনিকোড কনসোর্টিয়ামটি ল্যাটিন অক্ষরটি যেখানে সম্ভব এবং সংখ্যাটি নয়, সেখানে পূর্ব-এশিয়ান টাইপোগ্রাফির সাথে সামঞ্জস্যের জন্য অন্তর্ভুক্ত করার পরামর্শ দিয়েছিল।

পুরো গল্প: (উপরোক্ত দৃ of়তার যথাযথ প্রমাণ সহ)

যদি আপনি কিছু পূর্ব-এশিয়ান টাইপোগ্রাফি না করেন তবে ইউনিকোডের (ইউ + 2160 - ইউ + 217 এফ) রোমান সংখ্যার অক্ষর ব্যবহার করে (হ'ল হ্যাক)।

এই চরিত্রটি প্রাক-ইউনিকোড পূর্ব-এশীয় মানগুলির সাথে সামঞ্জস্যের জন্য অন্তর্ভুক্ত করা হয়েছে। এই অক্ষরগুলি উল্লম্ব থাকে যেখানে পূর্ব-এশিয়ান পাঠ্যটি শীর্ষ থেকে নীচে টাইপসেট থাকে, তবে সাধারণত ল্যাটিন অক্ষরের পাঠ্য (যেমন নাম) এই প্রসঙ্গে পাশাপাশি লেখা হয়।

ইউনিকোড স্ট্যান্ডার্ডের শেষ সংস্করণটি উদ্ধৃত করতে (v 7.0, অধ্যায় 22, পৃষ্ঠা 20) :

রোমান সংখ্যাসমূহ. বেশিরভাগ উদ্দেশ্যে, উপযুক্ত লাতিন বর্ণগুলির ক্রম থেকে রোমান সংখ্যা রচনা করা ভাল। তবে পূর্ব এশীয় মানগুলির সাথে সামঞ্জস্যের জন্য 12, প্লাস এল, সি, ডি, এবং এম এর মাধ্যমে রোমান সংখ্যার বড় হাতের অক্ষর এবং ছোট ছোট রূপগুলি এনকোড করা হয়েছে। লাতিন বর্ণগুলির ক্রমগুলির বিপরীতে, এই চিহ্নগুলি উল্লম্ব বিন্যাসে খাড়া থাকে। অতিরিক্তভাবে, নির্দিষ্ট লোকেলগুলিতে, কমপ্যাক্ট তারিখের ফর্ম্যাটগুলি মাসের জন্য রোমান সংখ্যা ব্যবহার করে তবে একক অক্ষরের ব্যবহার আশা করতে পারে।

সুতরাং, তত্ত্বের ক্ষেত্রে, রোমান সংখ্যাসূচক এবং বর্ণের মধ্যে পার্থক্যটি সমৃদ্ধ পাঠ্যের একটি বিষয়, যেমন ইটালিক্স, একটি ফন্ট পরিবর্তন বা alচ্ছিক লিগ্যাচার। এতে বলা হয়েছে, @Wrzlprmft দেখায় যে কোনও টাইপোগ্রাফি রাখার সময় প্রতিটি রোমান অঙ্কের ফন্ট পরিবর্তন এড়াতে কিছু ফন্ট এটি ব্যবহার করে।

দ্বাদশ নয় এবং দ্বাদশের জন্য নয় এমন একটি চরিত্রের অস্তিত্ব বোঝায় যে একই সংখ্যাতে বিভিন্ন পৃথক এনকোডিং রয়েছে যা পাঠ্য অনুসন্ধানে অসুবিধার দিকে নিয়ে যায়: আপনি যদি লুই দ্বাদশ এবং লুই দ্বাদশটি সম্পর্কে লিখেন তবে আপনি সম্ভবত দ্বাদশটি এক্স + আই + হিসাবে লিখবেন আই + আই, তবে আপনি কি একক চরিত্র হিসাবে দ্বাদশটি লিখবেন? বা এক্স + আই + আই হিসাবে XIII এর সাথে ধারাবাহিক প্রদর্শন করতে পারি? রোমান অঙ্কের অক্ষরগুলি ব্যবহার করার সময় এই প্রশ্নের কোনও উত্তম উত্তর নেই এবং এজন্যই ইউনিকোড কনসোর্টিয়ামটি সম্ভব হলে ল্যাটিন বর্ণগুলি ব্যবহার করার পরামর্শ দেয় এবং সংখ্যাগুলি নয়।

সম্পাদনা করুন: শুরুতে টিএল; ডিআর জোড় যুক্ত করেছেন


9
" ইউনিকোড কনসোর্টিয়ামটি সম্ভব হলে লাতিন বর্ণগুলি ব্যবহার করার পরামর্শ দেয় এবং সংখ্যাগুলি নয়" " এটি বর্তমানে এটির চেয়ে অনেক বেশি সুস্পষ্ট হওয়া উচিত।
Ixrec

1
ইউনিকোড শব্দার্থবিজ্ঞানের দিক থেকে এটি এখানের সেরা উত্তর। রোমান সংখ্যার চরিত্রগুলি পছন্দ করার জন্য নির্দিষ্ট ফন্টগুলির সাথে ব্যবহারিক কারণ থাকতে পারে এবং এটি অবশ্যই একটি স্বাধীন গ্রাফিক ডিজাইনের বিবেচনা, তবে শব্দার্থগতভাবে তারা সর্বদা ভুল।
আর ..

13

এটি কীভাবে দেখায় তার দৃষ্টিকোণ থেকে খুব বেশি পার্থক্য নাও থাকতে পারে। সুতরাং আপনি যদি কেবল মুদ্রিত উপাদান প্রকাশ করেন তবে কিছু ফন্ট ব্যতীত কোনও পার্থক্য নেই, যেমন Wrzlprmft তার দুর্দান্ত উত্তরে উল্লেখ করেছে।

শব্দার্থবিজ্ঞান গুরুত্বপূর্ণ

শব্দার্থক পার্থক্য বিশাল। রোমান সংখ্যা ব্যবহার করে এটি স্পষ্টভাবে পরিষ্কার করে দেয় যে আপনি 5 নম্বরের পরিবর্তে 5 নম্বরের কথা বলছেন। নিশ্চিত যে তারা একই দেখাচ্ছে তবে তাদের অর্থ ভিন্ন mean এর অর্থ হ'ল আপনি যখন "এক্সএক্স সংস্করণ 5" অনুসন্ধান করবেন তখন অনুসন্ধান ইঞ্জিনের "এক্সএক্স মার্ক ভি" সন্ধানের উচ্চতর সম্ভাবনা থাকতে পারে।

আসলে কিছু জিনিস খারাপভাবে কাজ করার কারণ হ'ল আমরা শব্দার্থক তথ্য এম্বেড করি না। আমরা চাইলে পৃথিবীটি আরও ভাল জায়গা হত। সুতরাং সঠিক শব্দার্থের অর্থ ব্যবহার হ'ল ম্যানুয়ালি স্টাইলিং বনাম কোনও ওয়ার্ড প্রসেসরে স্টাইল ব্যবহার করার মতোই। মানুষের প্রান্তে সামান্য পার্থক্য রয়েছে তবে অটোমেশনে বড় শক্তি।

হরফ বিভিন্ন রোমান সংখ্যার করা উচিত

হরফ প্রস্তুতকারকরা এগুলি সত্যিই ব্যবহার করছেন না কারণ এগুলি প্রায়শই ব্যবহৃত হয় না। তবে এগুলি ব্যবহার করে আপনি অক্ষরগুলিতে রোমান অঙ্কের স্ল্যাব পেতে পারেন যা পাঠ্য থেকে তাদের আলাদা করে। তাই বৈশিষ্ট্যটি স্বল্প-ব্যবহৃত হয়েছে কারণ এটি বিরল ব্যবহার। হরফ সব কিছু বাস্তবায়িত করে না এবং করাও উচিত নয়। এগুলি ব্যবহার করে আপনি উপস্থিত থাকলে উপকৃত হবেন।

উপসংহার

এই সব অবশ্যই মুরগি এবং একটি ডিম টাইপ সমস্যা। লোকেরা যদি বিশেষ চরিত্রের ব্যাপ্তি ব্যবহার না করে তবে এই ব্যাপ্তিগুলির জন্য কোনও বিশেষ ভাতা দেওয়া হবে না। সুতরাং ফন্ট বিশেষ স্টাইলযুক্ত রোমান আক্ষরিক সমর্থন করবে না, কারণ এটি করা কেবল এমন বৈশিষ্ট্যগুলিতে প্রচেষ্টা নষ্ট করা যা কেউ ব্যবহার করে না। অনুসন্ধানের ক্ষেত্রে একই প্রযোজ্য: যদি কেউ রোমান আক্ষরিক ব্যবহার না করে তবে কোনও সার্চ ইঞ্জিন রোমান আক্ষরিক খুঁজে পাবে না এবং শব্দার্থবিজ্ঞান হারিয়ে গেছে। শব্দার্থবিজ্ঞান সঠিক শব্দার্থক অর্থ গ্রহণ না করে ভোগে। এই একই জিনিসটি অবশ্যই ইউনিকোড অক্ষরের বিস্তৃত পরিসরে প্রযোজ্য।

ইনপুট জটিলতার জন্য, হ্যাঁ বেশিরভাগ ব্যবহারকারী বর্ধিত অক্ষর লিখতে পারবেন না তবে কোনও জ্ঞানী ব্যক্তির পক্ষে এটি বর্জন করার কোনও অজুহাত যদি তা বোঝা যায় না। কেউ যদি জিনিসগুলি আরও ভাল না করে তবে কোনও অগ্রগতি হবে না। হেল ইভ শব্দের / আলফা টাইপ করে আলফা লেখার মোড রয়েছে। সুতরাং প্রকৃতপক্ষে কোনও কারণ নেই যে এখানে অঙ্কগুলি ট্যাগ করার এমনকি কোনও স্বয়ংক্রিয়ভাবে সেগুলি বোঝানোর জন্য সহজ উপায় নাও থাকতে পারে। আবার যদি কেউ এটি না করে তবে এটি কখনও কখনও আরও ব্যাপকভাবে গ্রহণ করতে পারে না।


প্রকৃতপক্ষে "লুই Ⅶ" এর পরিবর্তে "লুইস সপ্তম" অনুসন্ধান করার সময় একটি অনুসন্ধান ইঞ্জিন তার চেয়ে অনেক ভাল ফলাফল প্রত্যাবর্তন করে কারণ বাস্তবে বেশিরভাগ সামগ্রীই এমন সরঞ্জাম দিয়ে তৈরি করা হয় যা এই ধরনের অর্থহীন পার্থক্যকে মঞ্জুরি দেয় না।
xpereta

1
@ এক্সপ্রেটা হ্যাঁ কারণ মানুষ শব্দার্থবিজ্ঞানের বিষয়ে চিন্তা করে না। তবে যদি সেগুলি হয় তবে আপনি সহজেই সংখ্যার জন্যও 7 টি মিলবেন। বিশ্বের বেশিরভাগ অপ্রতুলতা হ'ল লোকেরা যখন বিষয়গুলি সহজেই এটি করতে পারে তখন স্পষ্টভাবে বিষয়গুলির শব্দার্থগত পার্থক্যটি চিহ্নিত করতে ওটকে গুরুত্বপূর্ণ মনে করে না। কম্পিউটার সত্যিই এমনকি যদি একটি মানবিক would পার্থক্য জানে না
joojaa

1
@ joojaa এই ক্ষেত্রে, এটি সম্ভবত এই বিষয়টির সাথে আরও বেশি কিছু করতে পারে যে VI-এর চেয়ে টাইপ করা সহজতর VII এর অর্ডার easier আমি নিশ্চিত নই যে তা কখন বদলাবে কিনা।
Ixrec

আপনার উপসংহারটি শেষ করতে আমি শেষ অনুচ্ছেদে কিছুটা প্রসারিত করব যে এর মতো বিশেষ অক্ষরের বিস্তৃত ব্যবহার আরও বিস্তৃত ফন্ট বাস্তবায়নে উত্সাহিত করবে।
নাথান টগি

2
শব্দার্থবিজ্ঞানের বিষয়ে আমি জবাবটি দৃ strongly়ভাবে জিজ্ঞাসা করি। ইউনিকোড রোমান অঙ্কগুলি অক্ষরগুলি <compat>লাতিন অক্ষরের সাথে সম্পর্কিত অনুক্রমের সমান, যা দৃ strongly়তার সাথে পরামর্শ দেয় যে তারা ইউনিকোডে থাকার একমাত্র কারণ হ'ল কিছু উত্তরাধিকার (সম্ভবত সিজেকে) চরিত্রের সেটগুলির সাথে রাউন্ড-ট্রিপ সামঞ্জস্যের জন্য। লিগ্যাসি এনকোডিংগুলিতে তৈরি বিশ্বস্ততার সাথে বৃত্তাকার-ট্রিপিং নথি ছাড়া সাধারণত এই জাতীয় অক্ষর ব্যবহার করা উচিত নয়।
আর ..
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.