একটি চরিত্র, একটি কোড পয়েন্ট, একটি গ্লিফ এবং গ্রাফির মধ্যে পার্থক্য কী?


146

আধুনিক ইউনিকোডের সূক্ষ্মতাগুলি বোঝার চেষ্টা করা আমার মাথাকে আঘাত করছে। বিশেষত, কোড পয়েন্ট, অক্ষর, গ্লিফ এবং গ্রাফিম - ধারণাগুলির মধ্যে পার্থক্য যা সহজ ক্ষেত্রে, যখন ASCII অক্ষর ব্যবহার করে ইংরেজী পাঠের সাথে কথা হয়, সমস্তই একে অপরের সাথে একের পরস্পর সম্পর্ক রাখে - তা আমাকে সমস্যার কারণ করে তোলে।

ম্যাথিয়াস ব্যেনেন্সের জাভাস্ক্রিপ্টের মতো নথিগুলিতে এই পদগুলি কীভাবে ব্যবহার হয় তা দেখে হ্যান একীকরণের বিষয়ে উইকিপিডিয়ায় কিছু সমস্যা রয়েছে , আমি জড় করেছি যে এই ধারণাগুলি একই জিনিস নয় এবং সেগুলি মোকাবেলা করা বিপজ্জনক, তবে আমি একধরণের প্রতিটি শব্দটির অর্থ কী তা বোঝার জন্য লড়াই করা ।

ইউনিকোড কনসোর্টিয়াম এই স্টাফটি ব্যাখ্যা করার জন্য একটি গ্লসারি অফার করে তবে এটি এটি "সংজ্ঞা" দিয়ে পূর্ণ:

বিমূর্ত অক্ষর । পাঠ্য ডেটা সংগঠন, নিয়ন্ত্রণ, বা উপস্থাপনের জন্য ব্যবহৃত তথ্যের একক। ...

...

চরিত্র । ... (2) বিমূর্ত চরিত্রের প্রতিশব্দ। (3) ইউনিকোড অক্ষর এনকোডিংয়ের জন্য এনকোডিংয়ের প্রাথমিক একক। ...

...

গ্লিফের । (1) একটি বিমূর্ত ফর্ম যা এক বা একাধিক গ্লাইফ চিত্র উপস্থাপন করে। (২) গ্লাইফ চিত্রের প্রতিশব্দ। ইউনিকোড চরিত্রের ডেটা প্রদর্শনের ক্ষেত্রে, একটি বা একাধিক গ্লাইফ একটি নির্দিষ্ট অক্ষর চিত্রিত করতে বেছে নেওয়া যেতে পারে।

...

গ্রাফিম । (1) নির্দিষ্ট লেখার পদ্ধতির প্রসঙ্গে লেখার একটি ন্যূনতম স্বাতন্ত্র্যসূচক একক। ...

এই সংজ্ঞাগুলির বেশিরভাগটি খুব একাডেমিক এবং আনুষ্ঠানিক শোনার মানের অধিকারী, তবে কোনও অর্থের মানের অভাব নেই , বা অন্যথায় সংজ্ঞাটির সমস্যাটিকে আরও একটি শব্দকোষে প্রবেশ করে বা স্ট্যান্ডার্ডের অংশে স্থির করে।

সুতরাং আমি আমার চেয়ে আরও বেশি জ্ঞাত জ্ঞান অর্জনকারীদের তর্ক বুদ্ধি খুঁজছি these এই ধারণাগুলির প্রতিটি একে অপরের থেকে ঠিক কীভাবে পৃথক হয় এবং কোন পরিস্থিতিতে তাদের একে অপরের সাথে একের পর এক সম্পর্ক থাকবে না?


বিভিন্ন বিভিন্ন ভাষার জন্য অনেকগুলি ভিন্ন রাইটিং সিস্টেম রয়েছে। এইভাবে লেখার সমস্যা সম্পর্কে বিভিন্ন মতামত রয়েছে এবং এর পিছনে একটি দীর্ঘ ইতিহাসও রয়েছে। আইএমএইচও এটি মনে রাখা কার্যকর, কারণ ইউনিকোড সমস্ত কিছু coverাকানোর চেষ্টা করে । (অভিশাপ কি একই বা ভিন্ন চরিত্র? কানজি র‌্যাডিক্যালস? হাঙ্গুল? ডায়াক্রিটিক্স? ত্বকের রঙিন ইমোজি ?? ...)
পাবলো এইচ

উত্তর:


225
  • চরিত্রটি অনেকগুলি বোঝার চেয়ে ওভারলোড হওয়া শব্দ।

  • একটি কোড পয়েন্ট হ'ল তথ্যের পারমাণবিক ইউনিট। পাঠ্য কোড পয়েন্টগুলির একটি ক্রম। প্রতিটি কোড পয়েন্ট এমন একটি সংখ্যা যা ইউনিকোড স্ট্যান্ডার্ড দ্বারা অর্থ প্রদান করা হয়।

  • একটি কোড ইউনিট একটি এনকোডেড কোড পয়েন্টের একটি অংশের স্টোরেজের একক । ইউটিএফ -8 এর অর্থ 8-বিট, ইউটিএফ -16 এর অর্থ 16-বিট। একটি একক কোড ইউনিট একটি পূর্ণ কোড পয়েন্ট বা একটি কোড পয়েন্টের অংশ উপস্থাপন করতে পারে। উদাহরণস্বরূপ, স্নোম্যান গ্লাইফ ( ) একটি একক কোড পয়েন্ট তবে 3 ইউটিএফ -8 কোড ইউনিট এবং 1 ইউটিএফ -16 কোড ইউনিট।

  • একজন গ্রাফিম এক বা একাধিক কোড পয়েন্ট একটি একক, গ্রাফিক্যাল ইউনিট যে একটি পাঠক লেখা সিস্টেমের একটি একক উপাদান হিসেবে স্বীকৃতি দেয় হিসেবে প্রদর্শিত হয় একটি ক্রম। উদাহরণস্বরূপ, উভয় aএবং äগ্রাফিম, তবে এগুলি একাধিক কোড পয়েন্ট সমন্বিত äহতে পারে (উদাহরণস্বরূপ দুটি কোড পয়েন্ট হতে পারে, বেস বর্ণের aজন্য একটি পরে ডায়রিসিসের জন্য একটি; তবে একটি বিকল্প, উত্তরাধিকার, একক কোড পয়েন্টও এই গ্রাফিটিকে উপস্থাপন করে) )। কিছু কোড পয়েন্ট কখনই কোনও গ্রাফির অংশ হয় না (উদাহরণস্বরূপ শূন্য-প্রস্থের নন-জোয়ারার, বা নির্দেশমূলক ওভাররাইড)।

  • একটি গ্লাইফ একটি চিত্র যা সাধারণত একটি ফন্টে সঞ্চিত হয় (যা গ্লাইফের সংগ্রহ) যা গ্রাফেম বা এর অংশগুলি উপস্থাপন করতে ব্যবহৃত হয়। ফন্টগুলি একক উপস্থাপনায় একাধিক গ্লিফগুলি রচনা করতে পারে, উদাহরণস্বরূপ, যদি উপরের äএকক কোড পয়েন্ট হয় তবে একটি ফন্ট দুটি পৃথক, স্থানিকভাবে ওভারলেড গ্লাইফ হিসাবে রেন্ডার করতে পছন্দ করতে পারে। ওটিএফ-র জন্য, হরফের জি-জি-জিবি এবং জিপিওএস টেবিলগুলিতে এই কাজটি করার জন্য প্রতিস্থাপন এবং অবস্থান সম্পর্কিত তথ্য রয়েছে। একই গ্রাফেমের জন্যও একটি ফন্টে একাধিক বিকল্প গ্লাইফ থাকতে পারে।


4
আমি কেবল একটি সম্পাদনা জমা দিয়েছি যা কোড-পয়েন্ট এবং কোড-ইউনিটের ক্রমটিকে পুনরায় সাজিয়েছে। আমি আপনার সাথে একমত যে কোড-ইউনিট দ্বিতীয় হওয়া উচিত। "জায়গা থেকে দূরে" থাকার বিষয়ে আমার সন্দেহ হয় যে আপনি এই উত্তরটিকে আমার চেয়ে ভিন্ন উদ্দেশ্য হিসাবে পরিবেশন করেছেন। আমি মনে করি যে এই পাঁচটি শর্তাবলী এক জায়গায় রাখার অনেক মূল্য রয়েছে। আমি চাই সর্বশেষ জিনিসটি "গ্লাইফ, গ্রাফিম, কোড ইউনিট এবং কোড পয়েন্টের মধ্যে কী পার্থক্য রয়েছে এবং দুটি জায়গায় উত্তর পেতে হবে এর জন্য গুগল করা। প্রচুর আলোচনায় এই পদগুলি সমস্ত আলোচনায় ব্যবহৃত হয়, খুব কমই করি আমি অন্য 4
টির

1
সুতরাং উদাহরণস্বরূপ '\ uD83D \ uDC0A' (যা কোনও কুমির ইমোজি দেখায়) কোড পয়েন্ট, গ্রাফিক্স ইত্যাদি কি? বিশেষ করে, কিভাবে এটা কহা না .length, .codePointAt(0), .codePointAt(1), .charCodeAt(0)এবং .charCodeAt(1)ফলাফল?
qbolec

3
@ কোবোলেক: এগুলি দুটি ইউটিএফ -১ code কোড ইউনিট যা একটি একক কোড পয়েন্ট (U + 1F40A) প্রকাশ করে এবং এটি ইমোজি দেওয়ার কারণে এটি সম্ভবত নিজস্ব, একক গ্রাফেম।
কেরেক এসবি

2
@ টোমপৌরেক: পচা ক্যানোনিকালাইজেশনে এটি দুটি কোডপয়েন্ট দ্বারা উপস্থাপিত হয় ( aপ্লাস " ডায়ায়্রিটিকের সমন্বয়"); রচিত ক্যানোনিকালাইজেশনে এটি একটি একক কোডপয়েন্ট দ্বারা উপস্থাপিত হয় ( äপুরানো উত্তরাধিকার লাতিন -১ পরিসর থেকে)। ইউনিকোড ক্যানোনিকালাইজেশন হ'ল বিষয় যদি আপনি তদন্ত করতে চান তবে এটি আপনার আগ্রহী। একটি ফাঁকা স্লেট বিশ্বে, কেবলমাত্র বেস এবং সংমিশ্রিত অক্ষর থাকবে এবং কোনও প্রাক-বিল্ট কম্পোজিট থাকবে না।
কেরেক এসবি

1
@ কৌশিক: আপনি কী বলতে চাইছেন তা আমি নিশ্চিত নই: একটি কোড ইউনিট স্টোরেজের একটি ইউনিট, হ্যাঁ, তবে সাধারণভাবে একটি কোড পয়েন্টে স্টোরেজের জন্য একাধিক কোড ইউনিট প্রয়োজন (ইউটিএফ -32 বাদে)।
কেরেক এসবি

1

ইউনিকোড স্ট্যান্ডার্ডের বাইরে একটি অক্ষর হ'ল এক বা একাধিক গ্রাফিম দ্বারা গঠিত পাঠ্যের স্বতন্ত্র একক । ইউনিকোড স্ট্যান্ডার্ডটি "অক্ষর" হিসাবে যা সংজ্ঞায়িত করে তা আসলে গ্রাফিম এবং অক্ষরের মিশ্রণ। ইউনিকোড পৃথক অক্ষর হিসাবে জুস্টপোজযুক্ত গ্রাফেমগুলির ব্যাখ্যার জন্য নিয়ম সরবরাহ করে।

একটি ইউনিকোড কোড পয়েন্ট হ'ল প্রতিটি ইউনিকোড চরিত্রের জন্য নির্ধারিত একটি অনন্য নম্বর (যা হয় কোনও চরিত্র বা গ্রাফিয়াম)।

দুর্ভাগ্যক্রমে, ইউনিকোড বিধিগুলি কিছু জাস্টস্পোজযুক্ত গ্রাফিমগুলিকে ইতিমধ্যে নিজস্ব কোড পয়েন্ট ( প্রাকম্পোজিত ফর্ম ) রয়েছে এমন অন্যান্য গ্রাফি হিসাবে ব্যাখ্যা করতে দেয় । এর অর্থ হ'ল ইউনিকোডে একটি চরিত্র উপস্থাপনের একাধিক উপায় রয়েছে। ইউনিকোড নর্মালাইজেশন এই সমস্যাটি সম্বোধন করে।

একটি গ্লাইফ হ'ল একটি চরিত্রের চাক্ষুষ প্রতিনিধিত্ব। একটি ফন্ট একটি নির্দিষ্ট অক্ষর (ইউনিকোড অক্ষর নয়) জন্য গ্লাইফগুলির একটি সেট সরবরাহ করে। প্রতিটি চরিত্রের জন্য, সম্ভাব্য গ্লাইফগুলির একটি অসীম সংখ্যা রয়েছে।

মার্ক আমেরিকে একটি উত্তর

প্রথম, যেমনটি আমি বলেছি, প্রতিটি চরিত্রের জন্য অসীম সম্ভাব্য গ্লাইফ রয়েছে তাই না, একটি চরিত্র "সর্বদা একক গালিফ দ্বারা প্রতিনিধিত্ব করা হয় না"। ইউনিকোড গ্লিফগুলির সাথে নিজেকে খুব বেশি উদ্বিগ্ন করে না এবং কোড কোডের চার্টে এটি যে জিনিসগুলি সংজ্ঞায়িত করে তা অবশ্যই গ্লাইফ নয়। সমস্যাটি হ'ল উভয়ই সমস্ত চরিত্র নয়। তাহলে তারা কি?

বৃহত্তর সত্তা, গ্রাফি বা চরিত্র কোনটি? অক্ষর বা বিরামচিহ্ন নয় এমন পাঠ্যে এমন গ্রাফিক উপাদানগুলিকে কী বলে? একটি শব্দ যা দ্রুত মনে জাগে তা হ'ল গ্রাফেম। এটি এমন একটি শব্দ যা "কোনও পাঠ্যের একটি গ্রাফিকাল ইউনিট" ধারণাটি অবিকলভাবে সাজিয়ে তোলে। আমি এই সংজ্ঞাটি দিচ্ছি: একটি গ্রাফিম লিখিত পাঠ্যের মধ্যে সবচেয়ে ছোট স্বতন্ত্র উপাদান

কেউ অন্য পথে যেতে পারে এবং বলতে পারে যে গ্রাফিগুলি অক্ষর দ্বারা গঠিত, তবে তারপরে এগুলিকে "চাইনিজ গ্রাফেমিস" বলা হত, এবং সেই সমস্ত বিট এবং টুকরা চীনা গ্রাফিকসগুলি পরিবর্তে "অক্ষর" বলা হত। যাইহোক, এটি সব পিছনে। গ্রাফিমগুলি পৃথক ছোট বিট এবং টুকরা। চরিত্রগুলি আরও বিকশিত হয়। "গ্লাইফগুলি কম্পোজেবল" এই বাক্যাংশটি ইউনিকোডের প্রসঙ্গে "বর্ণগুলি কমপোজযোগ্য" হিসাবে আরও ভালভাবে বলা যেতে পারে।

ইউনিকোড অক্ষরগুলি সংজ্ঞায়িত করে তবে গ্রাফিক্সগুলিও সংজ্ঞায়িত করে যা অন্যান্য গ্রাফি বা অক্ষরগুলির সাথে রচিত হয়। আপনি রচিত সেই বিদ্বানগুলি এর একটি দুর্দান্ত উদাহরণ। যদি তারা ধরা পড়ে তবে তারা ইউনিকোডের পরবর্তী সংস্করণে নিজস্ব কোড পয়েন্ট পাবে;)

এই সমস্ত ক্ষেত্রে একটি পুনরাবৃত্ত উপাদান রয়েছে। উচ্চ স্তরে, গ্রাফিমগুলি অক্ষরগুলিকে গ্রাফিমে পরিণত হয়, তবে এটি সমস্তভাবেই গ্রাফিম হয়।

টিএস-এর জবাব

স্ট্যান্ডার্ডের প্রথম অধ্যায়টি বলে: "ইউনিকোড অক্ষর এনকোডিং বর্ণমালার অক্ষর, আদর্শগত অক্ষর এবং চিহ্নগুলিকে সমানভাবে বিবেচনা করে, যার অর্থ তারা কোনও মিশ্রণে এবং সমান সুবিধা সহ ব্যবহার করতে পারবেন"। এই বিবৃতি দেওয়া, আমাদের মান কিছু শর্তাবলীর জন্য প্রস্তুত করা উচিত। কখনও কখনও যথাযথ পরিভাষা একটি মান বিকাশের সাথে সাথে পূর্ববর্তী ক্ষেত্রেই পরিষ্কার হয়ে যায়।

এটি প্রায়শই কোনও ভাষার আনুষ্ঠানিক সংজ্ঞায় ঘটে যে দুটি মৌলিক বিষয় একে অপরের শর্তে সংজ্ঞায়িত হয়। উদাহরণস্বরূপ, এক্সএমএলে একটি উপাদান সম্ভবত একটি সূচনা ট্যাগ হিসাবে সংজ্ঞায়িত করা হয় সম্ভবত কন্টেন্ট দ্বারা অনুসরণ করা হয়, তার পরে একটি শেষ ট্যাগ হয়। বিষয়বস্তু একটি উপাদান, চরিত্রের ডেটা বা অন্যান্য কয়েকটি সম্ভাব্য জিনিস হিসাবে পরিবর্তিত হয়। স্ব-রেফারেন্সিয়াল সংজ্ঞাগুলির একটি প্যাটার্ন ইউনিকোড স্ট্যান্ডার্ডেও অন্তর্ভুক্ত:

গ্রাফিম একটি কোড পয়েন্ট বা একটি অক্ষর।

একটি চরিত্র এক বা একাধিক গ্রাফিমের ক্রম থেকে রচিত।

এই দুটি সংজ্ঞার সাথে যখন প্রথম মুখোমুখি হয় তখন পাঠক প্রথম ভিত্তিতে কোনও সংকেতকে বিন্দু হিসাবে চিহ্নিত করার বিষয়ে আপত্তি জানাতে পারে তবে এটি সর্বদা সত্য নয়। দুটি কোড পয়েন্টের একটি ক্রম কখনও কখনও স্বাভাবিকের অধীনে একটি কোড কোড পয়েন্টকে এনকোড করে এবং সেই এনকোডযুক্ত কোড পয়েন্টটি চরিত্রটি উপস্থাপন করে যা চিত্র 2.7 তে চিত্রিত হয়েছে । কোড পয়েন্টগুলির সিকোয়েন্সগুলি যা অন্য কোড পয়েন্টগুলিকে এনকোড করে। এটি কিছুটা জটিল হয়ে উঠছে এবং আমরা এমন স্তরেও পৌঁছতে পারি নি যেখানে ইউটিএফ -8 এর মতো অক্ষর এনকোডিং স্কিমগুলি কোড পয়েন্টগুলি বাইট সিকোয়েন্সগুলিতে এনকোড করতে ব্যবহৃত হয়।

কিছু প্রসঙ্গে, উদাহরণস্বরূপ , ডায়াক্রিটিক্স সম্পর্কিত একটি পণ্ডিত নিবন্ধ এবং কোনও চরিত্রের স্বতন্ত্র অংশটি নিজেই লেখায় প্রদর্শিত হতে পারে। সেই প্রসঙ্গে স্বতন্ত্র চরিত্রের অংশটিকে একটি চরিত্র হিসাবে বিবেচনা করা যেতে পারে, তাই এটি ইউনিকোড স্ট্যান্ডার্ডটিও নমনীয়ভাবে বজায় রাখে sense

মার্ক অ্যাভেরি যেমন উল্লেখ করেছেন, একটি চরিত্রকে আরও জটিল জিনিস তৈরি করা যেতে পারে। এটি হ'ল প্রতিটি চরিত্র ইচ্ছা করলে গ্রাফি হিসাবে কাজ করতে পারে। সমস্ত রচনার চূড়ান্ত ফলাফল এমন একটি বিষয় যা "ব্যবহারকারী একটি চরিত্র হিসাবে মনে করেন"। মানক বা এই আলোচনায়, আদর্শের মধ্যে বা এই আলোচনায় কোনও বাস্তব প্রতিরোধের উপস্থিতি বলে মনে হচ্ছে না যে উচ্চ স্তরের স্তরের এই জিনিসগুলি ব্যবহারকারীকে পৃথক চরিত্র হিসাবে মনে করে text এই শব্দটি ওভারলোডিং এড়াতে, আমরা কোনও ক্ষেত্রে যেখানে চরিত্র রচনা করতে ব্যবহৃত অংশগুলি উল্লেখ করতে চাই সেখানে "গ্রাফি" ব্যবহার করতে পারি।

অনেক সময় ইউনিকোড স্ট্যান্ডার্ডটি এর পরিভাষা সহ পুরো জায়গা জুড়ে থাকে। উদাহরণস্বরূপ, অধ্যায় 3 ইউটিএফ -8 কে একটি "এনকোডিং ফর্ম" হিসাবে সংজ্ঞায়িত করেছে যেখানে শব্দকোষটি "এনকোডিং ফর্ম" কে অন্য কিছু হিসাবে এবং ইউটিএফ -8 কে "চরিত্রের এনকোডিং স্কিম" হিসাবে সংজ্ঞায়িত করেছে। আরেকটি উদাহরণ হ'ল "গ্রাফিম_বেস" এবং "গ্রাফিম_একসেট", যা ভুল হিসাবে স্বীকৃত তবে তা অব্যাহত রয়েছে কারণ এগুলি শুদ্ধ করা কিছুটা কাজ। স্ট্যান্ডার্ড দ্বারা নিযুক্ত পরিভাষা আরও শক্ত করার জন্য এখনও কাজ বাকি আছে।

গ্রাফিম যোজক সমন্বয় যোগে জন্য প্রস্তাবনা বুঝেছি ভুল যখন এটা বলেন যে "Graphemes এক ক্রমের সাথে বা তার বেশি এনকোড অক্ষর আছে যা ব্যবহারকারীদের অক্ষর হিসাবে মনে মিলা আছে।" পরিবর্তে এটি পড়া উচিত, "এক বা একাধিক গ্রাফিক্সের ক্রম ব্যবহারকারী রচনা হিসাবে কী ভাবছেন তা রচনা করে।" তারপরে এটি "গ্রাফিক সিক্যুয়েন্স" শব্দটি "চরিত্রের অনুক্রম" শব্দটি থেকে আলাদাভাবে ব্যবহার করতে পারে। উভয় পদই কার্যকর। "গ্রাফিম সিকোয়েন্স" সুন্দরভাবে ছোট ছোট টুকরা থেকে একটি চরিত্র গঠনের প্রক্রিয়া বোঝায় imp "চরিত্রের অনুক্রম" এর অর্থ আমরা সাধারণত কী বোঝাতে চাইছি এটি বোঝাতে: "ব্যবহারকারীকে চরিত্র হিসাবে যে জিনিসগুলি মনে করে সেগুলির একটি ক্রম"।

কখনও কখনও একজন প্রোগ্রামার সত্যই গ্রাফিম সিকোয়েন্সগুলির স্তরে কাজ করতে চায়, সুতরাং এই অনুক্রমগুলি পরীক্ষা ও পরিচালনা করার পদ্ধতিগুলি পাওয়া উচিত, তবে সাধারণত, পাঠ্য প্রক্রিয়া করার সময়, এটি "চরিত্রের সিকোয়েন্সগুলি" চালানোর জন্য যথেষ্ট (ব্যবহারকারী কী মনে করেন) একটি চরিত্র হিসাবে) এবং সিস্টেমকে নিম্ন-স্তরের বিশদটি পরিচালনা করতে দিন।

এই আলোচনার এ পর্যন্ত আচ্ছাদিত প্রতিটি ক্ষেত্রে, অবিভাজ্য উপাদানগুলি উল্লেখ করতে "গ্রাফি" ব্যবহার করা পরিষ্কার এবং রচিত সত্তাকে উল্লেখ করার জন্য "চরিত্র" ব্যবহার করা পরিষ্কার। এই ব্যবহার উভয় পদের দীর্ঘ-প্রতিষ্ঠিত অর্থগুলি আরও ভালভাবে প্রতিফলিত করে।


একটি সতর্ক -1; আমি মনে করি এটি ভুল। আপনি বোঝাচ্ছেন যে একটি চরিত্র অনেকগুলি গ্রাফিম সমন্বয়ে গঠিত হতে পারে তবে সর্বদা একটি গ্লাইফ দ্বারা প্রতিনিধিত্ব করা হবে; আমি মনে করি বাস্তবে এটি অন্যভাবে। এন.ইউইকিপিডিয়া.আর্গ / উইকি / এন- ডায়ারেসিসের মতো পৃষ্ঠাগুলি সূচিত করে যে ডায়াক্রিটিকের সাথে একটি চিঠির সংমিশ্রণ (কমপক্ষে একটি যার অর্থ পরিবর্তন করে) একটি পৃথক নতুন গ্রাফেম গঠন করে এবং ডায়ায়্রিটিক তার নিজের মতো গ্রাফেম নয়। ইতোমধ্যে, গ্লাইফগুলি স্পষ্টতই কমপিউটিভ সায়েন্সিয়াক্সিএইচইএইচএইচএনএইডি অ্যাডিশিয়াল এ্যাচটিসি'স
মার্ক অ্যামেরি

আমি উত্তরটি দেখেছি, যা আমি সবেমাত্র দেখেছি appreciate তবে আমি এখনও মনে করি আপনার গ্রাফিক্সের সংজ্ঞা আসলে ভুল, বা ইউনিকোড শব্দটি কীভাবে সংজ্ঞায়িত করে তাতে কমপক্ষে মতবিরোধ । আপনি "সমস্ত পিছনে" হিসাবে চরিত্রগুলির সমন্বয়ে গ্রাফিমের ধারণাটি খারিজ করেছেন, তবে আমি কিছুটা খনন করে দেখেছিলাম এবং ইউনিকোড.আর 2 / এল 2000/00274-N2236-grapheme-joiner.htm যা আক্ষরিক অর্থে বিবৃতি দিয়ে শুরু হয় " গ্রাফিমগুলি এক বা একাধিক এনকোড করা অক্ষরের ক্রম "
মার্ক অ্যামেরি

এবং এই বিবৃতি অব্যাহত রয়েছে, "... এটি ব্যবহারকারীদের চরিত্র হিসাবে যা ভাবেন তার সাথে মিলে যায়।" এমনকি " গ্রাফিম-জোড়কারী " শব্দটি পাশাপাশি শব্দটির পিছনের প্রক্রিয়াটিও আমার উত্তরের শুরুতে আমি যা বলেছিলাম তা উদাহরণস্বরূপ: ইউনিকোড স্ট্যান্ডার্ডটি "অক্ষর" হিসাবে কী সংজ্ঞায়িত করে তা আসলে গ্রাফিম এবং চরিত্রগুলির মিশ্রণ। " প্রাক্পম্পোজড অক্ষর " এবং " গ্রাফেমি ক্লাস্টার " এর মতো কনট্রোশনের আবিষ্কারের পরিবর্তে গ্রাফিমগুলিকে "গ্রাফিকস" এবং অক্ষরগুলিকে "অক্ষর" বলা ভাল ।
দরিদ্র ইয়োরিক

@ পুয়ারইয়র্ক আপনারা দাবি করেছেন যে "... একটি চরিত্র এক বা একাধিক গ্রাফিমের সমন্বয়ে লেখা পাঠ্যের একটি পৃথক ইউনিট" এবং "গ্রাফিমগুলি স্বল্প বিট এবং টুকরো। চরিত্রগুলি আরও বিকশিত হয়"। আপনার কি এমন কোনও রেফারেন্স রয়েছে যা এই দাবিগুলিকে সমর্থন করে? কারণ আমি একরকম সন্দেহ করি যে, ইউনিকোড কনসোর্টিয়াম ইচ্ছাকৃতভাবে তাদের নামগুলি কোনওভাবে "উল্টো" হিসাবে সংজ্ঞায়িত করার সিদ্ধান্ত নিয়েছে।
টিএস

@ পুরি ইয়র্ক আমি আপনার বক্তব্যটি বুঝতে পেরেছিলাম, আপনি আরও এই ব্যাখ্যাটি যুক্ত করার আগে, কেন আমি জিজ্ঞাসা করেছি না। আমি কেবল রেফারেন্সের জন্য জিজ্ঞাসা করেছি (অভিধান, বৈজ্ঞানিক নিবন্ধ, প্রযুক্তিগত মান, ...), কারণ আমি এমন কোনও দলিল জানি না, যা গ্রাফিমটি আপনার ব্যাখ্যা করার উপায়ে ব্যবহার করে। (গ্রাফির জন্য প্রথম কয়েকটি গুগল ফলাফল আপনার শব্দটি ব্যবহার করে না)। আপনি একটি ব্লককোয়ট যুক্ত করেছেন "একটি গ্রাফীম একটি কোড পয়েন্ট বা একটি চরিত্র [[...]" - তবে এটি কোথা থেকে এসেছে? শেষে আপনি বলেন "উভয় পদের দীর্ঘ-প্রতিষ্ঠিত অর্থ"। - যদি এটি প্রতিষ্ঠিত হয় তবে কোনও কিছুর সাথে লিঙ্ক করুন, এটি এইভাবে এই শব্দটি ব্যবহার করছে।
টিএস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.