টাইপোগ্রাফিক শৈলীর (যেমন ছোট ক্যাপস বা স্ক্রিপ্ট) সিমুলেট করার জন্য কেন আমি ইউনিকোড অক্ষর ব্যবহার করব না?


129

ইউনিকোডে বিভিন্ন অক্ষর রয়েছে যা বেসিক ল্যাটিন বর্ণমালার বর্ণগুলির টাইপোগ্রাফিকভাবে স্টাইলাইজড ভেরিয়েন্টগুলির মতো দেখায় এবং এটি কোনও চিহ্ন-আপ বা অনুরূপ অবলম্বন না করে সংশ্লিষ্ট টাইপোগ্রাফিক শৈলীতে পাঠ্য লেখার মঞ্জুরি দেয়। উদাহরণস্বরূপ, কেউ অনুকরণ করতে পারেন:

  • ছোট টুপিগুলো:

    ᴛ ᴛʜɪꜱ ꜰᴀɴᴄɪʟy ᴇɴᴄᴏᴅᴇᴅ ᴛxᴛ।

  • লিপি:

    𝓽𝓮𝔁𝓽 𝓽𝓱𝓲𝓼 𝓯𝓪𝓷𝓬𝓲𝓵𝔂 𝓮𝓷𝓬𝓸𝓭𝓮𝓭 𝓽𝓮𝔁𝓽।

  • ব্ল্যাকলেটার:

    𝖙𝖊𝖝𝖙 𝖙𝖍𝖎𝖘 𝖋𝖆𝖓𝖈𝖎𝖑𝖞 𝖊𝖓𝖈𝖔𝖉𝖊𝖉 𝖙𝖊𝖝𝖙।

এটি স্ট্যাক এক্সচেঞ্জের (যেমন, এখানে , এখানে , এবং এখানে ) আগ্রহ পূরণ করেছে এবং এই জাতীয় কৌশলগুলির সমালোচনা করা হয়েছিল। তবে আমি তাদের ব্যবহার করলে কী ভুল হতে পারে?


224
আমি এটি আমার ফোন থেকে পড়ছি এবং আমি শেষ দুটি অভিনব পাঠ্য দেখতে পাচ্ছি না।
স্কিমোনস্টার

22
কারণ এটি কিছু ডিভাইসে অপঠনযোগ্য
ক্রিস কেন্ট

15
যেহেতু আমাদের মধ্যে কিছু আমরা ওয়েব পাতাগুলি দেখতে চাই যা আমরা পঠনযোগ্য ফন্ট (এবং মাপ, রঙ এবং সি) হিসাবে বিবেচনা করি তাই লেখক শৈলীর ওভাররাইড করতে আমরা উদাহরণস্বরূপ ব্যবহারকারী সিএসএস স্টাইলশিট ব্যবহার করি। আপনি লক্ষ করতে পারেন যে যদিও আপনার তিনটি উদাহরণ আমার ডিভাইসে প্রদর্শিত হয়েছে, আপাতদৃষ্টিতে ঠিক যেমনটি আপনি প্রদর্শিত হতে চেয়েছিলেন ঠিক তেমনি আমার কাছে সেগুলি কেবল সীমান্ত পাঠযোগ্য। আপনি কেন আপনার শৈল্পিক আকাঙ্ক্ষাকে আপনার পাঠকদের সহজ পাঠের উপরে রাখবেন?
জামেস্কেফ

38
এখানে একটি আকর্ষণীয় পর্যবেক্ষণ: এজ পরবর্তী দুটি নমুনায় পাঠ্য খুঁজে পাচ্ছে না এবং ক্রোম প্রথমটিতে পাঠ্যটি খুঁজে পাবে না। (উভয় ব্রাউজারে বিহোল্ডের জন্য Ctrl + F'ing ব্যবহার করে দেখুন)) ফায়ারফক্স পরীক্ষা করা হয়নি।
Schism

22
@ স্কিজিজ ফায়ারফক্স তাদের কোনওটিই খুঁজে পায় না। দেখে মনে হচ্ছে ক্রোম সম্ভবত অনুসন্ধানের আগে এনএফকেসি / এনএফকেডি সাধারণীকরণ ব্যবহার করে, যা স্ক্রিপ্টটি এবং ব্ল্যাকলেটার পাঠকে বেসিক লাতিনে পচন করে। ফায়ারফক্স এটি করছে বলে মনে হয় না। এজ ... অদ্ভুত কিছু করছে।
বব

উত্তর:


224

সাধারণ

এই অক্ষরগুলি নিয়মিত ল্যাটিন-বর্ণমালা পাঠ্যের জন্য নয়, তবে শব্দবিজ্ঞানের জন্য, সিরিলিক-বর্ণমালা পাঠ্যকে গাণিতিক চিহ্ন হিসাবে (ভেরিয়েবলের প্রতিনিধিত্ব করে) বা অনুরূপ হিসাবে ব্যবহার করা হয়। বেসিক লাতিন বর্ণমালায় পাঠ্য এনকোড করার একমাত্র ইউনিকোড-সম্মতিজনক উপায় হ'ল মূলত এই উদ্দেশ্যে (যেমন, বেসিক ল্যাটিন ইউনিকোড ব্লক থেকে) ব্যবহৃত অক্ষরগুলি ব্যবহার করা ।

অন্যান্য অনেক স্ট্যান্ডার্ডের মতো আপনারও ইউনিকোড লঙ্ঘন সম্পর্কে দুবার চিন্তা করা উচিত। তদুপরি, ইউনিকোডে অনেকগুলি রাইটিং সিস্টেম, ব্যবহারের ক্ষেত্রে এবং স্টাফ রয়েছে যা অন্যান্য মান 1 এর সাথে পিছনের সামঞ্জস্যের জন্য বিদ্যমান যা এর সমস্ত অনুপ্রেরণাগুলি সম্পূর্ণরূপে বোঝা তার নিজস্ব একটি বিজ্ঞান। দীর্ঘ গল্প সংক্ষিপ্ত, যদি আপনি সত্যিই না জানেন যে আপনি কী করছেন, এটি সম্ভবত খুব সম্ভবত এমন কোনও কিছু বিরতি ঘটে যা আপনি এমনকি দূর থেকে চিন্তাও করেননি।

নির্দিষ্ট উদাহরণ

অভিগম্যতা

এনকোডযুক্ত পাঠ্যটি কেবলমাত্র কিছু ফন্টে রেন্ডার করার জন্য বিদ্যমান নয়। এটির ব্যাখ্যাও করা যায়, উদাহরণস্বরূপ, পর্দার পাঠকগণ। এবং কোনও স্ক্রিন রিডারকে অনুমান করার দরকার নেই

𝓽𝓱𝓮

article , 𝓱, and এবং to ভেরিয়েবলের 2 বা অঙ্কের গাণিতিক পণ্য হতে বোঝায় - যা এই অক্ষরগুলির জন্য তৈরি। সর্বোত্তম আচরণটি হ'ল এটি হ'ল এই অক্ষরগুলি বানান, যেমন আক্ষরিকভাবে নিম্নলিখিতগুলি বলা:

গা bold় স্ক্রিপ্ট ছোট টি, গা bold় স্ক্রিপ্ট ছোট এইচ, গা bold় স্ক্রিপ্ট ছোট ই

পরিবর্তে এটি কেবল "" "বলা উচিত নয় কারণ এরপরে এটি গাণিতিক পাঠগুলি সঠিকভাবে পড়তে পারে না যার প্রতীকগুলি সর্বনামযোগ্য শব্দ গঠন করে happen 3

পোর্টেবিলিটি

আপনার পাঠ্যটি যদি আপনার মেশিনে খুব সুন্দরভাবে রেন্ডার করা হয় তবে এর অর্থ এই নয় যে এটি পাঠকের কাছেও থাকবে। সর্বাধিক সুস্পষ্ট উদাহরণটি হ'ল পাঠকের এই অক্ষরগুলিকে সমর্থন করে এমন কোনও ফন্ট নেই বা পাঠ্যটি কোনও সফ্টওয়্যার দ্বারা রেন্ডার করা হয় যা ফ্যালব্যাক ফন্ট সমর্থন করে না। স্বীকার করা, এটি ক্রমশ কম সাধারণ হয়ে উঠছে। যদিও মনে রাখবেন যে ডিসল্লেক্সিক্সের মতো কিছু লোকের জন্য বিশেষ ফন্ট প্রয়োজন যা এই চরিত্রগুলিকে সমর্থন করার সম্ভাবনা কম less

এমনকি যদি পাঠকের যন্ত্রটি কেবল একটি ভিন্ন ফন্ট ব্যবহার করে তবে এটি পাঠ্যটিকে যথেষ্ট কম পাঠযোগ্য করে তুলতে পারে। একটি জন্য প্রথম উদাহরণ , এই 𝓉𝒽ℯ দুটি ভিন্ন ফন্ট সঙ্গে পেশ করা হয়েছে:

Free ফ্রিসারিফ এবং স্টিক্সের সাথে রেন্ডার

ফ্রি সেরিফ পাঠ্যটিকে এমনভাবে রেন্ডার করে যেমন আপনি সম্ভবত পাঠ্য সিমুলেট করার জন্য বিশেষ অক্ষর ব্যবহার করে, যেমন একটি অবিচ্ছিন্ন স্ট্রোকের সাথে হাতের লেখার সিমিউলেট করে when যাইহোক, এই চরিত্রগুলি গাণিতিক প্রতীক হিসাবে ব্যবহারের জন্য তৈরি করা হয়েছে, সংযোগ যা কোনও অর্থ দেয় না। অতএব STIX দ্বারা রেন্ডারিং , যা বিশেষত গাণিতিক উদ্দেশ্যে তৈরি করা হয়েছে, এই অক্ষরগুলি কীভাবে ব্যবহার করা যেতে পারে তার সাথে সামঞ্জস্যপূর্ণ।

একটি দ্বিতীয় উদাহরণ , আপনি বা কোনো কারণে পাঠক italicise "сᴜт мy вᴀʀ" অনুমান করা। একটি ভাল ফন্টের সাথে, আপনি 4 পাবেন :

right мy up সরাসরি এবং তির্যক উপস্থাপন করেছে।  ইটালিক্স "কাম আমার বার" হিসাবে পড়েন

এর কারণ হ'ল ছোট ছোট ক্যাপগুলি (আংশিকভাবে) সিরিলিক বর্ণগুলির সাথে সিমুলেটেড ছিল, এবং সিরিলিক ইটালিকগুলি কখনও কখনও তাদের খাড়া অংশগুলির থেকে খুব আলাদা দেখায় । আবার, এটি সঠিক আচরণ behavior

অনুসন্ধান যোগ্যতা

প্রথম উদাহরণ হিসাবে বিবেচনা করুন 𝒲 চরিত্রটির সাথে আপনি কী যুক্তিসঙ্গত অনুসন্ধান করতে চান 𝒲 (গাণিতিক স্ক্রিপ্ট ডাব্লু )। ধরে নিন যে অনুসন্ধানে দুটি মোড রয়েছে, ডিফল্ট মোড এবং হুবহু মোড (সাধারণত কেস-সংবেদনশীল বলা হয় )। এই চরিত্রটি হওয়া উচিত:

  • যখন অনুসন্ধানের জন্য পাওয়া W বা ওয়াট ডিফল্ট মোডে - যারা লিখে বিরক্ত বা কপি-পেস্ট অনুসন্ধান ক্ষেত্রের মধ্যে বিশেষ অক্ষর চাই না জন্য;

  • সঠিক মোডে for অনুসন্ধান করার সময় পাওয়া গেছে - যারা গাণিতিক ডকুমেন্টে সম্পর্কিত ভেরিয়েবলের উল্লেখ রয়েছে সেখানে অনুসন্ধান করতে চান -

  • যখন 𝓌, অনুসন্ধানের জন্য পাওয়া যায়নি W বা ওয়াট একটি সার্চ উপরে অনুরূপ ভঙ্গ কারণে সঠিক মোডে আছে।

তবে আপনি যদি নিয়মিত পাঠ্য অনুকরণের জন্য এই চরিত্রটি ব্যবহার করেন তবে ডাব্লু বা exact সঠিক মোডে অনুসন্ধান করার সময় এটি পাওয়া উচিত যা উপরের সাথে বিরোধে রয়েছে।

দ্বিতীয় উদাহরণ হিসাবে বিবেচনা করুন যে সিরিয়ালিক অক্ষরগুলি লাতিন অক্ষরগুলি অনুসন্ধান করার সময় এবং তার বিপরীতে যেমন পুরোপুরি ভিন্ন জিনিসগুলি খুঁজে পাওয়া উচিত তা কখনই খুঁজে পাওয়া উচিত নয়। তবে ল্যাটিন ছোট ক্যাপগুলি সিমুলেট করার জন্য যদি সিরিলিক অক্ষর ব্যবহার করা হয় তবে আপনি অনুসন্ধানযোগ্যতা ভঙ্গ করতে না চাইলে আপনার এটি হওয়া দরকার। লোকেরা যদি একটি বিরল লাতিন-বর্ণমালা শব্দের সন্ধান করে তবে তারা প্রচলিত সিরিলিক-বর্ণমালা শব্দের (এবং তদ্বিপরীত) ছোট ছোট ক্যাপগুলির সাথে মিল রেখে অনেকগুলি অব্যর্থ স্টাফ সন্ধান করবে।

একটি সঠিক অনুসন্ধান বিকল্প এই সমস্যাটি সমাধান করতে পারে না, কারণ এটি সেই বর্ণমালাগুলিতে অন্যান্য উদ্দেশ্যে সংরক্ষণ করা হয়।

সাধারণভাবে , স্টাইলযুক্ত ল্যাটিন পাঠকে সিমুলেট করার জন্য বিশেষ অক্ষর ব্যবহার করে ভাঙ্গা না হওয়া (বিকল্পগুলির একটি উন্মাদ পরিমাণ ছাড়াই) কোনও অনুসন্ধান তৈরি করা অসম্ভব।


1  আপনি কি জানেন যে একীকরণের মানগুলির অনিবার্য ব্যর্থতা সম্পর্কে XKCD ? ভাল, ইউনিকোড সফল হয়েছে।
2  বা খালি অপারেটর প্রাসঙ্গিক কনভেনশনে যাই হোক না কেন
3  আমি সচেতন যে আজকাল খুব কম গাণিতিক পাঠগুলি এই এনকোডিং বা এর সাথে সামঞ্জস্যপূর্ণ কিছু সমর্থন করে তবে মূল বিষয়টি হ'ল কোনও দিন তারা আশাবাদী করবে do আপনার ইউনিকোড-আপত্তিজনক পাঠ্যটি এখনও আশেপাশে থাকতে পারে এবং তখন পড়তে পারে।
4  যদি না আপনি ম্যাসেডোনিয়ান বা সার্বিয়ান ভাষায় স্থানীয় না হন তবে এতে আপনি পৃথক হলেও অবাঞ্ছিত ফলাফল পাবেন।


মন্তব্যগুলি বর্ধিত আলোচনার জন্য নয়; এই কথোপকথন চ্যাটে সরানো হয়েছে ।
যাত্রামন গীক

1
তৃতীয় উদাহরণ সম্পর্কে কি? ব্ল্যাকলেটর পাঠ্যটি কেন ইউনিকোডে বনাম কেবল কিছু ফন্টে উপস্থিত রয়েছে?
পোস্টফ্যান 12

2
@ পজফ্যান 12: এটি স্ক্রিপ্ট অক্ষরের মতো - একটি পৃথক গাণিতিক বর্ণমালা হিসাবে ব্যবহৃত হয়। (দ্রষ্টব্য যে এখানে উদাহরণস্বরূপ সংখ্যাটির প্রশ্নের বুলেট পয়েন্টগুলির সাথে কোনও সম্পর্ক নেই))
Wrzlprmft

3
আপনার ছোট-ক্যাপাস উদাহরণটি ধাঁধা / প্রতিযোগিতার পরামর্শ দেয়: একটি বৈধ বাক্যটি অনুসন্ধান করুন যা আলাদা হয়ে যাওয়ার পরে আলাদা বাক্যে পরিণত হয় ... (উভয়ই মানব লাতিন-ভিত্তিক পাঠক দ্বারা ব্যাখ্যা করা হয়, বলুন)
হেগেন ভন ইটজেন

67

কী ভুল হতে পারে? ভাল, আমি এটি দেখতে:

এখানে চিত্র বর্ণনা লিখুন

উইন্ডোজ 7 এ ফায়ারফক্স 50.1.0 এ in

সমস্যা গ্লিফ অনুপস্থিত , একটি মোবাইল ডিভাইসে এই ক্ষেত্রে, ব্যবহারকারী কর্তৃক প্রদত্ত একটি ইমেজ আরও দেখানো হয় ক্রিস কেন্ট মধ্যে একটি মন্তব্য , যা আমি মুণ্ডিত থেকে মাপ পরিবর্তন আছে মূল :

এখানে চিত্র বর্ণনা লিখুন

এবং ব্যবহারকারী oals দয়া করে অন্য একটি উদাহরণ অবদান :

এখানে চিত্র বর্ণনা লিখুন


9
আমাকে? i.stack.imgur.com/lWRAa.png
oals

7
@ লিলিথাল আমি আপডেটগুলি পরীক্ষা বা ইনস্টল না করে আপনি কত বছর অতিবাহিত করেছেন তা দ্বারা আমি মুগ্ধ। আমি বলতে চাইছি, আমি এখনও কিছু ডিভাইসে ফায়ারফক্স 3.5-এর ভিত্তিতে কিছু ব্যবহার করছি, তবে বিষয়টি সম্পর্কে আমার ঠিক পছন্দ নেই (ডিভাইসটি খুব ভাল, তবে কোনও নতুন ব্যবহারযোগ্য ব্রাউজার উপলব্ধ নেই)
mtraceur

16
@ লিলিয়েনথাল 2020 সালে ফায়ারফক্সের প্রধান সংস্করণ সংখ্যার জন্য 64৪-বিট সংখ্যার প্রয়োজন হতে পারে। এর খুব শীঘ্রই, সংস্করণ নম্বরটি আসল প্রোগ্রামের চেয়ে আরও বেশি জায়গা নেবে। মার্কেট শেয়ার পুনরায় অর্জনের প্রয়াসে, ক্রোম সংস্করণ নম্বরগুলিকে সঞ্চয় করার জন্য পুরো গ্রহের প্রয়োজন হবে।
অ্যান্ড্রু মর্টন

2
আপনার ভাবেন যে কতগুলি পরিচিত এবং সক্রিয় সুরক্ষা দুর্বলতাগুলি আপনি এই জাতীয় প্রাচীন ব্রাউজারগুলি ব্যবহার করে নিজেকে প্রকাশ করছেন?
জাচ লিপটন

3
@ জ্যাচ লিপটন: আপনি কি বুঝতে পারছেন যে আমার অগ্রাধিকারের তালিকায় এটি নীচে রয়েছে? # 1 এর এমন কিছু জিনিস রয়েছে যা আমি আসলে ব্যবহার করতে পারি। যদিও ফায়ারফক্সের লোকেরা (এবং আরও অনেকে) একটি নতুন দৃষ্টান্ত গ্রহণ করেছেন: নিরাপত্তাহীনতার মাধ্যমে সুরক্ষা।
জামেএসকিফ

29

আমার এটির সাথে এক্সওয়াই সমস্যা হচ্ছে।

Y এবং X বাকি পাঠ্যের চেয়ে ছোট প্রদর্শিত হবে

এখানে আমরা দেখতে পাই যে ওয়াই এবং এক্স বাকী লেখার চেয়ে ছোট প্রদর্শিত হবে। নির্দিষ্ট জুম স্তরে তারা একই আকার হিসাবে প্রদর্শিত হয়, তবে এটি এই নির্দিষ্ট ফন্টে এই নির্দিষ্ট গ্লাইফগুলির সাথে কোনও সমস্যা প্রকাশ করেছে বলে মনে হয়।


আপনি যা দেখছেন তার জন্য আমি তিনটি সম্ভাব্য ব্যাখ্যা দিতে পারি: 1) খারাপ ইঙ্গিত । 2) একটি ফ্যালব্যাক ফন্ট x এবং y বাদে সমস্ত কিছুর জন্য ব্যবহৃত হয় 3) খারাপ ফন্টের নকশা: ছোট ক্যাপগুলি ছোট হাতের অক্ষরগুলির তুলনায় কিছুটা বড় (যা একটি বৈধ পছন্দ) এর জন্য ডিজাইন করা হয়েছিল এবং তার পরে ফোনেটিক এবং সিরিলিক ইউনিকোড অক্ষরের জন্য ব্যবহৃত হয় - যা ফোনেটিক ব্যবহারের ক্ষেত্রে এই অক্ষরগুলির থেকে ভাল পছন্দ নয় বেসিক ল্যাটিন অক্ষরের সাথে তাল মিলিয়ে চলতে হবে। - যেভাবেই হোক: পয়েন্ট 1) এবং 3) ইউনিকোড অপব্যবহারের কারণে নয়। পয়েন্ট 2) ইতিমধ্যে অন্যান্য উত্তরে সম্বোধন করা হয়েছে।
Wrzlprmft

12
@Wrzlprmft: সংজ্ঞা অনুসারে এগুলি ইউনিকোড অপব্যবহার কারণ ইউনিকোডে ছোট ছোট ক্যাপ নেই। ইউনিকোডে যা আছে তা হ'ল ফোনেটিক বর্ণমালা ব্লক এবং ল্যাটিন এক্সটেন্ডেড-ডি ব্লকের মতো ছোট ক্যাপগুলির মতো দেখতে বর্ণগুলি। বিশেষ করে, তন্ন তন্ন দুই ফোনেটিক ব্লক কিংবা ঠিকানার বিস্তারিত বিবরণ ব্লক চিঠি যে ছোট হাতের অক্ষর মত দেখায় ধারণ এক্স , অতএব আমার অনুমান যে এক্স অন্য কোথাও, সম্ভবত সিরিলিক ব্লক থেকে আসে। পার্থক্যটি 1, 2 বা 3 নয় by দ্বারা সৃষ্টি হয় It's এটি অন্য বর্ণমালার চিঠিটি দ্বারা ঘটে।
slebetman

@slebetman: ছোট- ক্যাপ এক্স শুধু একটি নিয়মিত ছোট হাতের হয় এক্স (আপনি শুধু প্রশ্ন থেকে অক্ষর কপি করে নিজের পরিদর্শন করতে পারেন)। আর ছোট হাতের এক্স , ফোনেটিক অক্ষর দিয়ে একতান কারণ এটি একটি ফোনেটিক চরিত্র হিসাবে ব্যবহার করা হয় হয়েছে। এটির সিরিলিক ছোট হাতের অক্ষরগুলির সমান উচ্চতাও হওয়া উচিত, কারণ আপনি চান না যে একক সিরিলিক শব্দটি লাতিন পাঠ্য (এবং বিপরীতে) থেকে বেরিয়ে আসে।
Wrzlprmft

19
এ "XY সমস্যা" তোমার :) জন্য সম্মত
অ্যান্ড্রু মর্টন

13

ল্যাটিনের মতো ধরণের বর্ণমালার মতো দেখতে ল্যাটিনবিহীন অক্ষরগুলি ব্যবহার করা আপনাকে স্প্যামার, পর্নমোঞ্জার এবং কারা জানেন যে তারা কীভাবে বিভেদযোগ্য যারা তাদের পাঠ্যটি অনিবার্য, অবিস্মরণীয় এবং পুনরুদ্ধারযোগ্য want ("আমি কখনই বলিনি যে এটি নিরাপদ! আমি বলেছিলাম এটি সিগমা-আলফা-ইন্টিগ্রাল-সাইন-এপিসলন! আমার বিরুদ্ধে মামলা করা যাবে না !!!)"

আপনি যদি সেই ক্লাবে স্বাচ্ছন্দ্য বোধ করেন তবে এর জন্য যান।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.