এইচটিএমএল সত্ত্বাগুলি কখন ব্যবহার করা উচিত?


115

এটি কিছু সময়ের জন্য আমাকে বিভ্রান্ত করে চলেছে। ওয়েব বিকাশের ডি-ফ্যাক্টো স্ট্যান্ডার্ড হিসাবে ইউটিএফ -8 এর আবির্ভাবের সাথে আমি নিশ্চিত নই যে কোন পরিস্থিতিতে আমি এইচটিএমএল সত্ত্বাগুলি ব্যবহার করব এবং কোনটির জন্য আমি কেবল ইউটিএফ -8 চরিত্রটি ব্যবহার করব। উদাহরণ স্বরূপ,

  • এম ড্যাশ (-, &emdash;)
  • এম্পারস্যান্ড (এবং, &)
  • 3/4 ভগ্নাংশ (¾, ¾)

দয়া করে এই বিষয়ে আলোকপাত করুন। এটি প্রশংসা করা হবে।


পার্শ্ব নোটে, পিএইচপি-তে এইচটিএমএলটিটিস () কী করবে?
জো ফিলিপস

উত্তর এবং মন্তব্যগুলি পড়লে আমার কাছে মনে হয় একটি বা অন্যের পক্ষে সর্বজনীন নিয়ম এখনও নেই এবং উত্তর এখনও তা নির্ভর করে
মজিদ ফৌলদপুর

উত্তর:


76

যদি আপনার সম্পাদক ইউনিকোড সমর্থন করে তবে আপনাকে সাধারণত এইচটিএমএল অক্ষর সত্তা ব্যবহার করার প্রয়োজন হয় না। সত্তাগুলি কার্যকর হতে পারে যখন:

  • আপনার কীবোর্ড আপনার যে টাইপ করতে হবে তা সমর্থন করে না। উদাহরণস্বরূপ, অনেকগুলি কীবোর্ডের এম-ড্যাশ বা কপিরাইট প্রতীক থাকে না।
  • আপনার সম্পাদক ইউনিকোড সমর্থন করে না (কিছু বছর আগে খুব সাধারণ, তবে সম্ভবত আজ নয়)।
  • আপনি এটি উত্সটিতে কী ঘটছে তা স্পষ্ট করে দিতে চান। উদাহরণস্বরূপ,  কোডটি সম্পর্কিত সাদা স্থানের অক্ষরের চেয়ে পরিষ্কার cle
  • আপনার <, যেমন &, বা এইচটিএমএল বিশেষ অক্ষরগুলি এড়াতে হবে "

1
খুব উপকারী. ধন্যবাদ। আমি অস্বাভাবিক চরিত্রগুলি পেতে একটি সহায়ক প্রোগ্রাম ব্যবহার করি। এটা তোলে popchar বলা হচ্ছে এবং Ergonis দ্বারা তৈরি করা হয় কিন্তু শুধুমাত্র অপারেটিং সিস্টেম এক্স জন্য
allesklar

3
পার্শ্ব দ্রষ্টব্য: উইকিপিডিয়া এখনও &nbsp;প্রকৃত সাদা স্থানের পরিবর্তে আদেশ জারি করে, আংশিক কারণ ফায়ারফক্স U + 00A0 কে U + 0020 আকারে রূপান্তর করে। সুতরাং সেই ক্ষেত্রে সত্তাটি ব্যবহার করা হ'ল ফায়ারফক্সের ব্যবহারকারীরা যখনই এটি সম্পাদনা করে ততবার উত্সটি গোলমেলে না যায় তা নিশ্চিত করার একমাত্র উপায়।
জোয়

2
একটি সূক্ষ্ম সংক্ষিপ্তসার, তবে শেষ পয়েন্টটি সম্পর্কে, এটি <প্রায়শই পালানোর প্রয়োজন হয় না, কখনই নয় >(এবং "কেবলমাত্র বিশিষ্ট মানের মধ্যে খুব কমই পালিয়ে যাওয়া দরকার)।
জুলকা কে। কোরপেলা

& Nbsp রাখার আর একটি কারণ; যাতে আপনি একটি HTML পৃষ্ঠায় একাধিক স্পেস প্রদর্শন করতে পারেন।
zylstra

সুতরাং &amp;সবসময় পরিবর্তে ব্যবহার করা উচিত &? এরজন্য কি কোন কারণ আছে?
প্রমিথিউস

116

আমি যে মন্তব্য পেয়েছি তার উপর ভিত্তি করে আমি এটিকে আরও খানিকটা পর্যবেক্ষণ করেছি। দেখে মনে হয় যে বর্তমানে সেরা অনুশীলন হ'ল এইচটিএমএল সত্ত্বাগুলি ব্যবহার করা এবং তার পরিবর্তে প্রকৃত ইউটিএফ -8 অক্ষর ব্যবহার করা । তালিকাভুক্ত কারণগুলি নিম্নরূপ:

  1. ইউটিএফ -8 এনকোডিংগুলি অক্ষরটির অর্থ কী এবং কীভাবে এটি টাইপ করতে হয় তা বোঝে এবং তাদের পক্ষে সম্পাদনা করা সহজ।
  2. ইউটিএফ -8 এনকোডিংগুলি এইচটিএমএল সত্তা এনকোডিংগুলির মতোই অজ্ঞাতযোগ্য যারা তাদের বোঝে না, তবে দশমিক বা হেক্স এনকোডিংগুলি বোঝার চেয়ে তাদের বিশেষ অক্ষর হিসাবে রেন্ডার করার সুবিধা রয়েছে।

যতক্ষণ না আপনার পৃষ্ঠার এনকোডিংটি যথাযথভাবে ইউটিএফ -8 এ সেট করা থাকে, আপনার এইচটিএমএল সত্তার পরিবর্তে প্রকৃত অক্ষরটি ব্যবহার করা উচিত। আমি এই বিষয়টি সম্পর্কে বেশ কয়েকটি নথি পড়েছি, তবে সর্বাধিক সহায়ক ছিল:

ইউটিএফ -8 থেকে : চরিত্রের এনকোডিংয়ের গোপনীয় নিবন্ধ:

উইকিপিডিয়া হ'ল একটি অ্যাপ্লিকেশনের জন্য একটি দুর্দান্ত কেস স্টাডি যা মূলত আইএসও -8859-1 ব্যবহার করে তবে ইউটিএফ -8 এ স্যুইচ হয়ে যায় যখন এটি বিদেশী ভাষাগুলি সমর্থন করার পক্ষে খুব জটিল ছিল। বটগুলি এখন নিবন্ধগুলির মধ্য দিয়ে যাবে এবং ব্যবহারকারীর বন্ধুত্ব এবং অনুসন্ধানযোগ্যতার স্বার্থে অক্ষর সত্তাকে তাদের যথাযথ অক্ষরগুলিতে রূপান্তর করবে

এই নিবন্ধটি চীনা এনকোডিং জড়িত একটি দুর্দান্ত উদাহরণ দেয়। অলসতার খাতিরে সংক্ষেপিত উদাহরণ এখানে:

হল UTF-8:

這兩個字是甚麼意思

এইচটিএমএল সত্ত্বা :

&#36889;&#20841;&#20491;&#23383;&#26159;&#29978;&#40636;&#24847;&#24605;

ইউটিএফ -8 এবং এইচটিএমএল সত্তা এনকোডিংগুলি উভয়ই আমার কাছে অর্থহীন, তবে ইউটিএফ -8 এনকোডিংটি একটি বিদেশী ভাষা হিসাবে স্বীকৃত এবং এটি সম্পাদনা বাক্সে যথাযথভাবে রেন্ডার করবে। নিবন্ধটি এইচটিএমএল সত্তা-এনকোড সংস্করণ সম্পর্কে নিম্নলিখিতটি বলে:

আমাদের মধ্যে যারা প্রকৃতপক্ষে চরিত্র সত্ত্বা কী জানেন তাদের পক্ষে অত্যন্ত অসুবিধে হয় না, যারা দরিদ্র ব্যবহারকারীদের পক্ষে একেবারে অনির্বচনীয়! এমনকি কিছুটা বেশি ব্যবহারকারী-বান্ধব, "স্বচ্ছ" চরিত্র সত্তা যেমন & থিটা; এইচটিএমএল শিখতে আগ্রহী যারা তাদের মাথা স্ক্র্যাচ করবেন leave অন্যদিকে, তারা যদি সম্পাদনা বাক্সে see দেখেন তবে তারা জানবে যে এটি একটি বিশেষ চরিত্র, এবং সে অনুযায়ী এটি আচরণ করবে, এমনকি যদি তারা নিজেরাই কীভাবে এই চরিত্রটি লিখতে না জানত।

অন্যরা যেমন উল্লেখ করেছে, আপনাকে এখনও সংরক্ষিত এক্সএমএল অক্ষরগুলির জন্য এইচটিএমএল সত্তা ব্যবহার করতে হবে (অ্যাম্পারস্যান্ড, কম-বেশি, এর চেয়ে বেশি)।


এই উত্তরটি দুর্দান্তভাবে সহায়তা করে। তবে আমার নিজের বোঝার জন্য স্পষ্ট করে বলা: &entity;একটি ঘোষিত ইউটিএফ -8 চারসেট সহ এইচটিএমএল ডকুমেন্টের মধ্যে সিনট্যাক্স ব্যবহার সম্পর্কে ঝুঁকিপূর্ণ বা অবৈধ কিছুই নেই , সঠিক? আপনি তালিকাভুক্ত কারণে সাদামাটা ইউটিএফ -8 অক্ষরগুলি আরও ভাল তবে একই ডকুমেন্টে তাদের পাশাপাশি কিছু HTML সত্তা থাকার কোনও সমস্যা নেই?
জ্যাকব ফোর্ড

@ জ্যাকবফোর্ড রাইট, ইউটিএফ -8 অক্ষরের সাথে এইচটিএমএল সত্তাকে মিশ্রণ ঝুঁকিপূর্ণ বা অবৈধ নয়, উত্সটি পড়ার জন্য কেবল সম্ভাব্য বিভ্রান্তিকর।
উইলিয়াম ব্রেন্ডেল

5

আমি এমন অক্ষরগুলির জন্য ইউটিএফ -8 ব্যবহার করব না যা সহজেই দৃষ্টিভঙ্গিতে বিভ্রান্ত হয়। উদাহরণস্বরূপ, একটি এমড্যাশকে বিয়োগ থেকে বিশেষত, বা বিশেষত একটি স্থান থেকে অবিচ্ছেদী স্থানকে আলাদা করা শক্ত। এই অক্ষরগুলির জন্য, অবশ্যই সত্ত্বা ব্যবহার করুন।

এমন অক্ষরগুলির জন্য যা সহজেই দৃষ্টিভঙ্গিভাবে বোঝা যায় (যেমন উপরের চীনা উদাহরণগুলি), এগিয়ে যান এবং আপনার পছন্দ হলে ইউটিএফ -8 ব্যবহার করুন।


5

ব্যক্তিগতভাবে আমি দীর্ঘদিন থেকে utf-8 এ সবকিছু করি, তবে, এইচটিএমএল পৃষ্ঠায় আপনাকে সর্বদা (>>) এর চেয়ে বড় এবং তারপরে (<) অক্ষরগুলিকে তাদের সমতুল্য সত্তায় রূপান্তর করতে হবে, & amp ;, & gt; এবং & lt;

এছাড়াও, আপনি যদি utf-8 টেক্সট ব্যবহার করে কিছু প্রোগ্রামিং করতে চান, তবে দেখার জন্য কয়েকটি জিনিস রয়েছে।

  • সত্তাগুলি ব্যবহার করার সময় এক্সএমএলকে বৈধতা দেওয়ার জন্য কিছু অতিরিক্ত লাইন দরকার।
  • কিছু লাইব্রেরি utf-8 এর সাথে দুর্দান্ত খেলতে পারে না। উদাহরণস্বরূপ, কিছু লিনাক্স ডিস্ট্রিবিউশনে পিএইচপি তাদের নিয়মিত এক্সপ্রেশন লাইব্রেরিতে utf-8 এর জন্য সম্পূর্ণ সমর্থন বাদ দেয়।
  • এইচটিএমএল সত্তা ব্যবহার করে এমন পাঠ্যে অক্ষরের সংখ্যা সীমাবদ্ধ করা আরও শক্ত কারণ একক সত্তা অনেকগুলি অক্ষর ব্যবহার করে। এছাড়াও সর্বদা অর্ধেক সত্তা কেটে যাওয়ার ঝুঁকি রয়েছে।

এটি খুব ছোটখাটো বিষয়, তবে (>) এর চেয়ে বড় (>) এর চেয়ে কম এনকোডের প্রয়োজন নেই।
কোডমনকি

4

সংস্থাগুলি আপনাকে মস্তিষ্ক-মৃত ক্লায়েন্টগুলির সাথে কিছু সামঞ্জস্যতা কিনতে পারে যা সঠিকভাবে এনকডিংগুলি বোঝে না। আমি বিশ্বাস করি না যে এতে কোনও বর্তমান ব্রাউজার রয়েছে, তবে আপনি কখনই জানেন না যে অন্যান্য ধরণের প্রোগ্রামগুলি আপনাকে আঘাত করতে পারে।

যদিও আরও দরকারী, এইচটিএমএল সত্তা আপনাকে নিজের ত্রুটি থেকে রক্ষা করে: আপনি যদি সার্ভারে কোনও কিছুকে ভুলভাবে কনফিগার করেন এবং আপনি এইচটিটিপি শিরোনামের সাথে কোনও পৃষ্ঠা পরিবেশন করে থাকেন যা এটি বলে ISO-8859-1এবং এটি একটি METAট্যাগ বলে যে এটি UTF-8অন্তত আপনার & mdash; এস সর্বদা কাজ করবে।


5
আপনি বিপরীত যুক্তিটি তৈরি করতে পারেন - যদিও &mdashশিরোনামটি সঠিকভাবে দেখানো হয়েছে এমনকি যদি শিরোনামগুলি ভুল কনফিগার করা থাকে তবে সমস্যাটি সনাক্ত করা আরও কঠিন করে তোলে ।
পেক্কা

4

এইচটিএমএল সত্তা কার্যকর যখন আপনি এমন একটি সামগ্রী তৈরি করতে চান যা (বেশ কয়েকটি) বিভিন্ন এনকোডিং সহ পৃষ্ঠাগুলিতে অন্তর্ভুক্ত (গতিশীল) হতে চলেছে। উদাহরণস্বরূপ, আমাদের কাছে সাদা লেবেল সামগ্রী রয়েছে যা আইএসও -8859-1 এবং ইউটিএফ -8 এনকোডযুক্ত ওয়েব পৃষ্ঠাগুলির মধ্যে অন্তর্ভুক্ত করা হয়েছে ...

যদি ইউটিএফ -8 থেকে চরিত্র সেট রূপান্তরটি এত বড় অবিশ্বাস্য গন্ডগোল না হয়ে থাকে (আপনি সর্বদা কিছু অক্ষর এবং কিছু সরঞ্জামের উপর ঝাঁকুনি দেন যা সঠিকভাবে রূপান্তর করে না), ইউটিএফ -8 -কে মানক করার উপায় হবে।


2

যদি আপনার পৃষ্ঠাগুলি যথার্থভাবে utf-8 এ এনকোড করা থাকে তবে আপনার এইচটিএমএল সত্ত্বার প্রয়োজন হবে না, কেবল আপনার সরাসরি অক্ষরগুলি ব্যবহার করুন।


3
আমি মনে করি আপনার এখনও সংরক্ষিত অক্ষরগুলি এনকোড করার জন্য তাদের প্রয়োজন হবে।
rmeador

@ আরমিডোর - আমি এর সাথে একমত
ওটিভিও ডেসিও

2

পূর্ববর্তী সমস্ত উত্তর আমার কাছে উপলব্ধি করে।

তদতিরিক্ত: এটি বেশিরভাগ সম্পাদকের উপর নির্ভর করে যা আপনি ব্যবহার করতে চান এবং নথির ভাষা। সম্পাদক হিসাবে ন্যূনতম প্রয়োজন হিসাবে এটি নথির ভাষা সমর্থন করে supports এর অর্থ হ'ল যদি আপনার পাঠ্যটি জাপানি ভাষায় হয় তবে এমন কোনও সম্পাদক ব্যবহার করুন যা তাদের দেখায় না (যেমন দস্তাবেজের জন্য কোনও সত্তা নেই) ware যদি এর ইংরেজি হয় তবে আপনি এমনকি কোনও পুরানো ভিএম-এর মতো সম্পাদকও ব্যবহার করতে পারেন এবং কেবলমাত্র আপেক্ষিক ক্ষেত্রে খুব কমই অনুলিপি ব্যবহার করতে পারেন; এবং বন্ধুরা. অবশ্যই: & gt; > এবং অন্যান্য এইচটিএমএল-বিশেষের জন্য এখনও পলায়ন দরকার। এমনকি অন্যান্য লাতিন -১ টি ভাষার সাথে (জার্মান, ফরাসী ইত্যাদি) লেখা you এমন একটি ব্যাথা যা আপনি জানেন যেখানে ...

এছাড়াও, আমি ব্যক্তিগতভাবে অদৃশ্য চরিত্রগুলির জন্য সত্ত্বা লিখি এবং সেগুলি যা স্ট্যান্ডার্ড-অ্যাস্কির অনুরূপ এবং তাই সহজেই বিভ্রান্ত হয়। উদাহরণস্বরূপ, u1173 রয়েছে (কিছু চরসেটে ড্যাশের মতো দেখাচ্ছে) বা u1175, যা উল্লম্ব বারের মতো দেখাচ্ছে। আমি যে কোনও ক্ষেত্রে তাদের সত্তা ব্যবহার করব।


& gt; > এর জন্য প্রয়োজন হয় না, আপনি কেবল> ব্যবহার করতে পারেন। & lt; যদিও <এর জন্য প্রয়োজন।
কোডমনকি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.