ইউনিকোড, ইউটিএফ, এএসসিআইআই, এএনএসআই ফর্ম্যাট পার্থক্য


351

মধ্যে পার্থক্য কি Unicode, UTF8, UTF7, UTF16, UTF32, ASCII, এবং ANSIএনকোডিং?

কীভাবে এই প্রোগ্রামারদের জন্য সহায়ক?


ভাল সাইট উল্লেখ করতে হবে: msdn.microsoft.com/en-us/library/dd374081(VS.85).aspx
RamSri



উত্তর:


470

আপনার তালিকা নীচে যাচ্ছে:

  • " ইউনিকোড " কোনও এনকোডিং নয়, যদিও দুর্ভাগ্যক্রমে, প্রচুর ডকুমেন্টেশন এটিকে নির্দিষ্টভাবে ইউনিকোডের যে এনকোডিং দ্বারা নির্দিষ্ট সিস্টেমটি ডিফল্টরূপে ব্যবহার করে তা উল্লেখ করার জন্য যথাযথভাবে এটি ব্যবহার করে। উইন্ডোজ এবং জাভাতে, এর অর্থ প্রায়শই ইউটিএফ -16; অন্যান্য অনেক জায়গায় এর অর্থ ইউটিএফ -8। যথাযথভাবে, ইউনিকোডটি বিমূর্ত অক্ষরটিকে সেট করে, কোনও নির্দিষ্ট এনকোডিংকে নয়।
  • ইউটিএফ -16 : "কোড ইউনিট" প্রতি 2 বাইট এটি নেট .NET এ স্ট্রিংগুলির স্থানীয় ফর্ম্যাট এবং সাধারণত উইন্ডোজ এবং জাভাতে। বেসিক বহুভাষিক প্লেন (বিএমপি) এর বাইরে মানগুলি সারোগেট জোড়া হিসাবে এনকোড করা হয়। এই ব্যবহার করা হয় অপেক্ষাকৃত কদাচিৎ ব্যবহৃত, কিন্তু এখন অনেক ভোক্তা অ্যাপ্লিকেশন সমর্থন, ইমোজির করার জন্য অ বিএমপি অক্ষরের সচেতন হতে হবে।
  • ইউটিএফ -8 : পরিবর্তনশীল দৈর্ঘ্যের এনকোডিং, কোড পয়েন্ট অনুসারে 1-4 বাইট। ASCII মানগুলি 1 বাইট ব্যবহার করে ASCII হিসাবে এনকোড করা হয়।
  • ইউটিএফ -7 : সাধারণত মেল এনকোডিংয়ের জন্য ব্যবহৃত হয়। আপনার যদি প্রয়োজন হয় এবং আপনি মেল করেন না এমন সম্ভাবনা রয়েছে, আপনি ভুল wrong (এটি কেবলমাত্র নিউজগ্রুপ ইত্যাদিতে লোকেরা - মেলের বাইরে পোস্ট করার আমার অভিজ্ঞতা, এটি সত্যই বহুল ব্যবহৃত হয় না))
  • ইউটিএফ -32 : কোড পয়েন্টে 4 বাইট ব্যবহার করে নির্দিষ্ট প্রস্থের এনকোডিং। এটি খুব দক্ষ নয়, তবে বিএমপির বাইরে জীবনকে সহজ করে তোলে। Utf32Stringআমার মিস্কিল লাইব্রেরির অংশ হিসাবে আমার একটি নেট নেট ক্লাস রয়েছে , আপনার যদি এটি কখনও চাওয়া উচিত। (এটি খুব ভালভাবে পরীক্ষা করা হয়নি, মনে রাখবেন))
  • এএসসিআইআই : কেবল নীচের b টি বিট ব্যবহার করে একক বাইট এনকোডিং। (ইউনিকোড কোড পয়েন্ট 0-127।) কোনও অ্যাকসেন্ট ইত্যাদি etc.
  • এএনএসআই: এএনএসআই এনকোডিংয়ের কোনও স্থির নেই - তাদের প্রচুর পরিমাণ রয়েছে। সাধারণত যখন লোকেরা "এএনএসআই" বলে তখন তাদের অর্থ "আমার সিস্টেমের জন্য ডিফল্ট লোকেল / কোডপেজ" যা এনকোডিং D ডিফল্টের মাধ্যমে প্রাপ্ত হয় এবং প্রায়শই উইন্ডোজ -১২২২ হয় তবে অন্যান্য লোকেল হতে পারে।

সেখানে আরো আমার ইউনিকোড পৃষ্ঠা এবং ইউনিকোড সমস্যার ডিবাগ করার জন্য টিপস

কোডের অন্যান্য বড় রিসোর্স হ'ল ইউনিকোড.অর্গ যা আপনার মাধ্যমে কাজ করতে সক্ষম হওয়ার চেয়ে আরও বেশি তথ্য রয়েছে - সম্ভবত সবচেয়ে কার্যকর বিটটি কোড চার্ট


6
মাইক্রোসফ্টের 8-বিট কোড পৃষ্ঠাগুলিতে প্রয়োগ করার সময় "এএনএসআই" শব্দটি একটি মিসনোমার। এএনএসআই মানকতার জন্য জমা দেওয়া খসড়াগুলির ভিত্তিতে এগুলি তৈরি হয়েছিল, কিন্তু এএনএসআই নিজেই এগুলি কখনও মানসম্মত করেনি। উইন্ডোজ-1252 (কোড পৃষ্ঠাটি সাধারণত "এএনএসআই" হিসাবে পরিচিত) ISO 8859-1 (ল্যাটিন -১) এর সমান, উইন্ডোজ -১২২২ 0x80..0x9F পরিসরে মুদ্রণযোগ্য অক্ষর রয়েছে, যেখানে আইএসও 8859-1 এই ব্যাপ্তিতে নিয়ন্ত্রণের অক্ষর রয়েছে। ইউনিকোডের সেই ব্যাপ্তিতে নিয়ন্ত্রণের অক্ষরও রয়েছে। en.wikedia.org/wiki/Windows_code_page
কিথ থম্পসন

1
@ jp2code: আমি করব না - তবে আপনাকে "ওয়েব সার্ভার থেকে HTTP এর মাধ্যমে ফেরত পাঠানো সামগ্রী" এবং "ইমেলের মাধ্যমে প্রেরিত সামগ্রী" এর মধ্যে পার্থক্য করা দরকার। এটি ওয়েব পৃষ্ঠার সামগ্রী নয় যা ইমেল প্রেরণ করে - এটি এর পিছনে অ্যাপ্লিকেশন, সম্ভবত pres ওয়েব সামগ্রীটি ইউটিএফ -8 এ সেরা হবে; মেল সামগ্রীটি ইউটিএফ -7 এ থাকতে পারে, যদিও আমি সন্দেহ করি যে এই দিনগুলিতে এটি ইউটিএফ -8 এ রাখা ভাল।
জন স্কিটি

2
ইউটিএফ -16, আইএমএইচও-র জন্য আমি বলব "কোড প্রতি ইউনিট 2 বাইট" যেহেতু বিএমপির বাইরের একটি কোড পয়েন্ট 2 কোড ইউনিট (4 বাইট) হিসাবে সারোগেট জোড়ায় এনকোড করা হবে।
লুডোভিক কিউটি

1
ইউটিএফ -16 এলএ (। নেট এর মধ্যে) এবং বিও এর ধারণার পাশাপাশি পার্থক্যগুলি মিস করে।
মার্টেন বোদেউয়েস

2
@ অ্যান্ড্রু: না, কোনও (সাধারণ) এনকোডিং মার্কার নেই। উইন্ডোজ 1252 ইউনিকোড বিওএমের প্রতিনিধিত্ব করতে পারে না এবং এটি কোনও অর্থই হবেনা কারণ এটি যেভাবেই কেবল প্রতি বাইট-বাইট-বাইট এনকোডিং।
জন স্কিটি

68

চরিত্রের এনকোডিংগুলি আপনাকে শুরু করার জন্য কিছু পাঠ্য: সফটওয়্যারটির জোল: সম্পূর্ণ ন্যূনতম প্রতিটি সফ্টওয়্যার বিকাশকারী অবশ্যই, ইউনিকোড এবং চরিত্রের সেটগুলি সম্পর্কে ইতিবাচকভাবে অবশ্যই জানতে হবে (কোনও বাহানা নেই!)

যাইহোক - এএসপি.এনইটি এর সাথে কিছু করার নেই। এনকোডিংগুলি সর্বজনীন।


7
নিবন্ধটি লেখার 6 বছর পরে এখানে উত্তর দেওয়া হয়েছে। পোস্টটি লেখা হওয়ার 8 বছর পরে এটি পড়েছি। 14 বছর পরে এবং এটি এখনও একটি ভাল পড়া। এটি আমার জীবনের অর্ধেকেরও বেশি। অবিশ্বাস্য।
ডেভ নাইস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.