একটি চরিত্রে কয়টি বিট বা বাইট রয়েছে? [বন্ধ]


96

"চরিত্র" প্রতি কয়টি বিট বা বাইট রয়েছে?


4
আপনার প্রশ্ন এবং শিরোনাম বিভিন্ন জিনিস জিজ্ঞাসা। যাইহোক, আমি আপনাকে বুঝতে পারি না, আপনি আরও ব্যাখ্যা করতে পারেন?
galymzhan

হ্যাঁ, আমিও সে সম্পর্কে নিশ্চিত ছিলাম না। তবে বাইট তার শিরোনামের সাথে আরও সামঞ্জস্যপূর্ণ। একটি বিট মধ্যে অক্ষরের পরিমাণ সামান্য বোঝা তোলে, কিন্তু একটি চরিত্রে কত বিট আরও বোধগম্য হয়। যদিও এটি উল্লিখিত হিসাবে এটি প্রসঙ্গে প্রয়োজন।
Skurmedel

4
@ স্কুরমেডেল: আপনি কীভাবে চিত্রিত করবেন? শিরোনামটি "বিটস "ও বলেছিল।
কোডি গ্রে

@ কোডি গ্রে: আমার সম্পাদিত উত্তরটি দেখুন। তার ট্যাগগুলি বাইট বলে, তাই আমি অনুভব করেছি এটি টাইপো ছিল। আমি যদিও ভুল হতে পারে।
স্কুরমেডেল

@ স্কুরমেডেল: আমি বুঝতে পারি না ... আপনি প্রশ্নের উত্তর পোস্ট করেননি। এবং হ্যাঁ, আমি আগে ট্যাগটি লক্ষ্য করিনি। তবে আমি এখনও ভাবতে আগ্রহী যে 2/3 হ'ল 1/3 এর চেয়ে ভাল ম্যাচ।
কোডি গ্রে

উত্তর:


200

এটি নির্ভর করে যে চরিত্রটি কী এবং কী এনকোডিং এতে রয়েছে:

  • 8-বিট ASCII এনকোডিংয়ের একটি ASCII অক্ষরটি 8 বিট (1 বাইট) হয় যদিও এটি 7 বিটে ফিট করতে পারে।

  • আইএসও -8859-1 এনকোডিংয়ের একটি ISO-8895-1 অক্ষরটি 8 বিট (1 বাইট)।

  • ইউটিএফ -8 এনকোডিংয়ের একটি ইউনিকোড অক্ষর 8 বিট (1 বাইট) এবং 32 বিট (4 বাইট) এর মধ্যে থাকে।

  • ইউটিএফ -16 এনকোডিংয়ের একটি ইউনিকোড অক্ষর 16 (2 বাইট) এবং 32 বিট (4 বাইট) এর মধ্যে থাকে, যদিও বেশিরভাগ সাধারণ অক্ষর 16 বিট নেয়। এটি অভ্যন্তরীণভাবে উইন্ডোজ দ্বারা ব্যবহৃত এনকোডিং।

  • ইউটিএফ -32 এনকোডিংয়ের একটি ইউনিকোড অক্ষর সর্বদা 32 বিট (4 বাইট) থাকে।

  • ইউটিএফ -8 এ একটি ASCII চরিত্রটি 8 বিট (1 বাইট), এবং ইউটিএফ -16 - 16 বিট।

  • ISO-8895-1 (0xA0-0xFF) এর অতিরিক্ত (নন-এএসসিআইআই) অক্ষরগুলি ইউটিএফ -8 এবং ইউটিএফ -16 এ 16 বিট নেবে।

এর অর্থ দাঁড়ায় যে কিছুটা মধ্যে 0.03125 এবং 0.125 অক্ষর রয়েছে।


সকেট, এনকোডিং, পাঠ্য ইত্যাদির সাথে ডিল করার সময় এই উত্তরটি অনেক সাহায্য করে।
মারিও মাইরেলস

17

একটি বাইটে 8 টি বিট রয়েছে (সাধারণত উইন্ডোজে কথা বলা হয়)।

তবে, আপনি যদি অক্ষরগুলি নিয়ে কাজ করে থাকেন তবে এটি চরসেট / এনকোডিংয়ের উপর নির্ভর করবে। ইউনিকোডের চরিত্রটি 2 বা 4 বাইট হতে পারে, তাই এটি 16 বা 32 বিট হতে পারে, অন্যদিকে উইন্ডোজ -১২২২ কখনও কখনও ভুলভাবে এএনএসআই নামে ডাকা হয় মাত্র ১ বাইট তাই ৮ বিট।

উইন্ডোজ এবং কিছু অন্যান্যদের এশীয় সংস্করণে পুরো সিস্টেমটি ডাবল-বাইটে চলে, সুতরাং একটি অক্ষরটি 16 বিট।

সম্পাদিত

মাত্তিওর মন্তব্য অনুসারে, উইন্ডোজের সমস্ত সমসাময়িক সংস্করণগুলি অক্ষর অনুসারে অভ্যন্তরীণভাবে 16-বিট ব্যবহার করে।


কিছু লিগ্যাসি অ্যাপ্লিকেশন এখনও স্থানীয় কোডপেজ সহ 1 বাইট চর ব্যবহার করে তবে উইন্ডোজের সমস্ত এনটি সংস্করণ অভ্যন্তরীণভাবে 2-বাইট অক্ষর (এনটি 4 পর্যন্ত ইউসিএস -2, উইন্ডোজ 2000 থেকে ইউটিএফ -16, হিসাবে সংরক্ষণ করা আছে wchar_t) দিয়ে চালিত হয় , কেবল এশীয় নয়, এবং তাই সমস্ত নতুন অ্যাপ্লিকেশন করা উচিত। (পরিবর্তে লিনাক্সে, এটি সম্পূর্ণ আলাদা গল্প, যেহেতু সাধারণত ইউটিএফ -8 পুরো সিস্টেম জুড়ে ব্যবহৃত হয়)
মাত্তিও ইটালিয়া

@ মাত্তিও: নোট করুন যে উইন্ডোজে ডাবল-বাইট ইউনিকোডের মতো একই জিনিস নয়। তথ্যসূত্র
কোডি গ্রে

@ কোডি গ্রে: হ্যাঁ, সাধারণত আপনি যখন এটির উত্তরাধিকারী এশীয় জিনিসগুলি এনকোডিং করে "ডাবল-বাইট" পড়েন এবং সেগুলি একাধিক হিসাবে সংরক্ষণ করা হয় char, তবে ইউনিকোড স্ট্রিংগুলি wchar_tটাইপটি ব্যবহার করে সংরক্ষণ করা হয় । যাইহোক, এনটি শুরু wchar_tকরার সময় সার্োগেট জোড়গুলি এড়াতে যথেষ্ট ছিল, তবে এখন এটি ইউটিএফ -১ 16 এমনকি wchar_tস্ট্রিংগুলিতেও ভেরিয়েবল-দৈর্ঘ্যের অক্ষর থাকতে পারে, তাই উইন্ডোজে একটি ইউনিকোড অক্ষর 2 থেকে 4 বাইট (1 বা 2) পর্যন্ত নিতে পারে wchar_t)।
মাত্তেও ইটালিয়া

@ মাট্টিও: হ্যাঁ, আমি আপনার সাথে একমত আমি মনে করি আপনি প্রথম মন্তব্য সম্পাদনা করার আগে আমি এমন কিছু দেখেছি যা আলাদাভাবে প্রস্তাব পেয়েছিল এবং আমি যখন আমার এটি লিখেছিলাম। উইন্ডোজের সমস্ত সংস্করণের জন্য ইউটিএফ -16 ইউনিকোড স্ট্রিংগুলি অভ্যন্তরীণভাবে ব্যবহৃত হয়।
কোডি গ্রে

@ কোডি গ্রে: আমি আমার মন্তব্যগুলিকে কিছুটা বেশি সম্পাদনা করতে চাই, এটি বিভ্রান্তির দিকে নিয়ে যায়:)
মাত্তিও ইটালিয়া
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.