কোন অক্ষর এনকোডিংগুলি পমিক্স দ্বারা সমর্থিত?


11

POSIX যেমন সরঞ্জামের আচরণ সংজ্ঞায়িত grep, awk, sed, ইত্যাদি পাঠ্য ফাইল বিরুদ্ধে যা হবে। যেহেতু এটি একটি পাঠ্য ফাইল, আমি মনে করি অক্ষর এনকোডিংয়ের সমস্যা (গুলি) রয়েছে।

প্রশ্ন:

  • পসিক্স দ্বারা সমর্থিত অক্ষর এনকোডিংগুলি কী? (বা, কোন এনকোডিংয়ের পাঠ্য ফাইলগুলি পসিক্স কমপায়েন্ট সিস্টেমগুলি পরিচালনা করতে পারে?)

উত্তর:


19

পসিক্সের দ্বারা নির্ধারিত কোনও নির্দিষ্ট অক্ষর এনকোডিং নেই। একটি স্থিত অবস্থানের একমাত্র অক্ষর নাল, যা অবশ্যই 00 হবে।

পসিক্স যা যা প্রয়োজন তা হ'ল তার পোর্টেবল চরিত্র সেট থেকে সমস্ত অক্ষর বিদ্যমান। পোর্টেবল ক্যারেক্টার সেটটিতে প্রিন্টযোগ্য এএসসিআইআই অক্ষর, স্পেস, বিইএল, ব্যাকস্পেস, ট্যাব, ক্যারেজ রিটার্ন, নিউলাইন, উল্লম্ব ট্যাব, ফর্ম ফিড এবং নাল রয়েছে। সেগুলি বাদে কোথায় বা কীভাবে এনকোড করা হয়েছে তা নির্দিষ্ট করা হয়নি:

  • এগুলি সবই একক বাইট (8 বিট)।
  • নাল সমস্ত বিট শূন্য সঙ্গে প্রতিনিধিত্ব করা হয়।
  • 0-9 অঙ্কগুলি ক্রম অনুসারে প্রদর্শিত হয় appear

এটি অক্ষরগুলির উপস্থাপনের জন্য অন্য কোনও বিধিনিষেধ আরোপ করে না, সুতরাং একটি অনুকরণকারী সিস্টেম সেই অক্ষরের কোনও উপস্থাপনা এবং সংযোজন অন্য কোনও অক্ষর সহ এনকোডিংগুলিকে সমর্থন করতে পারে।

একই সিস্টেমের বিভিন্ন লোকেলে .এবং /, এবং বাদে এই অক্ষরগুলির বিভিন্ন উপস্থাপনা থাকতে পারে

যদি কোনও অ্যাপ্লিকেশন এমন কোনও লোকেল ব্যবহার করে যেখানে অক্ষর এনকোডিংগুলি পৃথক হয়, বা অ্যাপ্লিকেশন থেকে ব্যবহৃত লোকেলগুলি থেকে পৃথক এনকোডিং রয়েছে এমন কোনও লোকেল ব্যবহার করে অ্যাপ্লিকেশন থেকে ডেটা অ্যাক্সেস করে তবে ফলাফল অনির্দিষ্ট।

সমস্ত POSIX- অনুবর্তী সিস্টেম একই পদ্ধতিতে চিকিত্সা করার জন্য প্রয়োজনীয় ফাইলগুলি হ'ল ফাইলগুলি সম্পূর্ণ নাল বাইট সমন্বিত থাকে। পাঠ্য হিসাবে চিকিত্সা করা ফাইলগুলি পিসিএসের নতুন লাইনের চরিত্রের এনকোডিংয়ের প্রতিনিধিত্ব করে তাদের লাইনগুলি সমাপ্ত করে


5

পসিক্স স্ট্যান্ডার্ডটি একটি পসিক্স স্থানীয় লোকালকে পরিচয় করে, যা ASCII (POSIX বেস সংজ্ঞা §7.3.2) এর অক্ষরের জন্য সেট ASCII অক্ষরের সমান ক্রমযুক্ত।

তদুপরি, যে সিস্টেমে প্রতীকী ধ্রুবক POSIX2_LOCALEDEFসংজ্ঞায়িত করা হয়েছে (যা এক্সএসআই-কনফরম্যান্ট সিস্টেমগুলির জন্য সংজ্ঞায়িত করা হবে এবং এর মাধ্যমে পরীক্ষা করা যেতে পারে getconf POSIX2_LOCALEDEF), সিস্টেমটি localedefপসিক্স বেসে উল্লিখিত বর্ণনামূলক ইউটিলিটি এবং লোকেল সংজ্ঞা ব্যবহার করে নতুন লোকেল তৈরির জন্য সমর্থন করে সংজ্ঞা §7.3।

পসিক্স স্থানীয় সংজ্ঞাগুলি তাদের ইউনিকোড মান অনুসারে অক্ষরগুলি নির্দিষ্ট করে না সমর্থন করে, এখানে নতুন মান রয়েছে যেমন আইএসও / আইসিআর টিআর 14652 ( আইএসও / আইসিসি জেটিসি 1 / এসসি 22 / ডাব্লুজি 20 হোম এ উপলব্ধ ) এবং আইএসও টিআর 30112 (খসড়াটি উপলভ্য আইএসও / আইইসি জেটিসি 1 / এসসি 35 / ডাব্লুজি 5 হোম ) যা আইএসও / আইসিসি টিআর 14652কে অচল করে দেয়।

অন্যান্য সম্পর্কিত মান হ'ল আইএসও 14651 ( আইএসও আইটিটিএফ সাইটে উপলভ্য ) এবং ইউনিকোড কোলেশন আলগোরিদিম (ইউসিএ, ইউনিকোড ইউটিএস # 10)

ইউনিকোড :: তীব্র লড়াই CPAN এ পার্ল মডিউল বিভিন্ন ইউনিক্স ইউটিলিটি ইউনিকোড নতুন করে লেখা হয় অন্তর্ভুক্ত করা হয়েছে। সেড এবং অ্যাজক স্ক্রিপ্টস এবং ওয়ান-লাইনারগুলি (অপেক্ষাকৃত সহজে) ইউনিকোড সমর্থনের জন্য পারলে পুনরায় লেখা যেতে পারে।

জন্য glibc জন্য, কম্পোনেন্ট localedata জন্য Bugzilla এন্ট্রি বিভিন্ন লোকেল অবস্থা একটি দৃশ্য প্রদান করতে পারেন।


3
নোট করুন যে POSIX লোকেল অর্ডারটি আসল এনকোডিং উপস্থাপনার পরিবর্তে মিলন অর্ডারকে ASCII এর সাথে মিলিয়ে সংজ্ঞা দেয় ।
মাইকেল হোমার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.