ইউনিকোড এনকোডিংটি কী ব্যবহৃত হয় তা ওএস ভিত্তিক নয়।
এমনকি উইন্ডোজ নোটপ্যাড.এক্সই-র বিকল্পগুলি তালিকাভুক্ত রয়েছে- (আমি নোটপ্যাডের অর্থ ব্র্যাককেটগুলিতে রেখে দেব) এএনএসআই (ইউনিকোড নয়), ইউনিকোড (নোটপ্যাড মানে ইউনিকোড এলই), ইউনিকোড বিগ এন্ডিয়ান (বিই), ইউটিএফ -8
এএনএসআই ইউনিকোড নয় এটির মধ্যে খুব সীমিত সংখ্যক চরিত্র জড়িত তাই এটি বাদ দেওয়া যাক।
তবে দেখুন নোটপ্যাডও LE, বা BE, বা UTF-8 করতে পারে
এবং নোটপ্যাড একদিকে রেখে, ইউটিএফ -8 বিওএম এর সাথে বা তার সাথে থাকতে পারে।
এবং আমি সাইগউইনের সাথে উইন্ডোজ ব্যবহার করি যদিও উইন্ডোজ পোর্টগুলি ভাল \ r \ n করতে পারে এমনকি আপনি নির্দিষ্ট করেও \ n সেড করতে দেখেছেন।
ইউনিকোড কোনও নির্দিষ্ট ওএস ব্যবহার করে কী এনকোডিং করে তার কোনও নিয়ম নেই। এটি যদি খুব নমনীয় ওএস না হত।
পার্থক্যটি দেখতে সত্যই সফ্টওয়্যারটি জানুন, সফ্টওয়্যারটির কোনও অংশ এনকোডিং কী ব্যবহার করে বা অফার করে।
সাইগউইন এবং এক্সএক্সডি, এবং / অথবা একটি হেক্স সম্পাদক এবং ফাইলটির অভ্যন্তরে কী রয়েছে তা দেখুন। কোনও ফাইল সনাক্ত করতে সহায়তা করতে 'ফাইল' কমান্ডটি ব্যবহার করুন। তারপরে আপনি আসলে দেখতে পাবেন ইউটিএফ 16 বিট এলই কী। ইউটিএফ 16 বিবিটি বিই কি। ইউটিএফ -8 কী (এবং ইউটিএফ -8 কোনও বিওএম এর সাথে বা তার সাথে থাকতে পারে)।
কখনও কখনও আপনি নোটপ্যাডকে ইউনিকোড হিসাবে সংরক্ষণ করতে বলতে পারেন (যার মাধ্যমে নোটপ্যাড মানে ইউনিকোড 16 বিট সামান্য এন্ডিয়ান), এবং এটি হবে না। তবে আড়িয়াল ইউনিকোডের মতো একটি ইউনিকোড ফন্ট চয়ন করুন, এবং চরম্যাপ থেকে কিছু ইউনিকোড অক্ষরে অনুলিপি করুন এবং এটি হবে .. এবং নোটপ্যাড বা যা কিছু সফ্টওয়্যার করছে তা দেখার একটি ভাল উপায় হ'ল কোনও ফাইলের হেক্স দেখে
C:\asdf>notepad.exe a.a
C:\asdf>file a.a
a.a; Little-endian UTF-16 Unicode text, with no line terminators
C:\asdf>type a.a
aaa慡ൡ <-- though displayed aaa followed by some boxes in my cmd window
C:\asdf>
C:\asdf>xxd a.a
0000000: fffe 6100 6100 6100 6161 610d ..a.a.a.aaa.
C:\asdf>
^^ The portion of the byte that stores the 61 is the lower value portion which with LE is stored first.
ডিডি কমান্ড (উইন্ডোজগুলির মধ্যে সাইগউইন থেকে চালানো একটি * নিক্স কমান্ড) এটি স্যুইচ করতে পারে
C:\asdf>xxd -p a.a
fffe6100610061006161610d
C:\asdf>file a.a
a.a; Little-endian UTF-16 Unicode text, with no line terminators
C:\asdf>dd if=a.a conv=swab of=a.a2
0+1 records in
0+1 records out
12 bytes (12 B) copied, 0 seconds, Infinity B/s
C:\asdf>type a.a2
a a a aaa
C:\asdf>xxd -p a.a2
feff00610061006161610d61
C:\asdf>file a.a2
a.a2; Big-endian UTF-16 Unicode text, with no line terminators
C:\asdf>
এবং নোটপ্যাড নিজেই ইউটিএফ -16 বিগ এন্ডিয়ান বা ইউটিএফ -16 লিটল এন্ডিয়ান বা ইউটিএফ -8 হিসাবে সংরক্ষণ করতে পারে
আপনি যদি কোনও প্রযুক্তিগত ব্যক্তি বা এমনকি একটি নোটপ্যাড ব্যবহারকারী হন তবে আপনার ওএসের কারণে আপনি একটি এনকোডিংয়ে আবদ্ধ নন!
আমি মনে করি UTF-8 UTF-16 এর চেয়ে বেশি বুদ্ধিমান হয়ে উঠেছে, UTF-16 এমন অক্ষরগুলির জন্য এমনকি 16 টি বিট ব্যবহার করবে যেখানে কেবল 8 টি বিট প্রয়োজন। তবুও, মনে রাখবেন যে চারম্যাপটি ইউটিএফ -16 কোডটি দেখায়।
সাব্লাইম (একটি উইন্ডোজ পাঠ্য সম্পাদক) ইউনিকোডটিকে ইউটিএফ -8 হিসাবে ডিফল্টরূপে সংরক্ষণ করে।
আমি উইন্ডোজ এবং কখনও কখনও ইউনিকোড ব্যবহার করি এবং আমি বেশিরভাগই ইউটিএফ -8 ব্যবহার করি।
এবং উইন্ডোজ যেমন প্রযুক্তিগতভাবে নমনীয়, লিনাক্স অন্তত প্রযুক্তিগতভাবে নমনীয়!