ডিফল্ট অক্ষর এনকোডিং কি?


8

আমি নিজেও জানি না যে এই প্রশ্নটি আসলে কত গভীর হয় (উদাহরণস্বরূপ, আমি জানি যে আমার কাজটির উপর নির্ভর করে বেশ কয়েকটি থাকতে পারে)।

বিশেষত, আমি সিস্টেমে ফাইল এবং ফোল্ডারগুলির নামকরণে কী ধরণের স্ট্রিং ব্যবহার করা হয় তাতে আগ্রহী।

বাশ বা পাইথন স্ক্রিপ্টের জন্য কীভাবে স্ট্রিংগুলি ডিফল্টরূপে উপস্থাপন করা হয় তাতে আমি আগ্রহী।


এটি একটি দুর্দান্ত প্রশ্ন বিশেষত যদি আপনি উইন্ডোজ থেকে রূপান্তর করেন এবং উত্স কোডটি কোনও সংস্করণ নিয়ন্ত্রণ সিস্টেমে অবদান রাখেন। উবুন্টুতে স্যুইচ করার পরে আপনি হঠাৎ অপঠনযোগ্য বিশেষ অক্ষরগুলি অনুভব করতে পারেন, কারণ উইন্ডোজ সাধারণত ইউটিএফ -8 ব্যবহার করে না।
বনানউইজন

উত্তর:


3
  • ফাইল সিস্টেমে ফাইলের নামগুলির এনকোডিং হল utf-8।
  • বাশ বাইটে ভাবেন, এনকোডিং-জ্ঞানের সাথে স্ট্রিং নয়। সুতরাং কোনও ডিফল্ট এনকোডিং নেই। জিনোম-টার্মিনালের ডিফল্ট এনকোডিং হল utf-8
  • পাইথনের ডিফল্ট এনকোডিংটি আসকি

পাইথন 3 (আমার মনে হয়?) ডিফল্টরূপে ইউনিকোড স্ট্রিংগুলিতে পরিবর্তিত হচ্ছে।
ব্রোম

পাইথন 3 এর str () প্রকারটি ইউসিএস -2 বা ইউসিএস -4 এনকোডিংয়ের অভ্যন্তরীণভাবে একটি ইউনিকোড বস্তু। উদাহরণস্বরূপ ফাইল এবং স্টিডিন থেকে ডেটা কীভাবে পড়া বা লিখিত হয় তা অ্যাপ্লিকেশন / গ্রন্থাগার বিকাশকারী দ্বারা নির্ধারণ করতে হবে, utf-8 মানক (যেমন মুদ্রণ (কিছু_স্ট্র) একটি utf-8 উপস্থাপনা মুদ্রণ করবে)।
ডেনিস কারসেমেকার

পাইথন 3 রুবি ১.৯ পাইথন ২ এর মতো ইউনিকোডে যাবে এবং রুবির ১.৮ এর মতো কম এবং এএসসিআই ভিত্তিক এবং সমস্ত অক্ষর নিয়ে কাজ করে তবে ইউনিকোড স্ট্রিংয়ের জন্য চরিত্র গণনা সম্পর্কে তাদের ধারণাটি ভুল। (যা সাধারণত কোনও সমস্যা হয় না)
রাল্ফ

3
জিনোম-টার্মিনাল utf-8 এ ডিফল্ট হয় না; এটি কেবলমাত্র আপনার লোকেল সেট করা আছে তা ব্যবহার করে। (যেমনটি আমি সম্প্রতি হার্ড
উপায়টি

1
@ ডেনিসকর্সমেকার নং, পাইথন 3 কেবলমাত্র বিকাশকারীকে এনকোডিং ছেড়ে যায় না এবং ইউটিএফ -8 এর একটি ডিফল্ট ব্যবহার করে। স্টিডিন এবং আউট উদাহরণস্বরূপ ডিফল্টরূপে পরিবেশের এনকোডিংটি ব্যবহার করুন!
রবার্ট সিমার

7

ডিফল্ট অক্ষর এনকোডিংটি ইউটিএফ -8 (ইউনিকোড), যদিও প্রায় সবগুলি (সম্ভবত সম্ভবত একটি ডিফল্ট ইনস্টল থাকা সমস্ত) ফাইলের নাম নিয়মিত ASCII অক্ষর, বেশিরভাগ এনকোডিংয়ের ক্ষেত্রে সাধারণ to

"বাশ বা পাইথন স্ক্রিপ্ট দ্বারা কতটি স্ট্রিং উপস্থাপন করা হয়" বলতে কী বোঝায় তা আমি জানি না। আপনি উবুন্টুতে ব্যাশ স্ক্রিপ্টগুলিতে ইউনিকোড অক্ষর ব্যবহার করতে পারেন, তবে সাধারণত ব্যাশ স্ক্রিপ্টের সাহায্যে আপনি অন্যান্য প্রোগ্রামগুলিতে কল করেন এবং এই অন্যান্য প্রোগ্রামগুলি সেগুলি পরিচালনা করবে কি না তা অন্য বিষয়। পাইথনের সাথেও এটি করা অবশ্যই সম্ভব, যদিও আপনি এর সাথে সম্পর্কিত প্যাকেজগুলি এবং সেটিংসের সাথে নিজেকে পরিচিত করতে চান।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.