অনেকগুলি সরল পাঠ্য ফাইল রয়েছে যা বৈকল্পিক অক্ষরে এনকোডড ছিল।
আমি তাদের সকলকে ইউটিএফ -8 এ রূপান্তর করতে চাই, তবে আইকনভি চালানোর আগে, এর মূল এনকোডিংটি আমার জানা উচিত। বেশিরভাগ ব্রাউজারের Auto Detect
এনকোডিংগুলিতে একটি বিকল্প থাকে তবে আমি সেই পাঠ্য ফাইলগুলি একের পর এক চেক করতে পারি না কারণ অনেক বেশি।
কেবলমাত্র মূল এনকোডিংটি জানা থাকার পরে আমি পাঠ্যগুলি দ্বারা রূপান্তর করতে পারি iconv -f DETECTED_CHARSET -t utf-8
।
প্লেইন টেক্সট ফাইলগুলির এনকোডিং সনাক্ত করার জন্য কি কোনও ইউটিলিটি রয়েছে? এটি ১০০% নিখুঁত হতে হবে না, যদি ১০,০০,০০০ ফাইলে ১০০ টি ফাইল ভুল রূপান্তরিত হয় তবে আমার আপত্তি নেই।
python-chardet
উবুন্টু মহাবিশ্বের রেপোর মতো প্যাকেজড ।