অনেকগুলি সরল পাঠ্য ফাইল রয়েছে যা বৈকল্পিক অক্ষরে এনকোডড ছিল।
আমি তাদের সকলকে ইউটিএফ -8 এ রূপান্তর করতে চাই, তবে আইকনভি চালানোর আগে, এর মূল এনকোডিংটি আমার জানা উচিত। বেশিরভাগ ব্রাউজারের Auto Detectএনকোডিংগুলিতে একটি বিকল্প থাকে তবে আমি সেই পাঠ্য ফাইলগুলি একের পর এক চেক করতে পারি না কারণ অনেক বেশি।
কেবলমাত্র মূল এনকোডিংটি জানা থাকার পরে আমি পাঠ্যগুলি দ্বারা রূপান্তর করতে পারি iconv -f DETECTED_CHARSET -t utf-8।
প্লেইন টেক্সট ফাইলগুলির এনকোডিং সনাক্ত করার জন্য কি কোনও ইউটিলিটি রয়েছে? এটি ১০০% নিখুঁত হতে হবে না, যদি ১০,০০,০০০ ফাইলে ১০০ টি ফাইল ভুল রূপান্তরিত হয় তবে আমার আপত্তি নেই।
python-chardetউবুন্টু মহাবিশ্বের রেপোর মতো প্যাকেজড ।