আপনার লিঙ্ক করা ফাইলটি কোনও HTML ডকুমেন্টের অভ্যন্তরে UTF-8 বলে মনে হচ্ছে
$ file 0606461.txt
0606461.txt: HTML document, ASCII text, with CRLF line terminators
আপনি যদি প্রথমে এটি এইচটিএমএল-থেকে-টেক্সট রূপান্তরকারী হিসাবে চালনা করেন, যেমন
iconv -f UTF-8 -t ascii//TRANSLIT < <(html2text 0606461.txt)
তারপরে আপনি যে ইউটিএফ -8 খণ্ডটি নিয়ে সমস্যায় পড়েছেন বলে মনে হচ্ছে ত্রুটি ছাড়াই লিখিতভাবে লিখিত হয়েছে
Si fractus illabatur orbis.
Impavidum ferient ruinæ
--Horace.
হয়ে
Si fractus illabatur orbis.
Impavidum ferient ruinae
--Horace.
html2text
উপযোগ আপনার সিস্টেমে ইনস্টল করা সম্ভব হবে না - আপনি খুঁজে পাব না এমন / এটি ইনস্টল করুন একটি পাইথন মডিউল সহ অন্যান্য কনভার্টার আছে।
hexdump -C file
কমান্ড চেষ্টা করেছিলাম এবং0002b220 72 75 69 6e e6 0a 20 2d 2d 20 48 6f 72 61 63 65 |ruin.. -- Horace|
আউটপুট হিসাবে পেয়েছিলাম ।