অক্ষর সেটগুলির মধ্যে পাঠ্য ফাইলগুলিকে রূপান্তর করার জন্য দ্রুত, সহজতম সরঞ্জাম বা পদ্ধতি কী?
বিশেষত, আমাকে ইউটিএফ -8 থেকে আইএসও -8859-15 এবং তার বিপরীতে রূপান্তর করতে হবে।
সবকিছু যায়: আপনার পছন্দের স্ক্রিপ্টিং ভাষার ওয়ান-লাইনার, কমান্ড-লাইন সরঞ্জাম বা ওএস, ওয়েব সাইট ইত্যাদির জন্য অন্যান্য উপযোগিতা
এখন পর্যন্ত সেরা সমাধান:
লিনাক্স / ইউনিক্স / ওএস এক্স / সাইগউইনে:
ট্রয়েস আরভিনের প্রস্তাবিত জ্ঞানু আইকনভ ফিল্টার হিসাবে সবচেয়ে বেশি ব্যবহৃত হয় । এটি সর্বজনীনভাবে উপলব্ধ বলে মনে হচ্ছে। উদাহরণ:
$ iconv -f UTF-8 -t ISO-8859-15 in.txt > out.txt
বেন দ্বারা নির্দেশিত হিসাবে , আইকনভিভ ব্যবহার করে একটি অনলাইন রূপান্তরকারী রয়েছে ।
GNU recode ( ম্যানুয়াল ) দ্বারা প্রস্তাবিত Cheekysoft রূপান্তর করবে ইন-জায়গা এক বা একাধিক ফাইল । উদাহরণ:
$ recode UTF8..ISO-8859-15 in.txt
এটির একটি স্বল্প সংকেত ব্যবহার করে:
$ recode utf8..l9 in.txt
পুনরায় কোডগুলি এমন পৃষ্ঠগুলি সমর্থন করে যা বিভিন্ন লাইন সমাপ্তির ধরণ এবং এনকোডিংগুলির মধ্যে রূপান্তর করতে ব্যবহার করা যেতে পারে:
এলএফ (ইউনিক্স) থেকে নতুন লাইনগুলি সিআর-এলএফ (ডস) এ রূপান্তর করুন:
$ recode ../CR-LF in.txt
বেস 64 এনকোড ফাইল:
$ recode ../Base64 in.txt
আপনি তাদের একত্রিত করতে পারেন।
ইউনিক্স লাইন এন্ডিং সহ একটি বেস 64 এনকোডেড ইউটিএফ 8 ফাইলটি বেস 64-তে এনডোড ল্যাটিন 1 ফাইল ডস লাইন সমাপ্তির সাথে রূপান্তর করুন:
$ recode utf8/Base64..l1/CR-LF/Base64 file.txt
সঙ্গে Windows এ PowerShell ( জে Bazuzi ):
PS C:\> gc -en utf8 in.txt | Out-File -en ascii out.txt
(যদিও আইএসও -8859-15 সমর্থন নেই; এটি বলে যে সমর্থিত অক্ষরগুলি হ'ল ইউনিকোড, utf7, utf8, utf32, ascii, bigendianunicode, ডিফল্ট এবং oem)
সম্পাদন করা
আপনি কি আইসো -8859-1 সমর্থন বোঝাতে চান? "স্ট্রিং" ব্যবহার করে বিপরীতভাবে এটি করা যায়
gc -en string in.txt | Out-File -en utf8 out.txt
দ্রষ্টব্য: সম্ভাব্য গণনা মানগুলি হ'ল "অজানা, স্ট্রিং, ইউনিকোড, বাইট, বিগ ইন্ডিয়ান ইউনিকোড, ইউটিএফ 8, ইউটিএফ 7, আসকি"।
- CsCvt - Kalytta এর ক্যারেক্টার সেট কনভার্টারটি উইন্ডোজের জন্য আরেকটি দুর্দান্ত কমান্ড লাইন ভিত্তিক রূপান্তর সরঞ্জাম।
recode
আপনি ফিল্টার হিসাবে কোনও ফাইলের নাম পাস না করলে ফিল্টার হিসাবেও কাজ করবে যেমন:recode utf8..l9 < in.txt > out.txt
enca
ইনপুট এনকোডিং নির্দিষ্ট করার দরকার নেই। ভাষাটি নির্দিষ্ট করার জন্য এটি প্রায়শই যথেষ্ট enca -L ru -x utf8 FILE.TXT
।
iconv -f UTF-32 -t UTF-8 input.csv > output.csv
কেবলমাত্র তৃতীয়াংশ, প্রায় সাত লক্ষাধিক লাইনের সাহায্যে ব্যবহার করে । ইন-প্লেস সংস্করণ ব্যবহার করে iconv -f UTF-32 -t UTF-8 file.csv
সমস্ত 2 মিলিয়ন প্লাস লাইন সফলভাবে রূপান্তরিত হয়েছে।
gc -en Ascii readme.html | Out-File -en UTF8 readme.html
কিন্তু এটি ফাইলটি utf-8 এ রূপান্তর করে তবে এটি খালি! নোটপ্যাড ++ বলছে ফাইলটি আনসি-ফর্ম্যাট তবে আমি বুঝতে পেরেছি এটি একটি বৈধ অক্ষরও নয় ?? uk.answers.yahoo.com/question/index?qid=20100927014115AAiRExF