ব্যাচ রূপান্তর txt ফাইল এনকোডিং


2

আমার কাছে প্রায় 700 টি ফাইল রয়েছে যা একটি বন্ধ ক্যাপশন সফ্টওয়্যার প্রক্রিয়ার ফলাফল ছিল। আমি একটি জিইআইতে আমার পিসি বা ম্যাকের ফাইলগুলি খুলতে পারি, কিন্তু যখন আমি ন্যানো দিয়ে সার্ভারে এটি খুলি, তখন আমি এটি পাই:

��0^@0^@;^@0^@0^@;^@0^@0^@;^@0^@0^@ ^@0^@0^@;^@0^@0^@;^@0^@6^@;^@0^@0^@
^@
^@N^@o^@t^@ ^@A^@v^@a^@i^@l^@a^@b^@l^@e^@

আমি চেষ্টা করেছি এমন কয়েকটি কমান্ড লাইনের জিনিসগুলির ফলাফল এখানে রয়েছে:

#file infile.txt 
infile.txt: data

# file -bi --mime-encoding  infile.txt 
application/octet-stream; charset=binary

recode ../CR-LF infile.txt
#file -bi --mime-encoding  infile.txt

#iconv -f binary -t uff-8 infile.txt > out.txt
iconv: conversions from `binary' and to `uff-8' are not supported

#recode ../CR-LF infile.txt
#recode UTF8..ISO-8859-15 infile.txt 
# file -bi --mime-encoding  infile.txt 
text/plain; charset=utf-16le

#xxd infile.txt | head -5
0000000: fffe 3000 3000 3b00 3000 3000 3b00 3000  ..0.0.;.0.0.;.0.
0000010: 3000 3b00 3000 3000 2000 3000 3000 3b00  0.;.0.0. .0.0.;.
0000020: 3000 3000 3b00 3000 3600 3b00 3000 3000  0.0.;.0.6.;.0.0.
0000030: 0d00 0d0a 004e 006f 0074 0020 0041 0076  .....N.o.t. .A.v
0000040: 0061 0069 006c 0061 0062 006c 0065 00    .a.i.l.a.b.l.e.

আসল ফাইলটি দেখতে দেখতে এটির মতো (এটি সর্বাধিক পছন্দ ছিল না, এটি ঘটনাক্রমে কোনও কিছুই ছাড়াই আমি বেছে নিয়েছি):

00;00;00;00 00;00;06;00 Not Available

তারপরে আমি যদি ফাইলটি ন্যানো করি তবে আমি নীচে পাঠ্য পেয়েছি যা বলে যে এটি ডস এবং ম্যাক ফর্ম্যাট থেকে রূপান্তরিত হয়েছিল তবে এটি এখনও সমস্ত আবর্জনা। আমার ফাইলগুলির মধ্য দিয়ে লুপ করতে এবং ডেটাবেসে ডেটা আমদানি করতে সক্ষম হওয়া দরকার তবে সার্ভার ফর্ম্যাটটি পড়তে না পারলে অবশ্যই আমি তা করতে পারি না।

আমি একটি দীর্ঘমেয়াদী সমাধান খুঁজে পেতে চাই যেহেতু ভবিষ্যতে আমি এগুলি প্রচুর উত্পাদন করব এবং উইন্ডোজ পাওয়ারশেল বা সমতুল্য ব্যবহার না করে রূপান্তরটি আমার প্রক্রিয়াতে অন্তর্ভুক্ত করব।


আপনি তাদের কোন জিইউতে খুলছেন? টেক্সট সম্পাদক যেমন নোটপ্যাড বা টেক্সটএডিট, বা কোনও বিশেষ অ্যাপ্লিকেশন?
ডি শ্ল্যাচটার

উইন্ডোজ আমি নোটপ্যাড বা এডিটপ্লাস ব্যবহার করেছি, আমার ম্যাকটিতে আমি টেক্সটএডিট ব্যবহার করেছি
অ্যালান

2
আপনি সম্ভবত আইকনভি দিয়ে সঠিক দিকে যাচ্ছিলেন তবে আপনি অবৈধ পরামিতিগুলি পেরিয়ে গেছেন। আপনি যদি মূল ফাইলটির কয়েকটি লাইন অন্তর্ভুক্ত করেন তবে এটি কার্যকর হতে পারে। এরকম কিছু এর আউটপুট দিয়ে আপনার প্রশ্ন আপডেট করুন xxd original_file | head -5। বিটিডাব্লু, আমি সন্দেহ করি আপনার একটি অবৈধ বা অনুপস্থিত বিওএম আছে।
জোরদাচে

@ জোরেদাচে পরামর্শের জন্য ধন্যবাদ, আমি প্রশ্নটি আপডেট করেছি এবং বিওএম সম্ভাবনা সন্ধান করব।
অ্যালান

সুতরাং আপনার ফাইলের একটি বিওএম আছে [0x0 এ এফএফএফ দেখুন)। এটি আমাকে বলছে আপনার বর্তমান ফাইলটি কিছুটা এন্ডিয়ান ইউটিএফ -16 বলে মনে হচ্ছে। আপনি কি নিশ্চিত যে আপনি ফর্ম্যাটটি পরিবর্তন করতে চান? আপনি এই ফাইলগুলি দেখতে ন্যানো ব্যবহার করছেন কেন? অবশ্যই এটি আপনার ব্যাচ প্রক্রিয়ার অংশ নয়। আমার মনে হয় না ন্যানো আসলে ইউনিকোডকে সমর্থন করে।
জোরডাচে

উত্তর:


2

সুতরাং আমার জন্য সমাধানটি পুনরায় পুনরায় ব্যবহার করা শেষ হয়ে গেল। প্রচুর দুর্দান্ত ডকুমেন্টেশন নেই, তবে কৌশলটি ছিল এটিকে পরিবর্তন করতে বাধ্য করার জন্য -f বিকল্পটি ব্যবহার করা।

recode -f UTF-7 *.txt
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.