বাইনারি ফর্ম্যাট থেকে পাঠ্য ফাইলটি কনভার্ট করুন

আমি একটি বৃহত্তর সিএসভি ফাইল (~ 700MB) পেয়েছি যা আমি 27-অক্ষরের আলফা-সংখ্যাগত হ্যাশগুলির লাইন নিয়ে গঠিত জানি; কোন কমা বা অভিনব কিছু। একরকম, উইন্ডোজ থেকে লিনাক্সে স্থানান্তরিত হওয়ার সময় (উইনসিসিপি এবং তারপরে কয়েকটি নিয়মিত এসসিপিগুলির মাধ্যমে), এটি কোনও ধরণের বাইনারি বিন্যাসে রূপান্তরিত হয়েছে যার সাথে আমি অপরিচিত।

আমি যদি ফাইলটি vi এ খুলি, সমস্ত কিছু ঠিকঠাক প্রদর্শিত হয় এবং এটি নীচে [রূপান্তরিত] বলে, যদিও আমি জানি এটি কোনও লাইন সমাপ্তির সমস্যা নয় (এবং ডস 2 ইউনিক্স সাহায্য করে না)। আমি যদি ফাইলটি 'হেড' করি তবে প্রথম লাইনের শুরুতে "ÿþ" ব্যতীত এটি যথাযথ দেখাচ্ছে। যদি আমি ন্যানোতে ফাইলটি খুলি তবে আমি প্রথমে "ÿþ" দেখতে পাচ্ছি এবং তারপরে প্রতিটি চরিত্রের আগে "new @" (এমনকি নিউলাইন এবং ইওএফ )ও দেখতে পাচ্ছি।

আমি যদি ফাইলটি পুনরায় সংরক্ষণ বা অনুলিপি করার চেষ্টা করি (এর মাধ্যমে বলুন: head file.csv> ছোট.txt), এই বিশেষ এনকোডিংটি সংরক্ষিত আছে। আমি vi এর প্রথম দশটি লাইন আমার এসএসএইচ ক্লায়েন্টের মাধ্যমে আমার উইন্ডোজ ক্লিপবোর্ডে (যা এটি সঠিকভাবে প্রদর্শিত হয়) অনুলিপি করেছিলাম, তারপরে এটি একটি নতুন পাঠ্য ফাইল, টেস্ট.টেক্সট এ আটকানো হয়েছিল। এই ফাইলটি ভিআই-তে খোলার সময় দৃষ্টিগোচর হয় (এবং 'হেড' এর মাধ্যমে মিল, "" ÿþ "বিয়োগ করে), যদিও এটি ফাইলের আকারের প্রায় অর্ধেক। উপরন্তু,

file test.txt
test.txt: ASCII text
file short.txt
short.txt:

এই একবার-টেক্সট ফাইলটি কী রূপরেখায় রূপান্তরিত হয়েছিল তা আমার কোনও ধারণা নেই (প্রতীকগুলির জন্য ইন্টারনেট অনুসন্ধান করা কুখ্যাতভাবে কঠিন) তবে অবশ্যই এটি আবার রূপান্তর করার কোনও উপায় থাকতে হবে। কোন ধারনা?

linux encoding

— হামার ব্র।
সূত্র

এটি short.txtঅনলাইনে কোথাও পোস্ট করতে এবং এর সাথে লিঙ্ক করতে সহায়তা করতে পারে যাতে আমাদের সাথে কাজ করার জন্য একটি নমুনা থাকে। এটি কোনও ধরণের পাঠ্য এনকোডিং পরিবর্তন (ASCII থেকে ইউসিএস -২? কেবল একটি বুনো অনুমান) বলে মনে হচ্ছে তবে আমি কিছুটা তথ্য না দেখে সত্যই নিশ্চিতভাবে বলতে পারি না।

— ডেভিড জেড

home.comcast.net/~hammerbro/example.tgz

— হামার

"Ÿþ" টি ইউনিকোড বাইট অর্ডার মার্ক (বিওএম) হতে পারে এবং 16 @ প্রতিটি 16-বিট ইউনিকোড চরিত্রের প্রথম বাইট হতে পারে।

এটি ইউটিএফ -16 থেকে এএসসিআইআইতে রূপান্তর করতে পুনরায় কোড বা আইকনভি ব্যবহার করুন।

— RedGrittyBrick
সূত্র

ধন্যবাদ এক বিলিয়ন! এটি শর্ট.টেক্সট দিয়ে কৌশলটি করেছে, যদিও আমার সন্দেহ হয় যে এটি পুরো আকারের ডেটা সেটটিতে কিছুটা সময় নেবে।

— হাতুড়ি ভাই