আমি একটি বৃহত্তর সিএসভি ফাইল (~ 700MB) পেয়েছি যা আমি 27-অক্ষরের আলফা-সংখ্যাগত হ্যাশগুলির লাইন নিয়ে গঠিত জানি; কোন কমা বা অভিনব কিছু। একরকম, উইন্ডোজ থেকে লিনাক্সে স্থানান্তরিত হওয়ার সময় (উইনসিসিপি এবং তারপরে কয়েকটি নিয়মিত এসসিপিগুলির মাধ্যমে), এটি কোনও ধরণের বাইনারি বিন্যাসে রূপান্তরিত হয়েছে যার সাথে আমি অপরিচিত।
আমি যদি ফাইলটি vi এ খুলি, সমস্ত কিছু ঠিকঠাক প্রদর্শিত হয় এবং এটি নীচে [রূপান্তরিত] বলে, যদিও আমি জানি এটি কোনও লাইন সমাপ্তির সমস্যা নয় (এবং ডস 2 ইউনিক্স সাহায্য করে না)। আমি যদি ফাইলটি 'হেড' করি তবে প্রথম লাইনের শুরুতে "ÿþ" ব্যতীত এটি যথাযথ দেখাচ্ছে। যদি আমি ন্যানোতে ফাইলটি খুলি তবে আমি প্রথমে "ÿþ" দেখতে পাচ্ছি এবং তারপরে প্রতিটি চরিত্রের আগে "new @" (এমনকি নিউলাইন এবং ইওএফ )ও দেখতে পাচ্ছি।
আমি যদি ফাইলটি পুনরায় সংরক্ষণ বা অনুলিপি করার চেষ্টা করি (এর মাধ্যমে বলুন: head file.csv> ছোট.txt), এই বিশেষ এনকোডিংটি সংরক্ষিত আছে। আমি vi এর প্রথম দশটি লাইন আমার এসএসএইচ ক্লায়েন্টের মাধ্যমে আমার উইন্ডোজ ক্লিপবোর্ডে (যা এটি সঠিকভাবে প্রদর্শিত হয়) অনুলিপি করেছিলাম, তারপরে এটি একটি নতুন পাঠ্য ফাইল, টেস্ট.টেক্সট এ আটকানো হয়েছিল। এই ফাইলটি ভিআই-তে খোলার সময় দৃষ্টিগোচর হয় (এবং 'হেড' এর মাধ্যমে মিল, "" ÿþ "বিয়োগ করে), যদিও এটি ফাইলের আকারের প্রায় অর্ধেক। উপরন্তু,
file test.txt
test.txt: ASCII text
file short.txt
short.txt:
এই একবার-টেক্সট ফাইলটি কী রূপরেখায় রূপান্তরিত হয়েছিল তা আমার কোনও ধারণা নেই (প্রতীকগুলির জন্য ইন্টারনেট অনুসন্ধান করা কুখ্যাতভাবে কঠিন) তবে অবশ্যই এটি আবার রূপান্তর করার কোনও উপায় থাকতে হবে। কোন ধারনা?
short.txt
অনলাইনে কোথাও পোস্ট করতে এবং এর সাথে লিঙ্ক করতে সহায়তা করতে পারে যাতে আমাদের সাথে কাজ করার জন্য একটি নমুনা থাকে। এটি কোনও ধরণের পাঠ্য এনকোডিং পরিবর্তন (ASCII থেকে ইউসিএস -২? কেবল একটি বুনো অনুমান) বলে মনে হচ্ছে তবে আমি কিছুটা তথ্য না দেখে সত্যই নিশ্চিতভাবে বলতে পারি না।