কীভাবে এনকোডিং ঠিক করা যায় - কোঁকড়ানো এস্টিস্ট্রোফ ‰ Ûª হিসাবে উপস্থিত হয় Ûª


1

আমার কাছে একটি পাঠ্য-ফাইল রয়েছে যাতে সমস্ত ASCII টি অক্ষর সঠিকভাবে উপস্থিত হয় তবে কিছু অন্য নাও থাকে। বিশেষত এই শব্দটি রয়েছে:

don‰Ûªt

হেক্সে বাইটগুলি হয় 64 6f 6e 89 db aa 74। স্পষ্টতই, এটি প্রায় নিশ্চিত যে ‰Ûªএকটি কোঁকড়ানো অ্যাডোস্ট্রোফ হওয়া উচিত, সম্ভবত ইউ + 02 বিসি , ইউ + 2019 , বা ইউ + 0092 । [ যোগ করার জন্য সম্পাদিত: একই পাঠ্য পিডিএফ থেকে সঠিক অ্যাডোস্ট্রোফ অনুলিপি করার ভিত্তিতে, আমি এখন যুক্তিসঙ্গতভাবে নিশ্চিত যে এটি ইউ + 2019 ]

এই ওয়েবপেজ বলে

যদি বিটগুলির ক্রমটি কোনও এনকোডিংয়ে (কোনও মানুষের কাছে) তাৎপর্যপূর্ণ না হয় তবে ডকুমেন্টটি সম্ভবত বেশিরভাগ সময়ে ভুলভাবে রূপান্তরিত হয়েছিল। ... যদি কোনও নথির ভুল ব্যাখ্যা করা হয় এবং কোনও আলাদা এনকোডিংয়ে রূপান্তর করা হয় তবে তা নষ্ট হয়ে গেছে। এটি "মেরামত" করার চেষ্টা করা হতে পারে বা সফল হতে পারে না, সাধারণত তা হয় না। যে কোনও ম্যানুয়াল বিট-শিফটিং বা অন্যান্য এনকোডিং ভুডো বেশিরভাগই এটি হয়, ভুডু।

তবে অবশ্যই আমার ফাইলে যা ঘটেছিল তা নিয়ে কাজ করতে সক্ষম হওয়া উচিত, আমি বাইটগুলি জানি এবং আমি জানি যে তারা কী চরিত্রটি বোঝাতে চেয়েছিল। কেউ কীভাবে আমাকে বলতে পারেন যে কীভাবে ফাইলটি কলুষিত হয়ে গেল এবং কীভাবে এটি ঠিক করবেন?

উত্তর:


2

কেউ কীভাবে আমাকে ফাইলটি কীভাবে দুর্নীতিগ্রস্থ হয়ে উঠেছে তা সম্পর্কে কাজ করতে পারেন, ...

আমি পারব না, তবে আপনি ভাগ্যবান হবেন।

কোনও রুবিকের কিউবকে স্ক্র্যাম্বলেড কনফিগারেশন দেওয়া হয়েছে এটি সূচনা অবস্থায় ফিরিয়ে আনার জন্য কয়েকটি সেট চালনা করা খুব সহজ। স্ক্র্যাম্বলড অবস্থায় পৌঁছানোর জন্য কোন পদক্ষেপগুলি ব্যবহার করা হত তা কাজ করা সাধারণত অসম্ভব - কারণ চলনের সম্ভাব্য ক্রমগুলির সংখ্যা বিশাল vast

আপনার সমস্যাও একই রকম। আংশিক কারণ আপনি এই প্ল্যাটফর্মটি তৈরি করতে ব্যবহৃত প্ল্যাটফর্ম, লোকেল এবং সরঞ্জামগুলি সম্পর্কে কোনও ক্লু না দেন।

0x89 কোনও অক্ষরের তিন-বাইট UTF8 এনকোডিংয়ের জন্য একটি বৈধ ফার্স্ট বাইট নয়। 0xDBAA আরবি খালি কেন্দ্র লো স্টপ। যা অবশ্যই অবর্ণনীয়। সম্ভবত ইউটিএফ 8-কে কিছু 8-বিট এনকোডিং হিসাবে ভুল ব্যাখ্যা করা হয়েছে এবং তারপরে একটি পৃথক 8-বিট এনকোডিং হিসাবে সংরক্ষণ করা হয়েছে। যদি ফাইলটি জাপানের কাছাকাছি থাকে তবে আপনি জেআইএস, শিফট-জেআইএস এবং ইইউসিটির কিছু অপব্যবহার মিশ্রণে ফেলে দিতে পারেন।

সম্ভবত এক ডজন করণীয় ইউনিকোড অক্ষর এবং সম্ভবত একটি বৃহত সংখ্যক প্রশংসনীয় 8-বিট এবং 16-বিট এনকোডিং রয়েছে। ম্যানুয়ালি চেষ্টা করার জন্য এটি অনেকগুলি অনুমোদন। যদি এটি যথেষ্ট গুরুত্বপূর্ণ ছিল তবে আমি শুরুতে অক্ষর এবং দুটি স্ক্র্যামব্লিংয়ের শুরু করার সমস্ত অনুমতি চেষ্টা করতে কোড লিখতে পারি এবং দেখি যে কোনও 0x89DBAA এ পৌঁছেছে কিনা।

পরিসংখ্যানগতভাবে আমি প্রত্যাশা করতাম যে সম্ভবত খুব সম্ভবত দৃশ্যটি এমন কিছু তবে সম্পূর্ণ সম্পূর্ণ ভিন্ন নয়:

  1. বিওএম ছাড়াই একটি ইউটিএফ 8 পাঠ্য ফাইল তৈরি করুন (ইউনিকোড কনসোর্টিয়ামের প্রস্তাব হিসাবে)।
  2. একটি "উইন্ডোজ-ল্যাটিন -1" লোকালে এমএস-উইন্ডোজ নোটপ্যাড ব্যবহার করে সেই ফাইলটি পড়ুন। নোটপ্যাড ইউটিএফ 8 কে সিপি -1222 হিসাবে ভুলভাবে পাঠায়, আংশিক কারণ ইউটিএফ -8 এর কোনও বাইট-অর্ডার চিহ্ন নেই এবং অনেকগুলি মাইক্রোসফ্ট সরঞ্জাম একটি এনকোডিং সূচক হিসাবে বাইট-অর্ডার চিহ্নের অপব্যবহার / অপব্যবহার করে।
  3. ফাইলটিকে "ইউনিকোড" হিসাবে সংরক্ষণ করুন। নোটপ্যাড মাইক্রোসফ্টের ভুল পরিভাষা ব্যবহার করে এবং সিপি -1222 কী তা ইউটিএফ -16 লিটল-এন্ডিয়ান (বিওএম সহ) অনুবাদ করে

তবে এটি খুব সহজ (তাই আমি এটি চেষ্টা করে দেখিনি)।

আমি নিশ্চিত যে উত্তরটি অনিচ্ছাকৃতভাবে পূর্ববর্তী ক্ষেত্রে স্পষ্ট হবে। তবে এখন ছোট আরাম।

... এবং কিভাবে এটি ঠিক করব?

প্রদত্ত একমাত্র প্রকাশিত সামগ্রীটি হ'ল ইংরাজির শব্দ don'tযা পুরো ডেটা 95% ASCII হয় তা আমরা অনুমান করতে পারি । ম্যানুয়াল পরিদর্শন ব্যবহার করা যদি সম্ভব হয় ...

  1. 0x89dbaa-> থেকে শুরু করে সমস্ত বিভিন্ন গাবলডেগুক সিকোয়েন্স এবং প্লাজেবল প্রতিস্থাপনের তালিকা তৈরি করুন '

  2. sedএই বিকল্পগুলি তৈরি করতে বাইট-ওরিয়েন্টেড সরঞ্জাম (উদাহরণস্বরূপ ) ব্যবহার করুন।

  3. ???

  4. লাভ!


ধন্যবাদ। ফাইলটি দীর্ঘ এবং প্রায় সমস্ত অক্ষর ASCII এবং সঠিকভাবে উপস্থিত হয়। আমি মনে করি এটি উইন্ডোজের নোটপ্যাডে খোলা থাকতে পারে তবে আমি মনে করি এটি সম্ভবত উইন্ডোজের অন্য কোনও নিরীহ উপায়ে প্রক্রিয়া করা হয়েছিল, উদাহরণস্বরূপ ডিফল্ট বা ভুল সেটিংস সহ এক্সেলের মধ্যে খোলার এবং সংরক্ষণ করা। এটি এতটা প্রায় পাস হয়নি, তাই আমি সন্দেহ করি যে এটি ভুলভাবে একাধিকবার রূপান্তরিত হয়েছিল। আমার ধারণা, এই অনুমানগুলি আপনার রুবিকের ঘনক উপমা তুলনায় সমস্যাটিকে অনেক সহজ করে তুলবে। আপনার পরামর্শ মতো আমিও কোডটি লেখার চেষ্টা করব ...
ব্যবহারকারী 1310503
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.