ডিরেক্টরি এবং ফাইলের নামগুলিতে জার্মান উমলাটদের এনকোডিং ঠিক করুন (ü = u╠ê এবং আরও)


13

আমার অনেকগুলি জিপ-ফাইল রয়েছে যেখানে জার্মান আমলাউটের (äüöÄÜÖß) জন্য এনকোডিং ত্রুটি রয়েছে। এগুলি ফাইলের নাম.জিপ এবং পাশাপাশি অন্তর্ভুক্ত ডিরেক্টরি এবং ফাইলগুলিতে উভয়কে দেখায়:

  • Fünf = Fu╠ênf
  • রাউবার = রাউবার
  • Fallberfall = উবারফল

ইত্যাদি। সাধারণত আমি লিনাক্স ব্যবহার করি, তবে এই সমস্যাগুলির কারণে আমি একটি উইন্ডোজ 7 ভিএম চেষ্টা করেছিলাম তবে এটি একই এনকোডিং জগাখিচুড়ির ফলস্বরূপ। লিনাক্সে আমি কনফটিভ এবং ডিটক্সের সাথে প্রায় খেলেছি, তবে কোনও সাফল্যই পেল না।

আমি যখন ব্যবহার করি

  • কনমেভ -f আইসো -8859-1 -t utf8 --rereces - নোট -আর *

আমি "স্কিপিং, ইতিমধ্যে ইউটিএফ -8" পেয়েছি।

এই সম্পর্কে কোন চিন্তা?


আপনি কোন এন্টিক সিস্টেম ব্যবহার করছেন? সমস্ত বর্তমান লিনাক্স বিতরণ এখন ইউটিএফ -8 ব্যবহার করে।
ব্যাচইএক্স

এটি কি কোনও ফাইল সিস্টেমের সমস্যা হতে পারে? সম্ভবত এটি ইউটিএফ মাউন্ট করা হয়নি?
টেরডন

আমি লিনাক্স পুদিনা 13 ব্যবহার করি (কার্নেল 3.2.0-23 সহ উবুন্টু 12.04 এলটিএসের উপর ভিত্তি করে), সুতরাং এটি প্রাচীনত্ব থেকে দূরে। এবং যেমনটি আমি ইতিমধ্যে লিখেছি আমি সেই ফাইলগুলি একটি উইন্ডোজ 7 ভিএম-তে চেষ্টা করেছিলাম। তবে অবশ্যই আমি জানি না যে তিনি যে ব্যবহৃত জিপ ফাইল তৈরি করেছিলেন।
সিডার

1
এই এনকোডিংটি মনে হয় কোনও ধরণের ডস এনকোডিং। সাধারণত আমি যদি ইউটিএফ 8 এনকোডিংয়ের বিষয়গুলি জার্মান উমলাটদের দেখতে ä = ä বা Ü = Ãœ
সাইডার এর মতো

@ সাইডার চেষ্টা করুন find -type f -print0 |xargs -r -n1 -0 convmv -f WINDOWS-1252 -t UTF-8 --notest বর্তমান ডিয়ার থেকে ফাইলগুলি অনুসন্ধান করুন এবং প্রতিটি ফাইলের জন্য আলাদাভাবে কন্মিভিভি চালান। ফাইলের নামটি বাতিল তালিকা অনুসারে এনকোড করা আছে।
মানভে

উত্তর:


2

আপনি "ইতিমধ্যে ইউটিএফ -8" সতর্কতা পাওয়ার কারণটি হ'ল সেই স্ট্রিংগুলি ইতিমধ্যে ইউটিএফ -8 এ রয়েছে। "Ü" অক্ষরটি 'ইউ' হিসাবে ওএসএক্স-স্টাইলকে এনকোড করা হয়েছিল এবং তারপরে "\ xCC" এবং "\ x88" দুটি বাইট অনুসরণ করা হয়েছিল। এই দুটি বাইট একসাথে ইউটিএফ -8 প্রতিনিধিত্ব করে, সংমিশ্রণ ডায়ারেসিস। U0308।

আপনি যদি এখানে কোড পৃষ্ঠা 437 তালিকাটি পর্যবেক্ষণ করেন তবে আপনি "╠" হিসাবে \ xCC অক্ষর এবং "ê" হিসাবে \ x88 অক্ষরটি দেখতে পাবেন।

আপনি যে সমস্ত অক্ষর ক্রম প্রদর্শন করতে ব্যবহার করছেন তা যা ইউটিএফ -8 হিসাবে নয় বরং সিপি 437 হিসাবে ব্যাখ্যা করছে।

একটি দ্রুত প্রমাণ, আপনি যদি রুবি পড়েন, যা আমার ইউটিএফ -8 টার্মিনালে প্রত্যাশার মতো প্রদর্শন করে:

$ ruby -e 'puts "u\xCC\x88"' | iconv -f cp437 -t utf-8
ü
$ ruby -e 'puts "u\xCC\x88"'
ü

0

আমার অনুমানটি এমন ফাইল সিস্টেম যা আপনি ফাইলগুলি সংক্ষেপিত বা পরিচালনা করার চেষ্টা করছেন। FAT32 আপনার উমলুট পছন্দ করবে না। ফ্ল্যাশ ড্রাইভের বাইরে এই ফাইলগুলি অনুলিপি করার চেষ্টা করুন (বা আপনার কী আছে) এবং তারপরে ফাইলের নামগুলি কী ধরণের অক্ষর তৈরি করে তা দেখতে জিপ ফাইলটি সংক্ষেপণ করুন।

এনটিএফএস (উইন্ডোজ) এবং এক্সট 4 (পুদিনা) উভয়েরই নাম এনকোডিংয়ের ক্ষেত্রে সমস্যা হওয়া উচিত নয়।

FAT32 সিস্টেমে জিপ ফাইলগুলির নাম এনকোডিং সম্ভবত আপনি যখন কোনও যথাযথ সরবরাহকারী ফাইল সিস্টেমে অনুলিপি করেন তখন তা পরিবর্তন করতে বা ঠিক করা যায় না, তবে সংক্ষেপিত সাব-ডিরেক্টরিগুলি ঠিক হওয়া উচিত।


0

প্রথম দ্রষ্টব্য যে অক্ষর এনকোডিং হ'ল এটির নিজস্ব বিভাগ। উইন্ডোজ বিশ্বে এখনও ইউটিএফ -8 এবং এম between দীর্ঘ সময় ধরে বোকা খেলছে এবং আইএসও -8859 (এটি নিয়ে এসেছিল কে অনুমান) করার জন্য জোর দিয়ে একটি দুষ্টু দ্বৈতবাদ রয়েছে exists উপরে উল্লিখিত হিসাবে এটির অবশ্যই ফাইল সিস্টেমের সাথে কিছু করার আছে। আমার সমাধানটি কোনও প্রযুক্তিগত নয়, এটি এখন যা বহু বছর ধরে আমার জন্য কাজ করেছে:

ফাইলের নামের জন্য আমার ব্যক্তিগত বিট সর্বদা এক রকম: কেবল বর্ণানুক্রমিক প্লাস ড্যাশ (-) এবং আন্ডারস্কোর (_) দিয়ে আটকে থাকুন। উমলাউতকে ae, ue এবং oe হিসাবে লিখুন। স্পেস এবং অন্যান্য বিশেষ অক্ষর ব্যবহার করবেন না। এটি প্রথমে কিছুটা অসুবিধে হলেও এটি অপ্রত্যাশিত জায়গাগুলিতে আপনাকে প্রচুর ব্যথা বাঁচায়।

পার্শ্ব নোট হিসাবে: হ্যাঁ এটি একটি বাজে "হ্যাক" এর ধরণ তবে আপনি ক্রস প্ল্যাটফর্মের কাজ করলে আপনাকে প্রায়শই সর্বশেষ সাধারণ ডিনোমিনেটরে ফিরে যেতে হয়। আপনি এটিকে গুরুত্ব সহকারে গ্রহণ করবেন যে চরিত্রের এনকোডিংয়ের মতো মৌলিক কিছু শক্ত স্ট্যান্ডার্ড হতে পারে তবে এটি প্রমাণিত হয় যে মানগুলি পাওয়া শক্ত জিনিস। এই xkcd এটা বেশ চমত্কারভাবে আপ summes


আমি যখন ম্যাক, উইন্ডোজ এবং লিনাক্সের মধ্যে ফাইলগুলি (সিঙ্কিংয়ের মাধ্যমে) সিঙ্ক করার চেষ্টা করি (এবং ব্যর্থ হয়) তখন ফাইলের নামগুলিতে এনকোডিংয়ের সমস্যা থেকে আমি অসুস্থ এবং ক্লান্ত হয়ে পড়েছি। আমি আপনার পরামর্শটি মানিয়ে নেব, তুর্কিতে in, ş, ı, ğ, ü, ö রয়েছে, বর্ণমালা দিয়ে লিখতে সুবিধাজনক নয়। আমি ক্লাউড স্টোরেজ ব্যবহার করা থেকে বিরত থাকতে চাই তবে এই সমস্যাটি আমাকে তা করতে বাধ্য করে।
টিও
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.