প্রশ্ন ট্যাগ «character-encoding»

চরিত্র এবং চরিত্রের সেটগুলির বিভিন্ন উপস্থাপনা, যেমন: ASCII, UTF-8, EBCDIC, অন্যদের মধ্যে যে প্রশ্নগুলি দেখা দেয় Questions অপারেটিং সিস্টেমগুলির মধ্যে ফাইলগুলি সরানোর সময় প্রায়শই মুখোমুখি হয় যা ক্যারিজ রিটার্ন এবং / অথবা নিউলাইন অক্ষরের সাথে নতুন লাইনগুলিকে এনকোড করে।

4
সিআরএলএফ লাইন টার্মিনেটরগুলি ইউটিএফ -8 এ নন-আইএসও প্রসারিত-এএসসিআইআই পাঠ্য থেকে এনকোডিং কীভাবে পরিবর্তন করবেন?
আমার কাছে একটি টেক্সট ফাইল রয়েছে: $ file -i x.txt x.txt: text/plain; charset=unknown-8bit $ file x.txt x.txt: Non-ISO extended-ASCII text, with CRLF line terminators এবং কিছু অক্ষর রয়েছে যা ভুলভাবে এনকোড করা হয়েছে: trwa³y, sta³y, usuwaæ আমি কীভাবে এই ফাইলটির এনকোডিংটিকে ইউটিএফ -8 এ পরিবর্তন করতে পারি? আমি এখন পর্যন্ত …

4
বিশেষ অক্ষরযুক্ত ফাইলগুলি বাল্কের পুনঃনামকরণ (বা সঠিকভাবে প্রদর্শন) করা হবে
আমার কাছে প্রচুর ডিরেক্টরি এবং উপ-ডিরেক্টরি রয়েছে যা এই ফাইলটির মতো বিশেষ অক্ষরযুক্ত ফাইলগুলি ধারণ করে: robbie@phil:~$ ls test�sktest.txt test?sktest.txt একটি অব্যাহতি ক্রম উন্মুক্ত অনুসন্ধান করুন: robbie@phil:~$ find test�sktest.txt -ls 424512 4000 -rwxr--r-x 1 robbie robbie 4091743 Jan 26 00:34 test\323sktest.txt আমি এমনকি কনসোলে তাদের নামগুলি টাইপ করতে পারি তার …

2
পান্ডোক দিয়ে একটি .ডোক্সকে একটি .pdf এ রূপান্তর করুন
আমি মেল দ্বারা প্রাপ্ত একটি .ডোক্সকে প্যানডোক ব্যবহার করে একটি সঠিক পিডিএফ রূপান্তর করার চেষ্টা করছি (আমি জিএনইউ / লিনাক্স ব্যবহার করছি)। অক্ষরগুলির এনকোডিং সম্পর্কে আমার একটি ত্রুটি রয়েছে: $ pandoc file.docx -o file.pdf pandoc: Cannot decode byte '\x87': Data.Text.Encoding.decodeUtf8: Invalid UTF-8 stream আমি এনকোডিংটি সনাক্ত করার চেষ্টা করেছি: $ …

2
বর্তমান লোকালে প্রদত্ত একটি অক্ষর শ্রেণিতে অক্ষরের তালিকা পুনরুদ্ধার করতে আদেশ
কি একটি প্রদত্ত চরিত্র ক্লাসে সমস্ত অক্ষর (যেমন একটি তালিকা পুনরুদ্ধার করতে একটি উপায় হতে পারে blank, alpha, digit...) বর্তমান লোকেলে। এই ক্ষেত্রে, LC_ALL=en_GB.UTF-8 that-command blank আদর্শভাবে, আমার ডেবিয়ান সিস্টেমে এমন কিছু প্রদর্শন করা হবে: 09 U+0009 HORIZONTAL TAB 20 U+0020 SPACE e1 9a 80 U+1680 OGHAM SPACE MARK e1 …

3
অক্ষর এনকোডিংগুলি আরও বেশি, বিড়াল এবং আরও কম দ্বারা সমর্থিত
নিম্নলিখিত অনুযায়ী আমার কাছে একটি পাঠ্য ফাইল এনকোড করা আছে file: সিআরএলএফ লাইন টার্মিনেটর সহ ISO-8859 পাঠ্য এই ফাইলটিতে অ্যাকসেন্ট সহ ফরাসি পাঠ্য রয়েছে। আমার শেল অ্যাকসেন্ট প্রদর্শন করতে emacsসক্ষম এবং কনসোল মোডে এই অ্যাকসেন্টগুলি সঠিকভাবে প্রদর্শন করতে সক্ষম। আমার সমস্যা হল more, catএবং lessটুলস সঠিকভাবে এই ফাইলটি প্রদর্শন করবে …

6
আমি কীভাবে হিব্রু নামগুলির সাথে ফাইলগুলির একটি জিপ সংরক্ষণাগারটি সঠিকভাবে সঙ্কুচিত করতে পারি?
কেউ আমাকে হিব্রু নামের ফাইলযুক্ত একটি জিপ ফাইল পাঠিয়েছেন (এবং উইন্ডোজে তৈরি করা হয়েছে, কোন সরঞ্জামের সাথে নিশ্চিত নয়)। আমি ডেবিয়ান স্ট্রেচে এলএক্সডিই ব্যবহার করি। জিনোম সংরক্ষণাগার ব্যবস্থাপক ফাইলটি আনজিপ করার ব্যবস্থা করে তবে হিব্রু অক্ষরগুলি ভরাট হয়ে যায়। আমি মনে করি আমি ইউটিএফ -8 অক্টেটগুলি ইউনিকোড অক্ষরগুলিতে প্রসারিত করছি, …

1
বিদেশী অক্ষরগুলি এসএসএইচে প্রদর্শিত হবে না
আমি ব্যবহার করতে sshএবং একটি রিমোট সার্ভার (যাতে আমার প্রশাসক অ্যাক্সেস নেই) নিয়ে কিছু সমস্যা হচ্ছে - বিশেষত, সেখানে কোরিয়ান এবং সিরিলিক পাঠ্য সহ কয়েকটি ফোল্ডার রয়েছে। আমি যখন এর সাথে প্যারেন্ট ফোল্ডার সামগ্রীগুলি প্রদর্শন করি ls, তখন অক্ষরগুলি "?" হিসাবে পালিয়ে যায়। সম্ভবত লক্ষ্য করা যায় যে কোরিয়ান চরিত্রগুলি …

2
ssh এবং চরিত্রের এনকোডিং
আমি যখন sshআমার ভিপিএসে প্রবেশ করি তখন আমি irssiস্ক্রিনে চলি । যখন কেউ একটি ইউনিকোড চরিত্র পাঠায় (যেমন © বা €), irssiআমি কোনও sshসেশনে পর্দার মাধ্যমে এটি আবর্জনা প্রদর্শন করি । irssiআমার স্থানীয় কম্পিউটারে চলমান ইরসি থেকে আমি যদি ইরসির প্রক্সি মডিউলটি ব্যবহার করে এর সাথে সংযোগ স্থাপন করি তবে …

3
কোনও ইউ + এক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্স কোড দ্বারা নির্দিষ্ট ইমোটিকনকে কীভাবে রূপান্তর করবেন?
ইমোটিকনগুলি ইউ + এক্সএক্সএক্সএক্সএক্সএক্সএক্সএক্সের এমন একটি বিন্যাস ব্যবহার করে নির্দিষ্ট করা হয়েছে বলে মনে হয় যেখানে প্রতিটি এক্স হেক্সাডেসিমাল অঙ্ক। উদাহরণস্বরূপ, ইউ + 1F615 হ'ল "বিভ্রান্ত মুখের" জন্য অফিশিয়াল ইউনিকোড কনসোর্টিয়াম কোড 😕 যেহেতু আমি প্রায়শই বিভ্রান্ত থাকি তাই এই প্রতীকটির সাথে আমার দৃ strong়তা রয়েছে aff U + এ …

3
ইউটিএফ -8 দিয়ে `কাট-সি` (` --characters`) ব্যবহার করতে পারবেন না?
কমান্ডটিতে cutবিকল্পগুলির -cসাথে বাইটের পরিবর্তে অক্ষরগুলিতে কাজ করার বিকল্প রয়েছে -b। তবে en_US.UTF-8স্থানীয়ভাবে এটি কার্যকর বলে মনে হচ্ছে না : দ্বিতীয় বাইট দ্বিতীয় ASCII অক্ষর দেয় (যা ইউটিএফ -8 এ ঠিক একইভাবে এনকোড করা হয়েছে): $ printf 'ABC' | cut -b 2 B তবে ইউটিএফ -8 লোকালে তিনটি গ্রীক নন-এএসসিআইআই …

3
দশমিক দশমিক ছয়টি অক্ষর মুদ্রণ করা, আমার কমান্ডটি ফলাফল হিসাবে আউটপুট দেয় না
আমি নিম্নলিখিত কমান্ড দিয়ে সমস্ত ascii অক্ষরের একটি স্ট্রুপ আউটপুট করতে চেয়েছিলাম for i in `seq 32 127`; do printf "%c" $i; done উপরের কমান্ডের আউটপুট হল: 33333334444444444555555555566666666667777777777.............. এটি প্রতিটি সংখ্যার প্রথম (বাম থেকে) অঙ্ক। এই সাইটটির মাধ্যমে সন্ধান করে আমি আমার সমস্যার উত্তর পেয়েছি কীভাবে সি এল এলিতে সমস্ত …

2
আইকনভিআইজি অবৈধ ইনপুট ক্রম- কেন?
কোনও পাঠ্য ফাইলকে তার ASCII সমতুল্যে রূপান্তর করার চেষ্টা করার সময়, আমি ত্রুটি বার্তাটি পাই iconv: illegal input sequence at position। কমান্ড আমি ব্যবহার করি iconv -f UTF-8 -t ascii//TRANSLIT file আপত্তিজনক চরিত্রটি হল æ। এখানে টেক্সট ফাইল উপস্থিত রয়েছে । কেন এটি অবৈধ ক্রম বলে? ইনপুট অক্ষরটি যথাযথ ইউটিএফ …

2
Vim কি কেবল ASCII অক্ষর প্রদর্শন করতে পারে এবং অন্যান্য বাইটগুলি বাইনারি ডেটা হিসাবে বিবেচনা করতে পারে?
আমি ইতিমধ্যে জানি vim -b, তবে ব্যবহৃত লোকেলের উপর নির্ভর করে এটি একক অক্ষর হিসাবে বহু-বাইট অক্ষর (ইউটিএফ -8 এর মতো) প্রদর্শন করে। আমি কীভাবে vimকেবল ASCII মুদ্রণযোগ্য অক্ষরগুলি প্রদর্শন করতে এবং বাক্সটিকে বাইনারি ডেটা হিসাবে বিবেচনা করতে বলতে পারি , চরসেটটি কোনও ব্যাপার না?

2
উইজেট এইচটিএমএল পরিবর্তে বাইনারি ফিরে?
আমি একটি স্ট্যাটিক এইচটিএমএল পৃষ্ঠা ডাউনলোড করতে উইজেট ব্যবহার করছি। ডাব্লু 3 সি ভ্যালিডেটর আমাকে জানান যে পৃষ্ঠাটি ইউটিএফ -8 এ এনকোড করা আছে। তবুও আমি ডাউনলোডের পরে যখন ফাইলটি বিড়াল করি তখন আমি একগুচ্ছ বাইনারি ননসেন্স পাই। আমি উবুন্টুতে আছি, এবং আমি ভেবেছিলাম ডিফল্ট এনকোডিংটি ইউটিএফ -8? আমার লোকাল …

5
ফায়ারফক্সে ইউটিএফ -8 এ ফ্যালব্যাক এনকোডিং কীভাবে সেট করবেন?
আমি একটি নরওয়েজিয়ান মার্কডাউন ডকুমেন্ট লিখেছি: $ file brukerveiledning.md brukerveiledning.md: UTF-8 Unicode text markdownকমান্ডটি ব্যবহার করে আমি এটি এইচটিএমএল রূপান্তর করেছি : $ markdown > brukerveiledning.html < brukerveiledning.md $ file brukerveiledning.html brukerveiledning.html: UTF-8 Unicode text তবে, ফায়ারফক্স "উইন্ডোজ -১২২২" এনকোডিংটি ব্যবহারের জন্য জোর করে, নন-এএসসিআইআই অক্ষরগুলি ভেঙে দেয়। আমি "ডিফল্ট …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.