এক্সেল এনকোডিংস
WINDOWS-1252
এক্সেলের সাথে কাজ করার সময় আমি এনকোডিংটি সর্বনিম্ন হতাশাজনক বলে মনে করেছি। মূলত মাইক্রোসফ্টসের মালিকানাধীন স্বত্বের অক্ষর সেট হওয়ায়, কেউ এটি ম্যাক এবং এমএস-এক্সেলের উইন্ডোজ সংস্করণ উভয়তেই কাজ করবে বলে ধরে নিতে পারে। উভয় সংস্করণে অন্তত কোনও "ফাইল উত্স" বা "ফাইল এনকোডিং" নির্বাচনকারী অন্তর্ভুক্ত রয়েছে যা সঠিকভাবে ডেটা পড়ে।
আপনার সিস্টেমে এবং সরঞ্জাম আপনি ব্যবহার করেন তার উপর নির্ভর করে, এই এনকোডিং এছাড়াও নামে যেতে পারে CP1252
, ANSI
, Windows (ANSI)
, MS-ANSI
বা শুধু Windows
, অন্যান্য বৈচিত্র মধ্যে।
এই এনকোডিংটি ISO-8859-1
(ওরফে LATIN1
এবং অন্যান্য) সুপারসেট , সুতরাং আপনি ISO-8859-1
যদি WINDOWS-1252
কোনও কারণে ব্যবহার না করতে পারেন তবে আপনি ফ্যালব্যাক করতে পারেন । এখানে প্রদর্শিত হিসাবে ISO-8859-1
কিছু অক্ষর অনুপস্থিত পরামর্শ দেওয়া হচ্ছে WINDOWS-1252
:
| Char | ANSI | Unicode | ANSI Hex | Unicode Hex | HTML entity | Unicode Name | Unicode Range |
| € | 128 | 8364 | 0x80 | U+20AC | € | euro sign | Currency Symbols |
| ‚ | 130 | 8218 | 0x82 | U+201A | ‚ | single low-9 quotation mark | General Punctuation |
| ƒ | 131 | 402 | 0x83 | U+0192 | ƒ | Latin small letter f with hook | Latin Extended-B |
| „ | 132 | 8222 | 0x84 | U+201E | „ | double low-9 quotation mark | General Punctuation |
| … | 133 | 8230 | 0x85 | U+2026 | … | horizontal ellipsis | General Punctuation |
| † | 134 | 8224 | 0x86 | U+2020 | † | dagger | General Punctuation |
| ‡ | 135 | 8225 | 0x87 | U+2021 | ‡ | double dagger | General Punctuation |
| ˆ | 136 | 710 | 0x88 | U+02C6 | ˆ | modifier letter circumflex accent | Spacing Modifier Letters |
| ‰ | 137 | 8240 | 0x89 | U+2030 | ‰ | per mille sign | General Punctuation |
| Š | 138 | 352 | 0x8A | U+0160 | Š | Latin capital letter S with caron | Latin Extended-A |
| ‹ | 139 | 8249 | 0x8B | U+2039 | ‹ | single left-pointing angle quotation mark | General Punctuation |
| Œ | 140 | 338 | 0x8C | U+0152 | Œ | Latin capital ligature OE | Latin Extended-A |
| Ž | 142 | 381 | 0x8E | U+017D | | Latin capital letter Z with caron | Latin Extended-A |
| ‘ | 145 | 8216 | 0x91 | U+2018 | ‘ | left single quotation mark | General Punctuation |
| ’ | 146 | 8217 | 0x92 | U+2019 | ’ | right single quotation mark | General Punctuation |
| “ | 147 | 8220 | 0x93 | U+201C | “ | left double quotation mark | General Punctuation |
| ” | 148 | 8221 | 0x94 | U+201D | ” | right double quotation mark | General Punctuation |
| • | 149 | 8226 | 0x95 | U+2022 | • | bullet | General Punctuation |
| – | 150 | 8211 | 0x96 | U+2013 | – | en dash | General Punctuation |
| — | 151 | 8212 | 0x97 | U+2014 | — | em dash | General Punctuation |
| ˜ | 152 | 732 | 0x98 | U+02DC | ˜ | small tilde | Spacing Modifier Letters |
| ™ | 153 | 8482 | 0x99 | U+2122 | ™ | trade mark sign | Letterlike Symbols |
| š | 154 | 353 | 0x9A | U+0161 | š | Latin small letter s with caron | Latin Extended-A |
| › | 155 | 8250 | 0x9B | U+203A | › | single right-pointing angle quotation mark | General Punctuation |
| œ | 156 | 339 | 0x9C | U+0153 | œ | Latin small ligature oe | Latin Extended-A |
| ž | 158 | 382 | 0x9E | U+017E | | Latin small letter z with caron | Latin Extended-A |
| Ÿ | 159 | 376 | 0x9F | U+0178 | Ÿ | Latin capital letter Y with diaeresis | Latin Extended-A |
নোট করুন যে ইউরো চিহ্নটি অনুপস্থিত । এই টেবিলটি অ্যালান উডে পাওয়া যাবে ।
রূপান্তর
রূপান্তরকরণ প্রতিটি সরঞ্জাম এবং ভাষায় আলাদাভাবে করা হয়। তবে, ধরুন আপনার কাছে এমন একটি ফাইল রয়েছে query_result.csv
যা আপনি জানেন যা UTF-8
এনকোড করা আছে। এটি WINDOWS-1252
ব্যবহার করে রূপান্তর করুন iconv
:
iconv -f UTF-8 -t WINDOWS-1252 query_result.csv > query_result-win.csv