utf8 এবং ল্যাটিন 1 এর মধ্যে পার্থক্য কী?
utf8 এবং ল্যাটিন 1 এর মধ্যে পার্থক্য কী?
উত্তর:
ইউটিএফ -8 বিশ্ব আধিপত্যের জন্য প্রস্তুত, লাতিন 1 নয়।
আপনি latin1 এনকোডিং ব্যবহার চীনা, জাপানি, হিব্রু, রাশিয়ান, ইত্যাদি মত অ ল্যাটিন অক্ষর সংরক্ষণ করার চেষ্টা করছেন, তাহলে তারা শেষ হবে মোজিবেক । আপনি এই নিবন্ধটির প্রারম্ভিক পাঠ্যটি দরকারী (এবং যদি আপনি কিছুটা জাভা জানেন তবে আরও কিছু পেতে পারেন)।
নোট করুন যে পূর্ণ 4-বাইট ইউটিএফ -8 সমর্থনটি কেবল মাইএসকিউএল 5.5-এ চালু হয়েছিল। সংস্করণটির আগে, এটি কেবল অক্ষর প্রতি 3 বাইট পর্যন্ত যায়, চারিত্রিক প্রতি 4 বাইট নয়। সুতরাং, এটি কেবল বিএমপি বিমানটিকে সমর্থন করেছে এবং উদাহরণস্বরূপ ইমোজি বিমান নয়। আপনি যদি পুরো 4-বাইট ইউটিএফ -8 সমর্থন চান, তবে মাইএসকিউএলকে কমপক্ষে 5.5-এ উন্নীত করুন বা পোস্টগ্র্রেএসকিউএল এর মতো অন্য আরডিবিএমএসে যান। মাইএসকিউএল 5.5+ এ এটি বলা হয় utf8mb4
।
VARBINARY
পরিবর্তে নিজের মতো করে সাশ্রয় করতে VARCHAR
এবং ব্যবসায়ের স্তরটিতে ডিকোড / এনকোড করতে পারবেন তবে এটি হ্যাকি hack একটি নতুন প্রশ্ন জিজ্ঞাসা বিবেচনা করুন, সম্ভবত আরও ভাল উপায় আছে।
লাতিন 1 এ প্রতিটি অক্ষর হ'ল এক বাইট দীর্ঘ। Utf8 এ একটি চরিত্র একাধিক বাইট নিয়ে গঠিত হতে পারে। ফলস্বরূপ utf8 এর ল্যাটিন 1 এর চেয়ে বেশি অক্ষর রয়েছে (এবং যে অক্ষরগুলির মধ্যে তাদের মিল রয়েছে তা অবশ্যই একই বাইট / বাইটেস্কেন্স দ্বারা উপস্থাপিত হয় না)।
binary
কোলিট মানে ...? এবং কোনটি ইংরেজি / সংখ্যাগত ক্ষেত্রগুলির জন্য ভাল: ascii_general_ci
বা ascii_bin
?