ভাষা + HTML5 ল্যাং বৈশিষ্ট্যের অঞ্চলগত মান


11

আমি এমন একটি ওয়েবসাইটে কাজ করছি যা language+regionএই ডাব্লু 3.org পৃষ্ঠায় বর্ণিত পদ্ধতি অনুসরণ করে স্থানীয়করণের সামগ্রী সরবরাহ করবে (যেমন fr-CAকানাডিয়ান ফরাসি সামগ্রী এবং fr-FR"ফরাসি ফরাসী" বিষয়বস্তুর জন্য)। যেহেতু আমরা প্রত্যেকটির বিষয়বস্তুকে language+regionঅনন্য বলে বিবেচনা করি, ততই আমাদের পক্ষে গুরুত্বপূর্ণ যে অনুসন্ধান ইঞ্জিনগুলি যথাযথভাবে সেই বিষয়বস্তুটি সনাক্ত করে এবং পরিবেশন করে।

ইন্টারনেটে অনুসন্ধান করে (উদাহরণস্বরূপ এই প্রশ্ন ), দেখা যায় যে বেশিরভাগ লোকেরা বিষয়বস্তুর ভাষা বর্ণনার জন্য এইচটিএমএল বৈশিষ্ট্যে কোনও ISO639 ভাষা কোড ব্যবহার করার পরামর্শ দেয় recommend langএই প্রস্তাবনার পরে, আমরা ব্যবহার করব <html lang="fr">যা উপরোক্ত language+regionসংমিশ্রণের মধ্যে পার্থক্য সক্ষম করবে না ।

এইচটিএমএল 4 স্পেসিফিকেশন পর্যালোচনা করার সময় , মনে হয় যে language+regionএকটি ভাষা কোড হিসাবে ব্যবহার করা পুরোপুরি ঠিক আছে, en-USউদাহরণ হিসাবে একটি সম্ভাব্য মান হিসাবে দেওয়া হয়েছে। তবে এইচটিএমএল 5 স্পেসিফিকেশনে আমি এর কোনও নিশ্চিতকরণ খুঁজে পাইনি যা সম্ভাব্য অনুমোদিত মানগুলির কোনও উদাহরণ সরবরাহ করে না বলে মনে হয়।

সেখান থেকে ওয়েব জায়ান্টরা কী করছে তা দেখে আমি ডি-ফ্যাক্টো উত্তর পাওয়ার চেষ্টা করেছি। ফেসবুক কী করছে তা আমি দেখেছি: এইচটিএমএল langমানটি একই থাকায় তারা বিভিন্ন ওয়েবসাইটের (কিছুটা) ক্যান্ডিয়ান ফরাসি এবং ফরাসি ফরাসি সংস্করণগুলি সরবরাহ করে :

fr-CA
ইউআরএল: http://fr-ca.facebook.com
এইচটিএমএল ল্যাং বৈশিষ্ট্য: <html lang="fr">
'ইমেল' শব্দের অনুবাদ:courriel

fr-FR
URL: http://fr-fr.facebook.com/
HTML lang গুণ: <html lang="fr">
'ইমেল' শব্দের অনুবাদ:Adresse électronique

language+regionএইচটিএমএল 5 এ পদ্ধতির সাহায্যে স্থানীয়করণ করা সামগ্রীর বর্ণনা দেওয়ার প্রস্তাবিত / মানক উপায় কী ?

উত্তর:


5

W3C এর প্রদান করে এই খুব দীর্ঘ পথ প্রদর্শক ভাষা ট্যাগ / subtags নির্বাচন।

গুরুত্বপূর্ণ বিট:

ভাষা ট্যাগ বাক্য গঠনটি আইইটিএফ এর বিসিপি 47 দ্বারা সংজ্ঞায়িত করা হয় । আগে সঠিক সাবট্যাগগুলি সন্ধানের জন্য বিভিন্ন আইএসও স্ট্যান্ডার্ডগুলিতে কোডের তালিকাগুলির সাথে পরামর্শ করা দরকার ছিল, তবে এখন আপনাকে কেবল আইএএনএ ভাষা সাবট্যাগ রেজিস্ট্রিটি সন্ধান করতে হবে । আমরা নীচে নতুন রেজিস্ট্রি বর্ণনা করব।

এই নিবন্ধটি কোনও ভাষা ট্যাগের উপাদানগুলি কীভাবে চয়ন করতে হয় সে সম্পর্কে পরামর্শ সরবরাহ করে। বিসিপি 47-এ সংজ্ঞায়িত ধারণাগুলির সংক্ষিপ্তসারগুলির জন্য, এইচটিএমএল এবং এক্সএমএল এ ভাষা ট্যাগগুলি দেখুন ।

...

এমন সরঞ্জামগুলি উপলব্ধ রয়েছে যা নিবন্ধগুলি অনুসন্ধান করার সময় অতিরিক্ত সহায়তা সরবরাহ করে, যেমন রিচার্ড ইশিদার ভাষা সাবট্যাগ লুকআপ সরঞ্জাম

...

আপনার সঠিক ভাষা আছে তা নিশ্চিত করুন। কখনও কখনও, এটি কয়েকটি বিকল্প চেক করতে অর্থ প্রদান করে। বিসিপি 47-এর সহ-লেখক, মার্ক ডেভিস লিখেছেন "প্রায়শই এটি কোন ভাষা শনাক্তকারী ব্যবহার করবেন তা পরিষ্কার হয় না example উদাহরণস্বরূপ, পাকিস্তানে বেশিরভাগ মানুষ পাঞ্জাবি বলে আসলে আসলে কোড 'লাহ', এবং আনুষ্ঠানিক নাম 'লাহন্দা' রয়েছে many অনেকগুলি রয়েছে অন্যান্য ক্ষেত্রে যেখানে একই ভাষার নাম বিভিন্ন ভাষার জন্য ব্যবহৃত হয়, বা লোকেরা যে নামটি সন্ধান করে তা আইএএনএ রেজিস্ট্রিতে তালিকাভুক্ত নয় ""

আপনি এসআইএল ইথনোলজ এবং ক্রস-রেফারেন্সে ভাষার তথ্য উইকিপিডিয়ায় সন্ধান করতে পারেন । এথনোলগটি বিসিপি 47 এর মতো একই তিনটি অক্ষরের কোড ব্যবহার করে তবে কোড অনুসারে কোনও ভাষা সন্ধান করতে আপনাকে BCP47 2-বর্ণ কোডগুলি তাদের আইএসও 639-3 সমমর্যাদায় রূপান্তর করতে হবে । ( রিচার্ড ইশিদার সরঞ্জামটি আপনার পক্ষে এটি করে))

খুব অল্প সংখ্যক ক্ষেত্রেই রয়েছে যেখানে বহু লোক একই ভাষা হিসাবে বিবেচনা করে তার জন্য বিভিন্ন ভাষার কোড উপলভ্য। ফিলিপিনো এবং তাগালগ, বা টোয়াই এবং আকান। রেজিস্ট্রিটিতে আপনার কোনটি ব্যবহার করা উচিত সে সম্পর্কে কোনও ইঙ্গিত নেই, তবে আপনার একক অ্যাপ্লিকেশন বা প্রসঙ্গের মধ্যে আপনি সামঞ্জস্যপূর্ণ তা নিশ্চিত করার চেষ্টা করা উচিত।

(জোর আমার।)

এটি লক্ষ করা উচিত যে আইএএনএ ভাষার সাবট্যাগ রেজিস্ট্রি ব্যবহার করা খুব কঠিন। পিতামহী-ইন ট্যাগগুলি (যেমন en-GB-oed) বাদে , আপনাকে ভাষা পরিবার ট্যাগ এবং অঞ্চল / বৈকল্পিক সাবট্যাগগুলি আলাদাভাবে সন্ধান করতে হবে। এবং ট্যাগ / সাবট্যাগগুলি শ্রেণিবিন্যাসের পরিবর্তে টাইপ দ্বারা সংগঠিত হয়। তাই কেবল নিজের সময় এবং ঝামেলা সাশ্রয় করুন এবং রিচার্ড idaশিডার দুর্দান্ত চেহারা দেখার সরঞ্জামটি ব্যবহার করুন


2

তারা প্রকৃত সামগ্রীর সাথে মিল থাকলে ব্যবহার করে <html lang="fr-FR">এবং <html lang="fr-CA">জরিমানা। তারা যেমন সার্চ ইঞ্জিন দ্বারা উপেক্ষা করা <html lang="fr">হয়।

এইচটিএমএল 5 এর অর্থ ভাষা কোডের ব্যবহার পরিবর্তন করা নয়। বিসিপি 47-এ সংজ্ঞায়িত কোডগুলির সিস্টেম এবং এতে এক্সটেনশানগুলি অত্যন্ত বিস্তৃত এবং আপনাকে বেদনাদায়ক নির্ভুলতার জন্য কোনও ভাষা রূপ নির্দিষ্ট করতে দেয়। শিল্পের অবস্থা অনেক বেশি, সরল স্তরে রয়েছে এবং এফআর-এফআর এবং ফ্রি-সিএ আপনি সফ্টওয়্যারটিতে এই দিনগুলি অর্জন করতে পারেন এমন সেরা গ্রানুলারিটির প্রতিনিধিত্ব করে; প্রায়শই, কেবলমাত্র মূল কোড (এখানে, ফরাসী ভাষায়) গুরুত্বপূর্ণ।

অনুসন্ধানের ইঞ্জিনগুলির কোনও ভাষা কোডের কোনও ঘোষণায় যেমন কোনও বৈশিষ্ট্যগুলিতে কোনও মনোযোগ দেওয়ার কোনও প্রমাণ নেই lang। অন্যান্য সফ্টওয়্যার, যেমন হাইফেনেটর, স্পেলিং চেকার, স্পিচ সিনথেসাইজার এবং ডিফল্ট ফন্ট নির্বাচন অ্যালগরিদমের langবৈশিষ্ট্যগুলিকে বিবেচনায় নিতে পারে । তবে অনুসন্ধান ইঞ্জিনগুলি প্রকৃত সামগ্রীর উপর ভিত্তি করে তাদের তাত্ত্বিক বিশ্লেষণ করে।

এটির জন্য তাদের দোষ দেওয়া কঠিন, যেহেতু এটি langগুণাবলী বিশ্বাসের চেয়ে ভাল ফলাফল দেয় । উদাহরণস্বরূপ, অনেক অনুমোদনের সরঞ্জাম lang="en"লেখককে না জানিয়ে প্রকৃত সামগ্রী নির্বিশেষে স্বয়ংক্রিয়ভাবে উত্পন্ন করে।


2

[এটি আমার সবচেয়ে শক্তিশালী অঞ্চল নয়, সুতরাং আমি এখানে কেবলমাত্র ডকুমেন্টেশনের উদ্ধৃতি দিচ্ছি তবে মনে হচ্ছে আপনি কোনও কিছুকে উপেক্ষা করেছেন]]

HTML5 এর বৈশিষ্ট প্রয়োজন যে langমান অবশ্যই একটি বৈধ হতে BCP 47 ট্যাগ । সেই দস্তাবেজে, প্রাসঙ্গিক বিটটি 3.4 বিভাগে রয়েছে বলে মনে হচ্ছে:

উদাহরণস্বরূপ, একটি বাস্তবায়ন বর্ধিত ভাষার ব্যাপ্তিকে প্রাথমিক সীমাতে ম্যাপ করতে পারে। আর একটি সম্ভাবনা ASCII- ক্রমে প্রথম যে ম্যাচিং ট্যাগটি ফিরিয়ে আনার জন্য একটি বাস্তবায়ন হবে। যদি ভাষার পরিসর "* -CH" ('সিএইচ' সুইজারল্যান্ডকে উপস্থাপন করে) এবং ট্যাগগুলির সেটটিতে "ডি-সিএইচ" (সুইজারল্যান্ডে ব্যবহৃত জার্মান), "ফ্র-সিএইচ" (ফরাসী, সুইজারল্যান্ড) এবং "এটি অন্তর্ভুক্ত ছিল -CH "(ইতালিয়ান, সুইজারল্যান্ড), তারপরে" ডি-সিএইচ "ট্যাগটি ফিরে আসবে।

... যা আপনি যখন এটি তাকান মূলত আপনি HTML 4 স্পেস থেকে আরএফসি 1766 উদ্ধৃত করে এসেছিলেন, কেবলমাত্র আরও বৃহত্তর বিশদে।


আপনার উদ্ধৃত অনুচ্ছেদটি সনাক্ত করতে আমার অসুবিধা হচ্ছে (আমি এর সরবরাহকৃত লিঙ্কটিতে এবং অংশ 3.4-তে এর কিছু কীওয়ার্ড অনুসন্ধান করেছি এবং কিছুই খুঁজে পাইনি)। আপনি কি আমাকে এটির একটি লিঙ্ক সরবরাহ করতে পারেন? (সম্ভব হলে হ্যাশ ট্যাগ সহ আদর্শ)।
সর্বোচ্চ

এইচটিএমএল 5 স্পেস কেবল প্রয়োজনীয় ফর্ম্যাটটিকে বোঝায়। উদ্ধৃত বিটটি বিসিপি 47 লিঙ্কের, এতে যে ফর্ম্যাটটি এটি সংজ্ঞায়িত হয়েছে।
সু '
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.