ল্যাটিন বর্ণমালার চাক্ষুষভাবে এবং শ্রুতিমধুরভাবে অস্পষ্ট সাবসেট?


13

কল্পনা করুন আপনি "5SBDO0" কোড সহ কাউকে একটি কার্ড দিয়েছেন।

কিছু ফন্টে, "এস" অক্ষরটি পাঁচ নম্বর থেকে চাক্ষুষভাবে পৃথক করা কঠিন, (শূন্য সংখ্যা এবং অক্ষরের সাথে "ও")।

কোডটি জোরে জোরে পড়া, "বি" কে "ডি" থেকে আলাদা করা, "কুকুরের মতো ডি" বলা বা তার পরিবর্তে " ফোনেটিক বর্ণমালা " ব্যবহার করা কঠিন হতে পারে

চিঠিগুলি এবং সংখ্যার বৃহত্তম উপসেটটি কী যা বেশিরভাগ ক্ষেত্রে উচ্চস্বরে পড়ার সময় উভয়ই দৃষ্টিশক্তিহীনভাবে দেখতে এবং দ্ব্যর্থহীন শোনায়?


পটভূমি:

আমরা একটি সংক্ষিপ্ত স্ট্রিং তৈরি করতে চাই যা যোগাযোগের সহজ থাকা সত্ত্বেও যতটা সম্ভব মানকে এনকোড করতে পারে।

কল্পনা করুন আপনার কাছে একটি 6-অক্ষরের স্ট্রিং রয়েছে, "123456"। বেস 10 এ এটি 10 ^ 6 মানগুলি এনকোড করতে পারে ।

হেক্স "1B23DF" এ আপনি একই সংখ্যায় অক্ষর 16 values ​​6 মান এনকোড করতে পারেন , তবে জোরে জোরে পড়লে এটি দ্ব্যর্থক শব্দ হতে পারে। ("বি" বনাম "ডি")

একইভাবে এন অক্ষরের যে কোনও স্ট্রিংয়ের জন্য, আপনি (বর্ণমালার আকার) ^ N মান পাবেন।

স্ট্রিংটি প্রায় ছয় অক্ষরের দৈর্ঘ্যের মধ্যে সীমাবদ্ধ, মানুষের কর্মক্ষম স্মৃতি ক্ষমতার ক্ষমতার মধ্যে সহজেই ফিট করতে চায় বলে ।

সুতরাং আমরা যে এনকোড করতে পারি তার সর্বাধিক সংখ্যার সন্ধান করতে, আমাদের সেই বৃহত অক্ষর / সংখ্যার সবচেয়ে বড় সংখ্যক সেট খুঁজে পেতে হবে। আমরা জিজেড, এবং কিছু সাধারণ বিরামচিহ্নগুলি বিবেচনা করতে পারি না এমন কোনও কারণ নেই, তবে আমি "G এর মতো আওয়াজ করে?", "জি কি বিয়ের মতো লাগে?", "করে সি এর মতো জি শব্দ আমার নিজের sound আমরা জানি যে এটি ও (এন O 2) ভাষাগত কাজটি করা =) ...


6
নোট করুন যে বর্ণগুলি একই রকম উচ্চারণ করা হয় তা ভাষার মধ্যে অনেক পার্থক্য করতে পারে ...
মাইকেল বর্গওয়ার্ট

এছাড়া ঠিক কি লাতিন বর্ণমালা?
এমএসএলটাররা

সম্পর্কিত স্ট্যাকওভারফ্লো প্রশ্নে আমার উত্তরও দেখুন ।
এমসাল্টাররা

চাক্ষুষ পার্থক্যের জন্য, বেস 32 হ'ল একটি স্ট্যান্ডার্ড এনকোডিং যা প্রতীকগুলির মিলগুলিকে সীমাবদ্ধ করে।
বারজাক

@ সল্টার্স "ল্যাটিন স্ক্রিপ্ট" একটি ভাষাবিজ্ঞানের ধারণা, আমাদের উদ্দেশ্যগুলির জন্য আমি সত্যিই বলতে চাইছি "ইউনিকোডে কোডিত লাতিন স্ক্রিপ্টের উপসেটটি থেকে নির্বাচন করুন" উদাহরণস্বরূপ en.wikedia.org/wiki/ISO/IEC_8859-1
ইলিয়ট 42

উত্তর:


15

আপনার বর্ণমালার সেটটি ভিজ্যুয়াল মিলের মাধ্যমে গোষ্ঠীতে বিভক্ত করা উচিত এবং প্রতিটি গ্রুপ থেকে একটি "সর্বাধিক আইকনিক" প্রতিনিধি বেছে নেওয়া উচিত। এটি কিছুটা বিষয়গত, যদিও আপনি এটিতে ব্যবহারকারীর পরীক্ষা চালাতে পারেন। আপনি যে পছন্দগুলি করেন সেগুলিও চিত্রগুলি মুদ্রিত হবে বা হাতে লেখা থাকবে কিনা তার উপর নির্ভর করে। উদাহরণ স্বরূপ:

  • { হে , 0 , প্রশ্ন , ডি }

  • { আমি , এল , 1 }

  • { বি , 8 }

  • { জেড , 2 }

  • { এস , 5 }

  • { 7 , টি }

  • { ইউ , ভি , ওয়াই }

একইভাবে, পার্টিশনের অক্ষরগুলি তাদের নামের উচ্চারণের ফোনেটিক মিলের দ্বারা:

  • { [ɪeɪ], [ʔeɪ (ʔ / টি)]}
    = [[eɪ] দিয়ে শুরু হয়

  • { পি [পাই:], বি [দ্বি:], ভি [ভি:], ডি [দি:], টি [টিআই:], [ʔi:]}
    = স্টপ / ফ্রিক্যাটিক + [i:]

  • { জি [ʤi:], সি [সিআই:], জেড [জিআই:] , [[আইআই:]}
    = ফ্রিক্যালিটিভ / অ্যাফ্রিকেট (গুচ্ছ) + [i:]

  • { এম [ɛm], এন [ɛn]}
    = [ɛ] + অনুনাসিক

  • { এস [ɛs], এফ [ɛফ], এক্স []ks]}
    = [ɛ] + ঘর্ষণমূলক / সংক্ষিপ্ত

  • { আমি [ʔaɪ], ওয়াই [ওয়াɪ], [ফাভ], [নাɪান]}
    = ব্যঞ্জনবর্ণ + [এɪ] + (ব্যঞ্জনবর্ণ)

  • { প্রশ্ন [কেজেʉ:], ইউ [জে:], [টি (জে) ʉ:]}
    = ব্যঞ্জনবর্ণ + [(জে) ʉ:]

এগুলি অবশ্যই একমাত্র সম্ভাব্য পার্টিশন নয়, এই মুহুর্তে কেবল মনে মনে আসে। নির্বিশেষে, আপনাকে আরও পরীক্ষার জন্য শুরু করার জন্য এগুলি পর্যাপ্ত হওয়া উচিত। এছাড়াও, এগুলি কোনও পেশাদার উত্স দ্বারা ব্যাক আপ হয় না typ আমি টাইপোগ্রাফি এবং শব্দবিজ্ঞানে কেবল আমার শখের পটভূমি উদ্ধৃত করি।


3
অডিটরি মিলের সাথে শুরু করার জন্য, এয়ার ট্র্যাফিক কন্ট্রোল অপারেশন ম্যানুয়ালগুলি (যেখানে মৌখিক যোগাযোগগুলি অবশ্যই সঠিকভাবে ব্যাখ্যা করতে হবে বা লোকেরা মারা যায়) এবং হ্যাম রেডিওর মতো রেডিও যোগাযোগগুলি দেখুন। উদাহরণস্বরূপ 5 এবং 9 টি মিশ্রিত করা সহজ, অতএব "পাঁচ" এবং "
নাইন

@ ম্যাটনজ: ধন্যবাদ, আমি 5 এবং 9. ভুলে গেছি অডিও গুনাগুণ পাশাপাশি একটি বড় কারণ: রেডিও, টেলিফোন, স্টুডিও রেকর্ডিং এবং ব্যক্তিগত যোগাযোগ সমস্তই তাদের নিজস্ব অনন্য সমস্যা p
জন পূর্দি

1
প্রযুক্তিগতভাবে এটি "নিনার," চারটি "শক্তিশালী" "
প্যাট্রিক হিউজেস 0

3

আপনি যান্ত্রিক তুরস্ক ব্যবহার করতে পারেন আসল লোকদের সমস্ত 26 ^ 2 জোড়ার অক্ষর এবং চাক্ষুষ মিলের জন্য rate সুবিধাটি হ'ল আপনি এমনকি বিভিন্ন স্থানীয় ভাষার ডেটা পেতে পারেন।


1

ইংরেজির জন্য, সাউন্ডেক্স এবং মেটাফোন অ্যালগরিদমগুলি এনকোড যা শব্দগুলি দ্ব্যর্থক। সাউন্ডেক্স সম্ভবত খুব সহজ, তবে মেটাফোন কিছু ভাল পয়েন্ট অন্তর্ভুক্ত করেছে। আপনি কি "OU" ক্রমটি চান? এটি বিভিন্নভাবে উচ্চারণ করা যেতে পারে, যেমন এই বাক্যটি হ'ল;


0

উপরের জন পুরীর উত্তর সবচেয়ে সঠিক বলে মনে হচ্ছে। ব্যবহারিক উদ্দেশ্যে, আমি চেষ্টা করছি z-base-32, যোগাযোগের বিবেচনায় রেখে ডিজাইন করা একটি অ-মানক বেস 32 এনকোডিং। এটি কার্যকর নয়, যদিও আদর্শ নয় - উদাহরণস্বরূপ তারা স্পষ্টভাবে কথ্য বিশৃঙ্খলার দিকে মনোনিবেশ করেনি।

http://philzimmermann.com/docs/human-oriented-base-32-encoding.txt

http://pypi.python.org/pypi/zbase32/

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.