ভূমিকা
ইংরেজি থেকে ভিন্ন, জার্মান ভাষায় বেশ একটি ফোনমিক রাইটিং সিস্টেম রয়েছে বলে মনে করা হয় । এর অর্থ হ'ল বানান এবং উচ্চারণের মধ্যে যোগাযোগ খুব কাছাকাছি। আপনি যে শব্দটির সাথে পরিচিত নন এমনটি দেওয়া হলেও আপনি বানান পদ্ধতির কারণে এটি কীভাবে উচ্চারণ করবেন তা আপনি জানতেন। এর অর্থ একটি কম্পিউটারের এটি খুব সঠিকভাবে করতে সক্ষম হওয়া উচিত?
চ্যালেঞ্জ
এমন একটি প্রোগ্রাম বা ফাংশন লিখুন যা কোনও জার্মান শব্দের প্রতিনিধিত্ব করে একটি স্ট্রিং ইনপুট হিসাবে গ্রহণ করে এবং ইন্টারন্যাশনাল ফোনেটিক বর্ণমালায় (আইপিএ) মুদ্রণ করে বা এর উচ্চারণ প্রদান করে ।
আমি অবশ্যই আপনাকে জার্মান বা সম্পূর্ণ আইপিএ শিখতে যাচ্ছি না । এই উইকিপিডিয়া বিভাগটি আপনার প্রয়োজন আইপিএ সংক্রান্ত প্রায় সমস্ত জার্মান সরবরাহ করে এবং আমি একটি অবারিত সি # রেফারেন্স বাস্তবায়ন কোড করে দিয়েছি ।
সেই লিঙ্কটিতে প্রদত্ত 400 টি সাধারণ জার্মান শব্দ এবং তাদের আইপিএ উচ্চারণের (বৈধতার জন্য প্রয়োজনীয়) একটি তালিকা রয়েছে। এই তালিকা থেকে একটি উদাহরণ গ্রহণ করা, যদি ইনপুট হয় solltest
তবে সঠিক আউটপুট ˈzɔltəst
।
রেফারেন্স প্রয়োগটি উইকিপিডিয়া বিভাগে উল্লিখিত নয় এমন দুটি সহায়ক বিধি যুক্ত করেছে: এটি ধরে নিয়েছে যে শব্দটির চাপটি প্রথমে উচ্চারণে রয়েছে (খুব সম্ভবত জার্মান ভাষায়), এবং "ই" অক্ষরটি যখন স্কওয়া শব্দ / ə / কে উপস্থাপন করে তা নির্ধারণের জন্য আরও ভাল শব্দতত্ত্ব ব্যবহার করে। এটি উপসর্গগুলির জন্য বিশেষ প্রক্রিয়াজাতকরণও প্রয়োগ করে, তবে ফলাফলের উন্নতি হয়নি যতটা আমি ভেবেছিলাম।
বিস্তারিত
একটি বৈধ এন্ট্রি হিসাবে বিবেচনা করা, আপনার প্রোগ্রাম অবশ্যই নিম্নলিখিত প্রয়োজনীয়তা পূরণ করতে হবে:
- আপনার আইপিএ আউটপুট অবশ্যই রেফারেন্স শব্দের তালিকার 400 শব্দগুলির মধ্যে কমপক্ষে 300 শব্দের সাথে একটি সঠিক মিল হতে হবে (রেফারেন্স বাস্তবায়নটি 333 সঠিক হয়ে যায়)
- আপনার প্রোগ্রামটি অবশ্যই যেকোন প্রশংসনীয় জার্মান শব্দের জন্য অনুমান করা উচিত। সুতরাং আমাদের একটি প্রযুক্তিগত প্রয়োজনীয়তা রয়েছে, এর অর্থ
[a-zA-ZäÄöÖüÜ][a-zäöüß]*
হ'ল রেগেক্সের সাথে মেলে এমন কোনও ইনপুট এবং কমপক্ষে একটি স্বর (আইওইউইস) রয়েছে, আপনাকে অবশ্যই কেবল অ-সাদা বাক্সের আউটপুট উত্পাদন করতে হবে এবং ত্রুটিযুক্ত নয়। - প্রোগ্রামটি অবশ্যই ডিটারমিনিস্টিক হতে হবে (সর্বদা একই ইনপুট দেওয়া একই আউটপুট উত্পাদন করে)
- অন্যথায়, স্ট্যান্ডার্ড লুফোলগুলি নিষিদ্ধ করা হয়েছে (বিশেষত অফ সাইট রিসোর্সগুলি আনার বিষয়ে একটি)
বিবিধ জিনিস আপনাকে করার অনুমতি দেওয়া হয়েছে:
- আপনার যদি প্রয়োজন হয় তবে আপনার আউটপুটে শীর্ষস্থানীয় এবং পেছনের শ্বেত স্থান রাখুন
- আউটপুটে কোনও পূর্ব-বিদ্যমান অক্ষর এনকোডিং ব্যবহার করুন (ইউনিকোড ভালভাবে কাজ করা ছাড়া আমি আর কিছুই কল্পনা করতে পারি না, তবে আপনি যদি পারেন তবে সংযোগগুলি)
- ধরুন ইনপুটটি কিছু কিছু স্বাভাবিক আকারে রয়েছে যেমন ইউনিকোড নরমালাইজেশন ফর্ম এনএফডি, এনএফসি ইত্যাদি। উদাহরণস্বরূপ, ä একক অক্ষর বা বেস অক্ষর + একটি সংমিশ্রিত চরিত্র হিসাবে রচিত?
- স্ট্যান্ডার্ড ইনপুট এবং আউটপুট পদ্ধতি ব্যবহার করুন
স্কোরিং এবং আইপিএর অক্ষর
স্কোরিং বাইটে রয়েছে। সতর্কতা অবলম্বন করুন যে ইউটিএফ -8-তে জার্মান অক্ষর এবং আইপিএর অক্ষরগুলি 2 বাইট। এছাড়াও, আইপিএ অক্ষর U + 0327 অন্তর্ভুক্ত ব্রেভ নীচে (̯) একটি ইউনিকোড সংমিশ্রিত চরিত্র এবং এটি নিজস্বভাবে একটি 2 বাইট ইউটিএফ -8 অক্ষর। তার অর্থ ইউটিএফ -8 এ in জাতীয় কিছু 4 বাইট হিসাবে গণ্য হবে। কৌতূহলের জন্য, এই প্রতীকটির অর্থ স্বরবর্ণটি অক্ষরের নিউক্লিয়াস গঠন করে না (পূর্ববর্তীটি পরিবর্তে এটি করে)।
এছাড়াও, এই আইপিএর অক্ষরগুলি থেকে সাবধান থাকুন যে কোনও ফন্টে অন্যান্য এসসিআইআই অক্ষরের মতো দেখা যায়: ɡ, ɪ, ʏ, ː (একটি দীর্ঘ স্বর চিহ্নিত করে), ˈ (যে বর্ণচিহ্নগুলি বহুবিধ শব্দের মধ্যে চাপযুক্ত) has
রেফারেন্স শব্দের তালিকাটি কীভাবে তৈরি হয়েছিল
এই বিভাগটি অতিরিক্ত তথ্য যা চ্যালেঞ্জের জন্য প্রয়োজন নেই।
শব্দটি তালিকার এই উইকিশনারি শব্দ ফ্রিকোয়েন্সি তালিকা থেকে ধরা হয়েছিল , কেসিং পার্থক্যের কারণে পুনরাবৃত্তিগুলি মুছে ফেলল এবং ইংরাজী উইকিউশনারি (ওহ ওহে) তে জার্মান প্রবেশাধিকার নেই এমন দুটি শব্দ। আইপিএটি ছিল ইংলিশ এবং জার্মান উভয় উইকিউশনারি দেখে। যেখানে একাধিক উচ্চারণ দেওয়া হয়েছিল, আমি আরও আনুষ্ঠানিক এবং মানকটি বেছে নিয়েছি। যদি এটি স্পষ্ট না হয়, তবে আমি সাধারণ বিধিগুলির মধ্যে সবচেয়ে বেশি উপযুক্ত একটি নির্বাচন করেছি।
"R" বর্ণটি কীভাবে উচ্চারণ করা হয় তা আমাকে মানদণ্ডেও স্থির করতে হয়েছিল। এই চিঠিটি কীভাবে উচ্চারিত হয়েছিল তা অঞ্চলটির উপর নির্ভর করে এবং উইকশনারি কোনটি বেছে নিয়েছিল তা মোটেই সামঞ্জস্যপূর্ণ ছিল না। আমি অনুভব করেছি যে এটি নীচের দিকে ঝুঁকছে: "আর" উচ্চারণ করা হয় / ɐ̯ / যখন দীর্ঘ স্বর হয় এবং একটি স্বর অনুসরণ করে না, অন্যথায়, এটি ʁ ʁ সুতরাং, আমি পুরোপুরি নিয়মিত / (চ) ɛɐ̯ / ছিল এমন ভার্চুয়াল এবং এরফিক্সগুলি ব্যতীত তাদের সকলকে এই নিয়মটি অনুসরণ করতে পরিবর্তন করেছি। একইভাবে, আমি "ইইউ" কে / ɔʏ̯ / হিসাবে মানক করে তুলেছি।
#~WordData~"PhoneticForm"&
) এর জন্য গণিতের একটি অন্তর্নির্মিত রয়েছে , তবে এটি কেবল ইংরেজী শব্দের জন্যই কাজ করে।