আপনি ফুরিয়ার রূপান্তরটি বৈশিষ্ট্য নিষ্কাশন প্রক্রিয়াতে দুটি বার প্রয়োগ করার কারণটি হ'ল বৈশিষ্ট্যগুলি সিপস্ট্রাম নামে একটি ধারণার উপর ভিত্তি করে। Cepstrum বর্ণালী শব্দের একটি নাটক - মূলত ধারণাটি হ'ল ফুরিয়ার ট্রান্সফর্ম দ্বারা ফ্রিকোয়েন্সি ডোমেনে সংকেত রূপান্তর করা এবং তারপরে অন্য রূপান্তরটি সম্পাদন করা যেমন ফ্রিকোয়েন্সি বর্ণালী একটি সংকেত।
যখন ফ্রিকোয়েন্সি বর্ণালী প্রতিটি ফ্রিকোয়েন্সি ব্যান্ডের প্রশস্ততা এবং ধাপ বর্ণনা করে, সিপস্ট্রাম ফ্রিকোয়েন্সি ব্যান্ডের মধ্যে বিভিন্নতা চিহ্নিত করে। সিপস্ট্রাম থেকে প্রাপ্ত বৈশিষ্ট্যগুলি ফ্রিকোয়েন্সি বর্ণালী থেকে সরাসরি নেওয়া বৈশিষ্ট্যের চেয়ে স্পিচকে আরও ভালভাবে বর্ণনা করতে পাওয়া যায়।
কিছুটা আলাদা আলাদা সংজ্ঞা রয়েছে। মূলত সিপস্ট্রাম ট্রান্সফর্মটিকে ফুরিয়ার ট্রান্সফর্ম -> জটিল লোগারিদম -> ফুরিয়ার ট্রান্সফর্ম [1] হিসাবে সংজ্ঞায়িত করা হয়েছিল। আরেকটি সংজ্ঞা হ'ল ফুরিয়ার ট্রান্সফর্ম -> জটিল লোগারিদম -> বিপরীত ফুরিয়ার রূপান্তর [2]] পরবর্তী সংজ্ঞাটির জন্য অনুপ্রেরণাটি সংশ্লেষিত সংকেতগুলি পৃথক করার দক্ষতায় হয় (মানুষের বক্তৃতা প্রায়শই একটি উত্তেজনা এবং ভোকাল ট্র্যাক্টের সংশ্লেষ হিসাবে মডেল করা হয়)।
স্পিচ রিকগনিশন সিস্টেমগুলিতে ভাল পারফরম্যান্সের জন্য যে জনপ্রিয় পছন্দ খুঁজে পাওয়া গেছে তা হ'ল ফ্রিকোয়েন্সি ডোমেনে একটি নন-লিনিয়ার ফিল্টার ব্যাংক প্রয়োগ করা (আপনি যে মেল বেনিংয়ের কথা উল্লেখ করছেন) [3]। নির্দিষ্ট অ্যালগরিদমকে ফুরিয়ার ট্রান্সফর্ম -> প্রস্থের বর্গক্ষেত্র -> মেল ফিল্টার ব্যাংক -> আসল লোগারিদম -> বিচ্ছিন্ন কোসাইন রূপান্তর হিসাবে সংজ্ঞায়িত করা হয়।
এখানে ডিসিটি দ্বিতীয় রূপান্তর হিসাবে নির্বাচন করা যেতে পারে, কারণ আসল-মূল্যবান ইনপুটটির জন্য, ডিএফটিটির আসল অংশটি এক ধরণের ডিসিটি। কেন ডিসিটি পছন্দ করা হয় তা হ'ল আউটপুটটি প্রায় সজ্জিত। সজ্জাযুক্ত বৈশিষ্ট্যগুলি একটি তির্যক কোভারিয়েন্স ম্যাট্রিক্স সহ গাউসীয় বিতরণ হিসাবে দক্ষতার সাথে মডেল করা যেতে পারে।
[1] বোগার্ট, বি, হিলি, এম।, এবং টুকি, জে (1963)। প্রতিধ্বনির জন্য টাইম সিরিজের কুইফেন্সি অ্যালানিসিস: সিপস্ট্রাম, সিউডো-অটোোকোরিয়েন্স, ক্রস-সিপস্ট্রাম এবং সাফ ক্র্যাকিং। টাইম সিরিজ বিশ্লেষণ অন সিম্পোজিয়ামের প্রসেসিং ইন, পি। 209-243।
[2] ওপেনহেইম, এ। এবং শ্যাফার, আর। (1968)। বক্তৃতার হোমোমর্ফিক বিশ্লেষণ। আইইইই লেনদেনগুলিতে অডিও এবং ইলেক্ট্রো-কৌস্টিক্স 16, পি। 221-226।
[3] ডেভিস, এস।, এবং মার্মেলস্টেইন, পি। (1980)। ক্রমাগত কথ্য বাক্যগুলিতে মনোসিলাব্লিক শব্দ স্বীকৃতির জন্য প্যারামেট্রিক প্রতিনিধির তুলনা। অ্যাকোস্টিকস, স্পিচ এবং সিগন্যাল প্রসেসিং সম্পর্কিত আইইইই লেনদেনগুলিতে 28, পৃষ্ঠা। 357-366।