আমাকে শুরু থেকে আরম্ভ করতে দিন। সিপস্ট্রাম গণনার মানক পদ্ধতিটি নিম্নলিখিত:
সি( x ( টি ) ) =এফ- 1[ লগ( চ[ এক্স ( T ) ] ) ]
এমএফসিসি সহগের ক্ষেত্রে কিছুটা আলাদা তবে এখনও একই রকম।
প্রাক জোর এবং উইন্ডোটিংয়ের পরে, আপনি আপনার সিগন্যালের ডিএফটি গণনা করুন এবং মেল স্কেলে পৃথক করা ওভারল্যাপিং ত্রিভুজাকার ফিল্টারগুলির ফিল্টার ব্যাঙ্ক প্রয়োগ করুন (যদিও কিছু ক্ষেত্রে লিনিয়ার স্কেল মেল থেকে ভাল):
সিপস্ট্রাম সংজ্ঞা সম্পর্কিত, আপনি এখন মেল-ফ্রিকোয়েন্সি স্কেলে বর্ণালী (হ্রাস বর্ণালী) এর খামের প্রতিনিধিত্ব করেছেন। আপনি যদি এটি উপস্থাপন করেন, তবে আপনি দেখতে পাবেন যে এটি আপনার মূল সংকেত বর্ণালীটির অনুরূপ bles
পরবর্তী পদক্ষেপটি উপরে প্রাপ্ত সহগের লগারিদম গণনা করা। এটি সিপস্ট্রামকে এমন একটি হোমোর্ফিক ট্রান্সফর্মেশন বলে মনে করা হয় যা ভোকাল ট্র্যাক্টের আবেগ প্রতিক্রিয়ার থেকে সংকেতকে পৃথক করে দেয় ইত্যাদি কীভাবে?
একটি মূল বক্তৃতা সংকেত গুলি ( টি ) বেশিরভাগই একটি আবেগ প্রতিক্রিয়া সঙ্গে মীমাংসিত হয় এইচ ( টি ) ভোকাল ট্র্যাক্টের:
গুলি^( টি ) = এস ( টি ) ⋆ এইচ ( টি )
ফ্রিকোয়েন্সি ডোমেন সমঝোতা হ'ল বর্ণালীর গুণ:
এস^( চ)) = এস( চ)) ⋅ এইচ( চ))
এটি নীচের সম্পত্তির উপর ভিত্তি করে দুটি ভাগে বিভক্ত হতে পারে: লগ( a ⋅ b ) = লগ( ক ) + লগ( খ )।
আমরা আরও প্রত্যাশা করি যে সময়ের সাথে সাথে আবেগের প্রতিক্রিয়া পরিবর্তন হচ্ছে না, সুতরাং এটি সহজেই গড়কে বিয়োগ করে সরানো যেতে পারে। এখন আপনি দেখুন কেন আমরা আমাদের ব্যান্ড শক্তির লগারিদম নিচ্ছি।
সিপস্ট্রাম সংজ্ঞাটির শেষ ধাপটি হবে ইনভার্স ফুরিয়ার ট্রান্সফর্ম এফ- 1। সমস্যাটি হ'ল আমাদের কাছে কেবল আমাদের লগ-এনার্জি রয়েছে, কোনও পর্যায়ের তথ্য নেই, সুতরাং প্রয়োগের পরে ifft
আমরা জটিল-মূল্যবান সহগগুলি পাই - এই সমস্ত প্রচেষ্টাটির একটি কমপ্যাক্ট উপস্থাপনা হওয়ার জন্য খুব মার্জিত নয়। যদিও আমরা ডিস্ক্রিট কোসিন ট্রান্সফর্মটি নিতে পারি, এটি এফটির 'সরলিকৃত' সংস্করণ এবং বাস্তব-মূল্যবান সহগগুলি পেতে পারি! এই পদ্ধতিটি আমাদের লগ-শক্তি সহগের সাথে মিলিয়ে থাকা কোসিনুসয়েড হিসাবে ভিজ্যুয়ালাইজ করা যায়। আপনি মনে করতে পারেন যে সিপস্ট্রামকে 'বর্ণালী বর্ণালী' বলা হয়? এটি অত্যন্ত পদক্ষেপ - আমরা আমাদের লগ-এনার্জি খামের সহগগুলিতে কোনও পর্যায়ক্রমের জন্য অনুসন্ধান করছি।
সুতরাং এখন আপনি দেখতে পাচ্ছেন যে এখন আসল বর্ণালীটি কেমন দেখাচ্ছে তা বোঝা বরং শক্ত। অতিরিক্ত হিসাবে, আমরা সাধারণত প্রথম 12 এমএফসিসি গ্রহণ করি কারণ উচ্চতর ব্যক্তিরা লগ-এনার্জিগুলিতে দ্রুত পরিবর্তনগুলি বর্ণনা করে যা সাধারণত স্বীকৃতির হারকে আরও খারাপ করে তোলে। সুতরাং ডিসিটি করার কারণগুলি নিম্নলিখিত ছিল:
মূলত আপনার অবশ্যই আইএফএফটি সম্পাদন করতে হবে, তবে ডিসিটি থেকে বাস্তব-মূল্যবান সহগগুলি পাওয়া আরও সহজ। অধিকন্তু, আমাদের আর পূর্ণ বর্ণালী (সমস্ত ফ্রিকোয়েন্সি বিন) নেই, তবে মেল ফিল্টার-ব্যাঙ্কের মধ্যে শক্তি সহগ রয়েছে, সুতরাং আইএফএফটি এর ব্যবহার কিছুটা ওভারকিল।
আপনি প্রথম চিত্রটিতে দেখুন যে ফিল্টার ব্যাংকগুলি ওভারল্যাপ করছে, সুতরাং একে অপরের পাশে থাকা শক্তিগুলি দুটিয়ের মধ্যে ছড়িয়ে পড়ছে - ডিসিটি এগুলি সজ্জিত করার অনুমতি দেয়। মনে রাখবেন যে গাউসিয়ান মিশ্রণ মডেলগুলির ক্ষেত্রে এটি একটি ভাল সম্পত্তি, যেখানে আপনি পূর্ণতর (সমস্ত সহগের সাথে সম্পর্কিত) এর পরিবর্তে তির্যক কোভেরিয়েন্স ম্যাট্রিক্স (অন্যান্য সহগের মধ্যে কোনও সম্পর্ক) ব্যবহার করতে পারবেন না - এটি বিষয়গুলিকে অনেক সরল করে তোলে।
মেল ফ্রিকোয়েন্সি সহগগুলি সজ্জিত করার আরেকটি উপায় হ'ল পিসিএ (প্রিন্সিপাল কম্পোনেন্ট এনালাইসিস), একমাত্র কৌশলটি এই উদ্দেশ্যে ব্যবহৃত হয়। আমাদের ভাগ্যের জন্য এটি প্রমাণিত হয়েছিল যে সিসিএল সজ্জিত করার ক্ষেত্রে ডিসিটি হ'ল পিসিএর একটি খুব ভাল অনুমান, তাই ডিসক্রেট কোসিন ট্রান্সফর্ম ব্যবহারের আরও একটি সুবিধা।
কিছু সাহিত্য:
হিউং-গুক কিম, নিকোলাস মোরো, টমাস সিকোড়া - এমপিইজি -7 অডিও এবং এর বাইরে: অডিও সামগ্রী সূচি এবং পুনরুদ্ধার