এমএফসিসি গণনায় এটি কি ডিসিটি পদক্ষেপের সঠিক ব্যাখ্যা?


9

এটি এখানে আলোচনার ধারাবাহিকতা । আমি সেখানে মন্তব্য করব, তবে আমার কাছে 50 টি প্রতিনিধি নেই তাই আমি একটি নতুন প্রশ্ন জিজ্ঞাসা করছি।

এমএফসিসি গণনা প্রক্রিয়াতে আমি কীভাবে ডিসিটি পদক্ষেপটি বুঝতে পারি তা এখানে: এর পেছনের যুক্তিটি ফিল্টারগুলির ওভারল্যাপিংয়ের কারণে লগ-বর্ণের ম্যাগনিটিউডের (ফিল্টারব্যাঙ্ক থেকে) পারস্পরিক সম্পর্ককে আলাদা করা। মূলত, ডিসিটি এই লগ-বর্ণালী দৈর্ঘ্যের দ্বারা বর্ণিত বর্ণালী উপস্থাপনা মসৃণ করে।

এটা কি সঠিকভাবে বলা যায় যে নীচের চিত্রের নীল রেখা বর্ণনাকে লগ-বর্ণালী দৈর্ঘ্যের ভেক্টর দ্বারা প্রতিনিধিত্ব করে এবং লাল লাইনটি কি ভেক্টরটি একবার DCT-ified হয়ে গেলে?

ডিসিটি-আইডিযুক্ত লগ-বর্ণালী ম্যাগনিটিউডস (অর্থাত্ এমএফসিসি) বনাম কেবল লগ-বর্ণালী মাত্রা ???


আমি পরীক্ষার জন্য আপনার কোডটি কোথায় ডাউনলোড করতে পারি?
uraরহাম

নীচে ছবি? পোস্টে কোনও চিত্র নেই।
এরিক প্লাটোন

উত্তর:


16

আমাকে শুরু থেকে আরম্ভ করতে দিন। সিপস্ট্রাম গণনার মানক পদ্ধতিটি নিম্নলিখিত:

সি(এক্স(টি))=এফ-1[লগ(এফ[এক্স(টি)])]

এমএফসিসি সহগের ক্ষেত্রে কিছুটা আলাদা তবে এখনও একই রকম।

প্রাক জোর এবং উইন্ডোটিংয়ের পরে, আপনি আপনার সিগন্যালের ডিএফটি গণনা করুন এবং মেল স্কেলে পৃথক করা ওভারল্যাপিং ত্রিভুজাকার ফিল্টারগুলির ফিল্টার ব্যাঙ্ক প্রয়োগ করুন (যদিও কিছু ক্ষেত্রে লিনিয়ার স্কেল মেল থেকে ভাল):

এখানে চিত্র বর্ণনা লিখুন

সিপস্ট্রাম সংজ্ঞা সম্পর্কিত, আপনি এখন মেল-ফ্রিকোয়েন্সি স্কেলে বর্ণালী (হ্রাস বর্ণালী) এর খামের প্রতিনিধিত্ব করেছেন। আপনি যদি এটি উপস্থাপন করেন, তবে আপনি দেখতে পাবেন যে এটি আপনার মূল সংকেত বর্ণালীটির অনুরূপ bles

পরবর্তী পদক্ষেপটি উপরে প্রাপ্ত সহগের লগারিদম গণনা করা। এটি সিপস্ট্রামকে এমন একটি হোমোর্ফিক ট্রান্সফর্মেশন বলে মনে করা হয় যা ভোকাল ট্র্যাক্টের আবেগ প্রতিক্রিয়ার থেকে সংকেতকে পৃথক করে দেয় ইত্যাদি কীভাবে?

একটি মূল বক্তৃতা সংকেত গুলি(টি) বেশিরভাগই একটি আবেগ প্রতিক্রিয়া সঙ্গে মীমাংসিত হয় (টি) ভোকাল ট্র্যাক্টের:

গুলি^(টি)=গুলি(টি)(টি)

ফ্রিকোয়েন্সি ডোমেন সমঝোতা হ'ল বর্ণালীর গুণ:

এস^()=এস()এইচ()

এটি নীচের সম্পত্তির উপর ভিত্তি করে দুটি ভাগে বিভক্ত হতে পারে: লগ(একটি)=লগ(একটি)+ +লগ()

আমরা আরও প্রত্যাশা করি যে সময়ের সাথে সাথে আবেগের প্রতিক্রিয়া পরিবর্তন হচ্ছে না, সুতরাং এটি সহজেই গড়কে বিয়োগ করে সরানো যেতে পারে। এখন আপনি দেখুন কেন আমরা আমাদের ব্যান্ড শক্তির লগারিদম নিচ্ছি।

সিপস্ট্রাম সংজ্ঞাটির শেষ ধাপটি হবে ইনভার্স ফুরিয়ার ট্রান্সফর্ম এফ-1। সমস্যাটি হ'ল আমাদের কাছে কেবল আমাদের লগ-এনার্জি রয়েছে, কোনও পর্যায়ের তথ্য নেই, সুতরাং প্রয়োগের পরে ifftআমরা জটিল-মূল্যবান সহগগুলি পাই - এই সমস্ত প্রচেষ্টাটির একটি কমপ্যাক্ট উপস্থাপনা হওয়ার জন্য খুব মার্জিত নয়। যদিও আমরা ডিস্ক্রিট কোসিন ট্রান্সফর্মটি নিতে পারি, এটি এফটির 'সরলিকৃত' সংস্করণ এবং বাস্তব-মূল্যবান সহগগুলি পেতে পারি! এই পদ্ধতিটি আমাদের লগ-শক্তি সহগের সাথে মিলিয়ে থাকা কোসিনুসয়েড হিসাবে ভিজ্যুয়ালাইজ করা যায়। আপনি মনে করতে পারেন যে সিপস্ট্রামকে 'বর্ণালী বর্ণালী' বলা হয়? এটি অত্যন্ত পদক্ষেপ - আমরা আমাদের লগ-এনার্জি খামের সহগগুলিতে কোনও পর্যায়ক্রমের জন্য অনুসন্ধান করছি।

এখানে চিত্র বর্ণনা লিখুন

সুতরাং এখন আপনি দেখতে পাচ্ছেন যে এখন আসল বর্ণালীটি কেমন দেখাচ্ছে তা বোঝা বরং শক্ত। অতিরিক্ত হিসাবে, আমরা সাধারণত প্রথম 12 এমএফসিসি গ্রহণ করি কারণ উচ্চতর ব্যক্তিরা লগ-এনার্জিগুলিতে দ্রুত পরিবর্তনগুলি বর্ণনা করে যা সাধারণত স্বীকৃতির হারকে আরও খারাপ করে তোলে। সুতরাং ডিসিটি করার কারণগুলি নিম্নলিখিত ছিল:

  • মূলত আপনার অবশ্যই আইএফএফটি সম্পাদন করতে হবে, তবে ডিসিটি থেকে বাস্তব-মূল্যবান সহগগুলি পাওয়া আরও সহজ। অধিকন্তু, আমাদের আর পূর্ণ বর্ণালী (সমস্ত ফ্রিকোয়েন্সি বিন) নেই, তবে মেল ফিল্টার-ব্যাঙ্কের মধ্যে শক্তি সহগ রয়েছে, সুতরাং আইএফএফটি এর ব্যবহার কিছুটা ওভারকিল।

  • আপনি প্রথম চিত্রটিতে দেখুন যে ফিল্টার ব্যাংকগুলি ওভারল্যাপ করছে, সুতরাং একে অপরের পাশে থাকা শক্তিগুলি দুটিয়ের মধ্যে ছড়িয়ে পড়ছে - ডিসিটি এগুলি সজ্জিত করার অনুমতি দেয়। মনে রাখবেন যে গাউসিয়ান মিশ্রণ মডেলগুলির ক্ষেত্রে এটি একটি ভাল সম্পত্তি, যেখানে আপনি পূর্ণতর (সমস্ত সহগের সাথে সম্পর্কিত) এর পরিবর্তে তির্যক কোভেরিয়েন্স ম্যাট্রিক্স (অন্যান্য সহগের মধ্যে কোনও সম্পর্ক) ব্যবহার করতে পারবেন না - এটি বিষয়গুলিকে অনেক সরল করে তোলে।

  • মেল ফ্রিকোয়েন্সি সহগগুলি সজ্জিত করার আরেকটি উপায় হ'ল পিসিএ (প্রিন্সিপাল কম্পোনেন্ট এনালাইসিস), একমাত্র কৌশলটি এই উদ্দেশ্যে ব্যবহৃত হয়। আমাদের ভাগ্যের জন্য এটি প্রমাণিত হয়েছিল যে সিসিএল সজ্জিত করার ক্ষেত্রে ডিসিটি হ'ল পিসিএর একটি খুব ভাল অনুমান, তাই ডিসক্রেট কোসিন ট্রান্সফর্ম ব্যবহারের আরও একটি সুবিধা।


কিছু সাহিত্য:

হিউং-গুক কিম, নিকোলাস মোরো, টমাস সিকোড়া - এমপিইজি -7 অডিও এবং এর বাইরে: অডিও সামগ্রী সূচি এবং পুনরুদ্ধার


1
আমরা কেন আইএফএফটি থেকে জটিল সংখ্যার পরম মান নিতে পারি না? জটিল সংখ্যাগুলি যদি মোকাবেলা করা আরও বেশি কঠিন হয় তবে আমরা কেন কখনও কোনও সিপস্ট্রাম গণনা করার সময় আইএফএফটি নেব এবং কেবল সর্বদা ডিসিটি করি না? ব্যাখ্যার জন্য ধন্যবাদ. এই চিত্রটি বিশেষভাবে সহায়ক ছিল।
acannon828

1
@ acannon828: দয়া করে আমার সম্পাদিত উত্তরের শেষ 3 পয়েন্ট দেখুন। আমি আশা করি যে এটি এখন সমস্ত কিছু ব্যাখ্যা করে।
jojek

দুর্দান্ত প্রতিক্রিয়া .. যে কোনও সাহিত্য আপনি এতে সংযুক্ত করতে পারেন।
বব বার্ট

1
@ বোবিবার্ট: আপনি সেখানে যান!
jojek

বইটির জন্য ধন্যবাদ। বেশিরভাগ জিনিসই সেই একটিতে ব্যাখ্যা করা আছে বলে মনে হয়। বইটি কি ভোকাল ট্র্যাক্ট সম্পর্কে তত্ত্বটি কভার করে - আমি এর সাথে সম্পর্কিত কোনও কিছুই খুঁজে পেতে সক্ষম হই না বলে মনে হয়।
বব বার্ট

3

ডিসিটি মসৃণ করার চেয়ে বর্ণালী উপস্থাপনের জন্য প্রয়োজনীয় মাত্রাগুলির সংখ্যা হ্রাস করে। ডাইসিটি মাত্রিকতা হ্রাসের জন্য ভাল কারণ এটি বর্ণালীটির বেশিরভাগ শক্তি প্রথম কয়েক সহগতে কমপ্যাক্ট করে।


ধন্যবাদ। এটি আমাকে পিকনেটেসটি মাত্রিকতা হ্রাস দ্বারা কী বোঝায় তা বুঝতে সহায়তা করেছে।
acannon828

3

এর পেছনের যুক্তিটি হল ফিল্টারগুলির ওভারল্যাপিংয়ের কারণে লগ-বর্ণের বিশালত্বের (ফিল্টারব্যাঙ্ক থেকে) পারস্পরিক সম্পর্ক আলাদা করা। মূলত, ডিসিটি এই লগ-বর্ণালী দৈর্ঘ্যের দ্বারা বর্ণিত বর্ণালী উপস্থাপনা মসৃণ করে।

এটি ভুল। লগ-বর্ণের আকারের মধ্যে পারস্পরিক সম্পর্ক রয়েছে কেবলমাত্র সেগুলি ওভারল্যাপ করে না, কারণ এটির সংখ্যার কোনও ক্রমও "অর্থবোধক" (যেমন প্রাকৃতিক বক্তৃতা এবং শব্দে ঘটে থাকে) লগ-বর্ণালী দৈর্ঘ্যের সিরিজের প্রতিনিধিত্ব করে না। উচ্চতর ফ্রিকোয়েন্সিগুলিতে সামগ্রিকভাবে শক্তি হ্রাস সহ "অর্থবহ" লগ-বর্ণালী দৈর্ঘ্যগুলি বরং মসৃণ হয়ে থাকে tend কেউ বলবেন যে সমস্ত "অর্থবহ" লগ-বর্ণালী দৈর্ঘ্যের ভেক্টরগুলির জায়গার মাত্রা 40 বা তার চেয়ে কম আপনি যে কোনও ব্যান্ড ব্যবহার করেন; এবং এই ছোট স্থানটিতে 40-চ্যানেলের ডেটা ম্যাপ করার জন্য DCT কে মাত্রিকতা হ্রাস হিসাবে দেখা যেতে পারে।

মূলত, ডিসিটি এই লগ-বর্ণালী দৈর্ঘ্যের দ্বারা বর্ণিত বর্ণালী উপস্থাপনা মসৃণ করে।

ডিসিটি কোনও মসৃণতা করে না। ডিসিটি ডেটা থেকে পুনর্গঠন করার সময় আপনি স্মুথিং দেখতে পাচ্ছেন - ডিসিটি তথ্য নষ্ট হয়ে যাওয়ার পরে এবং এর পরে সহগের কাটা কাটা কারণে স্মুথ তৈরি করছে।

তবে এমএফসিসি সহগগুলি স্মুটেড স্পেকট্রাম সংরক্ষণ করে না - এটি নিরবিচ্ছিন্ন ডিসিটি সহগের ক্রম সংরক্ষণ করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.