Cepstral মানে নরমালাইজেশন


15

কেউ দয়া করে সেপস্ট্রাল মিন নরমালাইজেশন সম্পর্কে ব্যাখ্যা করতে পারেন, কীভাবে সমঝোতার সমতুল্য সম্পত্তি এটি প্রভাবিত করে? এমএফসিসি ভিত্তিক স্পিকার স্বীকৃতিতে কি সিএমএন করা উচিত? কেন সমঝোতার সম্পত্তি এমএফসিসির মৌলিক প্রয়োজন?

আমি এই সংকেত প্রক্রিয়াকরণে খুব নতুন। সাহায্য করুন


ফিল্টার ব্যাংক ব্যবহার না করে, ফ্রিকোয়েন্সিটিকে সরাসরি মেলস্কেলে রূপান্তর করা এমএফসিসি প্রক্রিয়াতে কাজ করবে?
বেগুনি

উত্তর:


18

কেবল বিষয়গুলি পরিষ্কার করার জন্য - এই সম্পত্তিটি মৌলিক নয় তবে গুরুত্বপূর্ণ । বর্ণালী গণনার জন্য ডিএফটি পরিবর্তে ডিসিটি ব্যবহার করার ক্ষেত্রে এটি মৌলিক পার্থক্য।

আমরা কেন Cepstral মানে নরমালাইজেশন করি

স্পিকারের স্বীকৃতি হিসাবে আমরা যেকোন চ্যানেল প্রভাবগুলি (ভোকাল ট্র্যাক্ট, অডিও পথ, ঘর ইত্যাদির আবেগ প্রতিক্রিয়া) সরাতে চাই। এই ইনপুট সিগন্যালটি এবং চ্যানেল আবেগ প্রতিক্রিয়া এইচ [ এন ] দ্বারা দেওয়া হয়েছে , রেকর্ড করা সংকেত উভয়ের লিনিয়ার কনভোলশন:x[n]h[n]

y[n]=x[n]h[n]

ফুরিয়ার ট্রান্সফর্ম গ্রহণ করে আমরা পাই:

Y[f]=X[f]H[]

ফুট সংবর্তন-গুণ সমানতা সম্পত্তি কারণে - তাই এটা এই পদে পদে FFT এর এত গুরুত্বপূর্ণ সম্পত্তি এর

সিপস্ট্রমের গণনার পরবর্তী পদক্ষেপটি বর্ণালীটির লোগারিদম গ্রহণ করছে:

ওয়াই[কুই]=লগওয়াই[]=লগ(এক্স[]এইচ[])=এক্স[কুই]+ +এইচ[কুই]

কারণ: । স্পষ্টতই, q হ'ল আকাশছোঁয়া । যেহেতু কেউ লক্ষ্য করতে পারেন, সময় ডোমেনে কনভলশনের সিপস্ট্রাস্টম গ্রহণের মাধ্যমে আমরা cepstral (quefrency) ডোমেন যুক্ত করে শেষ করি।লগ(একটি)=লগএকটি+ +লগকুই

Cepstral মানে নরমালাইজেশন কী?

এখন আমরা জানি যে বিভাগীয় ডোমেনে কোনও সংবিধানমূলক বিকৃতিগুলি সংযোজন দ্বারা প্রতিনিধিত্ব করা হয়। আসুন ধরে নেওয়া যাক এগুলি সমস্ত স্থির (যা ভোকাল ট্র্যাক্ট হিসাবে একটি দৃ ass় ধারণা এবং চ্যানেলের প্রতিক্রিয়া পরিবর্তন হচ্ছে না) এবং বক্তৃতার স্থিতিশীল অংশ নগণ্য। আমরা পর্যবেক্ষণ করতে পারি যে প্রতিটি আই-তম ফ্রেমের জন্য সত্য:

ওয়াইআমি[কুই]=এইচ[কুই]+ +এক্সআমি[কুই]

আমরা পাই সমস্ত ফ্রেমের উপরে গড় নিয়ে

1এনΣআমিওয়াইআমি[কুই]=এইচ[কুই]+ +1এনΣআমিএক্সআমি[কুই]

পার্থক্য সংজ্ঞায়িত:

আরআমি[কুই]=ওয়াইআমি[কুই]-1এনΣওয়াই[কুই]=এইচ[কুই]+ +এক্সআমি[কুই]-(এইচ[কুই]+ +1এনΣএক্স[কুই])=এক্সআমি[কুই]-1এনΣএক্স[কুই]

আমরা চ্যানেল বিকৃতিগুলি মুছে ফেলার সাথে আমাদের সংকেতটি দিয়ে শেষ করছি। উপরের সমস্ত সমীকরণগুলি সহজ ইংরেজিতে রাখছি:

  • সিপস্ট্রাম গণনা করুন
  • প্রতিটি সহগ থেকে গড় বিয়োগ করুন
  • বিয়োগের বিপরীতে সেপস্ট্রাল মিন নরমালাইজেশন সম্পাদনের জন্য বৈকল্পিকভাবে বিভাজন দ্বারা ভাগ করুন।

সিপস্ট্রাল মানে কি নরমালাইজেশন প্রয়োজন?

এটি বাধ্যতামূলক নয়, বিশেষত যখন আপনি একক পরিবেশে একজন স্পিকারকে স্বীকৃতি দেওয়ার চেষ্টা করছেন। প্রকৃতপক্ষে, এটি আপনার ফলাফলগুলিকে এমনকি খারাপ করে দিতে পারে, কারণ এটি অ্যাডিটিভ শব্দের কারণে ত্রুটিগুলির প্রবণতা:

Y[এন]=এক্স[এন][এন]+ +W[এন]

ওয়াই[]=এক্স[]এইচ[]+ +ওয়াট[]

লগওয়াই[]=লগ[এক্স[](এইচ[]+ +ওয়াট[]এক্স[])]=লগএক্স[]+ +লগ(এইচ[]+ +ওয়াট[]এক্স[])

দুর্বল এসএনআর অবস্থার মধ্যে চিহ্নিত শব্দটি অনুমানকে ছাড়িয়ে যেতে পারে।

যদিও সিএমএস সঞ্চালিত হয়, আপনি সাধারণত কিছু অতিরিক্ত শতাংশ অর্জন করতে পারেন। আপনি যদি সহগের ডেরিভেটিভস থেকে সেই কর্মক্ষমতা অর্জন করতে যোগ করেন তবে আপনি আপনার স্বীকৃতি হারের সত্যিকারের উত্সাহ পাবেন। চূড়ান্ত সিদ্ধান্তটি আপনার উপর নির্ভর করে বিশেষত স্পিচ স্বীকৃতি সিস্টেমের উন্নতির জন্য প্রচুর অন্যান্য পদ্ধতি ব্যবহার করা হয়।


@ মুন: খুশি এটা সাহায্য করেছে। আপনার প্রশ্নের উত্তর গ্রহণযোগ্য হিসাবে চিহ্নিত করবেন না কেন তাই আপনি নতুন ব্যবহারকারীর সীমাবদ্ধতাগুলি সরিয়ে ফেলতে পারেন?
জোজেক

@ মুন: অভিনন্দন! এখন আপনি আরও লিঙ্ক পোস্ট করেন, প্রশ্নোত্তরে + পতাকা পোস্টে ভোট দিন।
জোজেক

ধন্যবাদ @ জোজেক .. এই সকলের জন্য আমি খুব নতুন। তবে আমি খুশি যে আমার সমস্যাটি সমাধান হয়ে গেছে।
মুন

@ এমুন: তারপরে আমি অবশ্যই আপনাকে দ্রুত ভ্রমণ
জোজেক

শেষ উত্তরে, আমি আসলে "সহগের ডেরিভেটিভস থেকে যে কর্মক্ষমতা অর্জন" এর অর্থ কী তা পেতে পারি না। আপনি কিছু সহজ ব্যাখ্যা দিতে পারেন? অনেক ধন্যবাদ
শুই ওয়াং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.