কেবল বিষয়গুলি পরিষ্কার করার জন্য - এই সম্পত্তিটি মৌলিক নয় তবে গুরুত্বপূর্ণ । বর্ণালী গণনার জন্য ডিএফটি পরিবর্তে ডিসিটি ব্যবহার করার ক্ষেত্রে এটি মৌলিক পার্থক্য।
আমরা কেন Cepstral মানে নরমালাইজেশন করি
স্পিকারের স্বীকৃতি হিসাবে আমরা যেকোন চ্যানেল প্রভাবগুলি (ভোকাল ট্র্যাক্ট, অডিও পথ, ঘর ইত্যাদির আবেগ প্রতিক্রিয়া) সরাতে চাই। এই ইনপুট সিগন্যালটি এবং চ্যানেল আবেগ প্রতিক্রিয়া এইচ [ এন ] দ্বারা দেওয়া হয়েছে , রেকর্ড করা সংকেত উভয়ের লিনিয়ার কনভোলশন:x[n]h[n]
y[n]=x[n]⋆h[n]
ফুরিয়ার ট্রান্সফর্ম গ্রহণ করে আমরা পাই:
Y[f]=X[f]⋅H[f]
ফুট সংবর্তন-গুণ সমানতা সম্পত্তি কারণে - তাই এটা এই পদে পদে FFT এর এত গুরুত্বপূর্ণ সম্পত্তি এর ।
সিপস্ট্রমের গণনার পরবর্তী পদক্ষেপটি বর্ণালীটির লোগারিদম গ্রহণ করছে:
ওয়াই[ প্রশ্ন] = লগওয়াই[ চ] = লগ( এক্স[ চ] ⋅ এইচ[ চ] ) = এক্স[ প্রশ্ন] + এইচ[ প্রশ্ন]
কারণ: । স্পষ্টতই, q হ'ল আকাশছোঁয়া । যেহেতু কেউ লক্ষ্য করতে পারেন, সময় ডোমেনে কনভলশনের সিপস্ট্রাস্টম গ্রহণের মাধ্যমে আমরা cepstral (quefrency) ডোমেন যুক্ত করে শেষ করি।লগ( একটি খ ) = লগa + লগখকুই
Cepstral মানে নরমালাইজেশন কী?
এখন আমরা জানি যে বিভাগীয় ডোমেনে কোনও সংবিধানমূলক বিকৃতিগুলি সংযোজন দ্বারা প্রতিনিধিত্ব করা হয়। আসুন ধরে নেওয়া যাক এগুলি সমস্ত স্থির (যা ভোকাল ট্র্যাক্ট হিসাবে একটি দৃ ass় ধারণা এবং চ্যানেলের প্রতিক্রিয়া পরিবর্তন হচ্ছে না) এবং বক্তৃতার স্থিতিশীল অংশ নগণ্য। আমরা পর্যবেক্ষণ করতে পারি যে প্রতিটি আই-তম ফ্রেমের জন্য সত্য:
ওয়াইআমি[ প্রশ্ন] = এইচ[ প্রশ্ন] + এক্সআমি[ প্রশ্ন]
আমরা পাই সমস্ত ফ্রেমের উপরে গড় নিয়ে
1এনΣআমিওয়াইআমি[ প্রশ্ন] = এইচ[ প্রশ্ন] + 1এনΣআমিএক্সআমি[ প্রশ্ন]
পার্থক্য সংজ্ঞায়িত:
আরআমি[ প্রশ্ন]= ওয়াইআমি[ প্রশ্ন] - ১এনΣঞওয়াইঞ[ প্রশ্ন]= এইচ[ প্রশ্ন] + এক্সআমি[ প্রশ্ন] - ( এইচ[ প্রশ্ন] + 1এনΣঞএক্সঞ[ প্রশ্ন] )= এক্সআমি[ প্রশ্ন] - ১এনΣঞএক্সঞ[ প্রশ্ন]
আমরা চ্যানেল বিকৃতিগুলি মুছে ফেলার সাথে আমাদের সংকেতটি দিয়ে শেষ করছি। উপরের সমস্ত সমীকরণগুলি সহজ ইংরেজিতে রাখছি:
- সিপস্ট্রাম গণনা করুন
- প্রতিটি সহগ থেকে গড় বিয়োগ করুন
- বিয়োগের বিপরীতে সেপস্ট্রাল মিন নরমালাইজেশন সম্পাদনের জন্য বৈকল্পিকভাবে বিভাজন দ্বারা ভাগ করুন।
সিপস্ট্রাল মানে কি নরমালাইজেশন প্রয়োজন?
এটি বাধ্যতামূলক নয়, বিশেষত যখন আপনি একক পরিবেশে একজন স্পিকারকে স্বীকৃতি দেওয়ার চেষ্টা করছেন। প্রকৃতপক্ষে, এটি আপনার ফলাফলগুলিকে এমনকি খারাপ করে দিতে পারে, কারণ এটি অ্যাডিটিভ শব্দের কারণে ত্রুটিগুলির প্রবণতা:
Y[ এন ] = এক্স [ এন ] ⋆ এইচ [ এন ] + ডাব্লু [ এন ]
ওয়াই[ চ] = এক্স[ চ] ⋅ এইচ[ চ] + ডাব্লু[ চ]
লগওয়াই[ চ] = লগ[ এক্স[ চ] ( এইচ[ চ] + ডাব্লু[ চ]এক্স[ চ]) ] =লগএক্স[ চ] + লগ( এইচ[ চ] + ডাব্লু[ চ]এক্স[ চ])
দুর্বল এসএনআর অবস্থার মধ্যে চিহ্নিত শব্দটি অনুমানকে ছাড়িয়ে যেতে পারে।
যদিও সিএমএস সঞ্চালিত হয়, আপনি সাধারণত কিছু অতিরিক্ত শতাংশ অর্জন করতে পারেন। আপনি যদি সহগের ডেরিভেটিভস থেকে সেই কর্মক্ষমতা অর্জন করতে যোগ করেন তবে আপনি আপনার স্বীকৃতি হারের সত্যিকারের উত্সাহ পাবেন। চূড়ান্ত সিদ্ধান্তটি আপনার উপর নির্ভর করে বিশেষত স্পিচ স্বীকৃতি সিস্টেমের উন্নতির জন্য প্রচুর অন্যান্য পদ্ধতি ব্যবহার করা হয়।