এটি আমার স্নোরিং ডিটেক্টর আবার।
আমি যখনই কিছু থাকি তখন সিগন্যাল শনাক্ত করতে আমি বেশ ভালোভাবেই পেরেছি - দেওয়াল-খোঁচা ফাঁক থেকে নিঃশ্বাস নেওয়ার জন্য ট্র্যাক করতে পারে যা আপনি এমনকি রেকর্ডিংয়ে শুনতে পাচ্ছেন না। সমস্যাটি হ'ল, আমি কখনই বলতে পারি না যে সিগন্যালটি সনাক্তযোগ্য স্তরের নিচে নেমে গেছে এবং অ্যাপটি কেবল "শুনানির জিনিস"। এবং, দুর্ভাগ্যক্রমে, শামুক / শ্বাস প্রায়শই পর্যাপ্ত পরিমাণে অনিয়মিত হয় যে একটি সাধারণ স্বতঃসংশোধন বা অনুরূপ ব্যবধান সময় স্কিম খুব বেশি সাহায্য করার সম্ভাবনা কম। (এবং এটি সম্ভবত সম্ভবত কিছু ক্ষেত্রে শ্বাসের চেয়ে শব্দ বেশি নিয়মিত)
সুতরাং, যখন কোনও সংকেত নেই তখন আমি কী কৌশল খুঁজে বের করার জন্য নিখোঁজ হচ্ছি? এটির মতো মনে হচ্ছে যে আমি এখানে কঠোর জায়গার বিরুদ্ধে আছি, "সংকেত" দেওয়া শুরু করার মতো শোরগোলের মতো।
(এবং সম্ভবত এটি আমার যে অন্য সমস্যার মুখোমুখি হচ্ছে তার সাথে সম্পর্কিত: আশ্চর্যের বিষয়, আমি মোটামুটি জোরে বলার পরেও সিগন্যাল স্তরটি সঠিকভাবে (বা এমনকি প্রায়) মাপতে পারি না Since যেহেতু সিগন্যাল সনাক্তকরণের জন্য আমাকে রোলিং গড় এবং অনুপাত ব্যবহার করা প্রয়োজন, স্তর সম্পর্কিত ধরণের তথ্য হারিয়ে যায় it আমি এটি পুনর্গঠন করার জন্য কিছু কৌশল খুঁজছি))
বেসিক কৌশল
(যোদার জন্য)
অডিও সংকেত নমুনাযুক্ত (সাধারণত 8000Hz এ, বিভিন্ন কারণে), তারপরে 1024 ব্লকে এফএফটিড হয়। (আমার পরীক্ষায় হামিং ফিল্টার এবং ওভারল্যাপিং ব্লকগুলির খুব কম প্রভাব আছে বলে মনে হয়, যদিও সেগুলি পরে পুনর্বিবেচনা করা হতে পারে।)
এফএফটি "ব্যান্ডগুলি" (বর্তমানে 5 টি, নিম্ন প্রান্তে আরও বিশদ রাখার জন্য আকারে সামান্য স্কুড) বিভক্ত এবং প্রতিটি ব্যান্ডের "বর্ণালী পার্থক্য" এবং স্তর সংক্ষিপ্ত করা হয়। শীর্ষ-সীমিত মানগুলির দীর্ঘমেয়াদী গড় গড় "থ্রেশহোল্ডস" হিসাবে ব্যবহৃত হয়, এবং আরও পক্ষপাত সমন্বয় প্রায় 20% "ওভার থ্রেশহোল্ড" হার বজায় রাখতে ব্যবহৃত হয়।
প্রতিটি "ওভার থ্রেশহোল্ড" মানকে 1 ওজন দেওয়া হয় (প্রান্তিকের নীচে 0 ওজন দেওয়া হয়) তবে ব্যান্ডগুলিকে আরও ওজন দেওয়ার জন্য ব্যান্ডটিতে আপাত "পরিবর্তনশীলতা" (মোটামুটি 2Hz) দ্বারা ওজনটি সামঞ্জস্য করা হয় যে আরও সুস্পষ্ট সংকেত বহন করে।
ব্যান্ডগুলির ওজনগুলি যোগ করা হয় এবং তারপরে ব্লকগুলির যোগ করা ওজনগুলি একটি চলমান "স্কোর" উত্পাদনের জন্য প্রায় এক সেকেন্ড জুড়ে যোগ করা হয়। এটিকে আবার চলমান গড় থ্রোসোল্ডের সাথে তুলনা করা হয় (প্লাস বেশ কয়েকটি হিউরিস্টিক্স) শামুকের সূচনা / অফসেট সনাক্ত করতে।
হালনাগাদ
হঠাৎ করে আমার কাছে এটি ঘটেছিল যে যদি আমার অ্যালগরিদম কার্যকরভাবে একটি ধ্রুবক-স্তরের সিগন্যাল বজায় রাখে (আমার সিগন্যাল স্তরের সমস্যা অনুযায়ী), কোনও সংকেত না থাকলে এসএনআরকে কার্যকরভাবে গেজ করার উপায় হ'ল শব্দটি পরিমাপ করে।
সুবিধামতভাবে, শামুকগুলি মাঝে মাঝে মাঝে মাঝে প্রচুর "মৃত বায়ু" থাকে। এবং আমি ইতিমধ্যে শামুক খামগুলি সনাক্ত করছি। সুতরাং খামের বাইরের যে কোনও কিছু (একটি শামুকের শেষে এবং পরবর্তীটির শুরুতে) সম্ভবত গোলমাল! এটি আমি (কিছুটা নির্ভুলতার পুনরাবৃত্তি / পুনরাবৃত্তির সাথে) পরিমাপ করতে পারি। (এটি অর্ধদৈর্ঘ্য শালীন অ্যালগরিদম নিয়ে আসতে তিনটি প্রচেষ্টা নিয়েছিল, অবশ্যই - বাস্তবতা তত্ত্বের সাথে কখনই মেলে না))
সুতরাং আমার কাছে এখনও পুরো উত্তর নেই তবে আমি অগ্রগতি করেছি।
(যদিও উপরের কৌশলটি আমাকে এসএনআরের জন্য মোটামুটি ভাল প্রক্সি দেয়, তবে এখনও সত্যিকারের সংকেত স্তর অনুমান করতে আমার সমস্যা হচ্ছে My আমার "আপেক্ষিক স্তর" ইঙ্গিতগুলি সবেমাত্র শ্রুতিমধুর শ্বাসের জন্য এবং উইন্ডো র্যাটারের জন্য তাই স্কেল ছাড়িয়ে যেতে পারে। পরম স্তরের জন্য আমার এক প্রকার প্রক্সি প্রয়োজন))