পটভূমি: আমি একজন আইফোন অ্যাপ্লিকেশন (উল্লিখিত কাজ করছি মধ্যে বিভিন্ন অন্যান্য পোস্ট ) যে snoring / শ্বাস যখন এক ঘুমন্ত এবং নির্ধারণ করে "কথা শোনে" যদি সেখানে ( "ঘুম ল্যাব" এর জন্য একটি প্রাক-স্ক্রীন যেমন নিদ্রাহীনতা লক্ষণ পরীক্ষামূলক). অ্যাপ্লিকেশনটি মূলত snores / শ্বাস শনাক্ত করার জন্য "বর্ণালী পার্থক্য" নিযুক্ত করে এবং স্লিপ ল্যাব রেকর্ডিংয়ের (যা আসলে বেশ গোলমাল) এর বিরুদ্ধে পরীক্ষা করা হয় তখন এটি বেশ ভাল (সিএ 0.85--0.90 পারস্পরিক সম্পর্ক) কাজ করে।
সমস্যা: বেশিরভাগ "বেডরুম" শব্দ (ভক্ত ইত্যাদি) আমি বেশ কয়েকটি কৌশলগুলির মাধ্যমে ফিল্টার আউট করতে পারি এবং প্রায়শই নির্ভরযোগ্যভাবে এস / এন পর্যায়ে শ্বাসকষ্ট সনাক্ত করতে পারি যেখানে মানুষের কান এটি সনাক্ত করতে পারে না। সমস্যা কণ্ঠস্বর। ব্যাকগ্রাউন্ডে টেলিভিশন বা রেডিও চালানো (বা কেবল দূরত্বে কাউকে কথা বলার জন্য) অস্বাভাবিক কিছু নয়, এবং শব্দের ছন্দটি শ্বাস-প্রশ্বাসের সাথে ঘনিষ্ঠভাবে মেলে। প্রকৃতপক্ষে, আমি অ্যাপটির মাধ্যমে প্রয়াত লেখক / গল্পকার বিল হলমের রেকর্ডিং চালিয়েছি এবং এটি ছন্দ, স্তরের পরিবর্তনশীলতা এবং অন্যান্য বেশ কয়েকটি পদক্ষেপের মধ্যে শোষক হওয়া থেকে মূলত পৃথক ছিল। (যদিও আমি বলতে পারি যে আপাতদৃষ্টিতে তার ঘুমের শোধ হয়নি, কমপক্ষে জাগ্রত অবস্থায় not
সুতরাং এটি কিছুটা দীর্ঘ শট (এবং সম্ভবত ফোরামের বিধিগুলির একটি প্রসার), তবে কীভাবে ভয়েসকে আলাদা করতে হবে সে সম্পর্কে আমি কিছু ধারণা খুঁজছি। আমাদের কোনওভাবেই শামুকগুলি ফিল্টার করার দরকার নেই (মনে হয় এটি দুর্দান্ত হবে), তবে আমাদের কেবল "খুব শোরগোল" শব্দ হিসাবে প্রত্যাখ্যান করার একটি উপায় প্রয়োজন যা অতিরিক্ত কণ্ঠের সাথে দূষিত।
কোন ধারনা?
ফাইল প্রকাশিত: আমি ড্রপবক্স.কম এ কিছু ফাইল রেখেছি:
প্রথমটি রক (বরং আমি অনুমান করি) সংগীতের একটি বরং এলোমেলো টুকরো, এবং দ্বিতীয়টি বিল বিল হোল কথা বলার রেকর্ডিং। উভয়ই (যা আমি "শোরগোল" এর আমার নমুনাগুলি হিসাবে ব্যবহার করি তা শুকানোর জন্য আলাদা করা যায়) সংকেতকে বাছাই করতে শোরগোলের সাথে মিশ্রিত করা হয়েছে। (এটি তাদের চিহ্নিত করার লক্ষণটিকে আরও বেশি কঠিন করে তোলে)) তৃতীয় ফাইলটি সত্যই আপনার রেকর্ডিংয়ের দশ মিনিট যেখানে প্রথম তৃতীয়টি বেশিরভাগ শ্বাস নেয়, মাঝারি তৃতীয়টি মিশ্র শ্বাস / স্নোরিং হয় এবং চূড়ান্ত তৃতীয়টি মোটামুটি স্থির নৃত্যের হয়। (আপনি বোনাসের জন্য কাশি পান)
তিনটি ফাইলই ".wav" থেকে "_wav.dat" নামকরণ করা হয়েছে, যেহেতু অনেক ব্রাউজার ওয়েভ ফাইলগুলি ডাউনলোড করা পাগল করে তোলে। ডাউনলোডের পরে কেবল তাদের পুনরায় নামকরণ ".wav" করুন।
আপডেট: আমি ভেবেছিলাম এনট্রপি আমার জন্য "কৌশলটি করছিল", তবে এটি বেশিরভাগ ক্ষেত্রে আমি যে পরীক্ষাগুলি ব্যবহার করছিলাম সেগুলির বিশেষত্ব হতে পারে, পাশাপাশি একটি অ্যালগরিদমও খুব ভালভাবে ডিজাইন করা হয়নি। সাধারণ ক্ষেত্রে এন্ট্রপি আমার জন্য খুব সামান্য কাজ করে।
পরবর্তীকালে আমি এমন একটি কৌশল চেষ্টা করেছি যেখানে আমি সামগ্রিক সংকেত প্রস্থের এফএফটি (বিভিন্ন উইন্ডো ফাংশন ব্যবহার করে) গণনা করি (আমি শক্তি, বর্ণালী প্রবাহ এবং আরও কয়েকটি ব্যবস্থা চেষ্টা করেছি) সেকেন্ডে প্রায় 8 বার নমুনা (মূল এফএফটি চক্র থেকে স্ট্যাটাস গ্রহণ করে) যা প্রতি 1024/8000 সেকেন্ডে হয়)। 1024 নমুনা সহ এটি প্রায় দুই মিনিটের সময়সীমা জুড়ে। আমি আশা করছিলাম যে আমি ভিড় / সংগীত বনাম ঘোরাঘুরি / শ্বাস প্রশ্বাসের ধীর ছন্দের কারণে এতে নিদর্শনগুলি দেখতে সক্ষম হব (এবং এটি " পরিবর্তনশীলতা " ইস্যুটি সমাধান করার আরও ভাল উপায় হতে পারে ), তবে ইঙ্গিতগুলি থাকাকালীন এখানে এবং সেখানে একটি নিদর্শন, আমি সত্যিই এটি ল্যাচ করতে পারেন কিছুই।
( আরও তথ্য: কিছু ক্ষেত্রে সিগন্যাল প্রস্থের এফএফটি প্রায় 0.2Hz এবং সিঁড়ির সুরের সুরকারে একটি শক্ত শিখর সহ একটি খুব স্বতন্ত্র প্যাটার্ন তৈরি করে But তবে বেশিরভাগ সময় প্যাটার্নটি এতটা স্বতন্ত্র নয়, এবং ভয়েস এবং সংগীত কম স্বতন্ত্র উত্পন্ন করতে পারে অনুরূপ প্যাটার্নের সংস্করণ me যোগ্যতার একটি চিত্রের জন্য একটি পারস্পরিক সম্পর্কের মান গণনা করার কিছু উপায় থাকতে পারে তবে মনে হয় এটির জন্য একটি চতুর্থ অর্ডারের বহুবর্ষীয় জন্য বক্ররেখা লাগানো দরকার এবং ফোনে সেকেন্ডে একবার করা অবাস্তব বলে মনে হয়))
আমি বর্ণালীকে বিভক্ত করেছি এমন 5 টি পৃথক "ব্যান্ড" এর জন্য গড় প্রশস্ততার একই এফএফটি করার চেষ্টাও করেছি। ব্যান্ডগুলি 4000-2000, 2000-1000, 1000-500 এবং 500-0 হয়। প্রথম 4 টি ব্যান্ডের প্যাটার্নটি সামগ্রিক প্যাটার্নের সাথে সাধারণত একই রকম ছিল (যদিও কোনও সত্য "স্ট্যান্ড আউট" ব্যান্ড ছিল না, এবং প্রায়শই উচ্চতর ফ্রিকোয়েন্সি ব্যান্ডগুলিতে ছোট ছোট সংকেত পাওয়া যায়) তবে 500-0 ব্যান্ডটি সাধারণত এলোমেলো ছিল।
অনুগ্রহ: আমি নাথনকে এই অনুগ্রহটি দিতে যাচ্ছি, যদিও তার এখন পর্যন্ত সবচেয়ে উত্পাদনশীল পরামর্শ ছিল যদিও তিনি নতুন কিছু প্রস্তাব করেন নি offered আমার এখনও কয়েকটি পয়েন্ট রয়েছে যে আমি অন্য কাউকে পুরষ্কার দিতে রাজি হব, যদিও তারা কিছু ভাল ধারণা নিয়ে আসে।