আমার কাছে কিছুটা কারাওকে-স্টাইলের অ্যাপ্লিকেশন রয়েছে যেখানে ব্যবহারকারী কোনও লাইনের মধ্যে একটি লাইন এক ফাঁক করে একটি গানের 4 টি লাইন গায়। কোনও ব্যাকিং মিউজিক নেই, সুতরাং এটি কেবলমাত্র কণ্ঠস্বর, আশা করা যায় সমস্যাটি সমাধান করা আরও সহজ করে তোলে।
আমি আমার রেকর্ডিংয়ে ব্যবহারকারী কোথায় লাইন 1 গাইতে শুরু করে এবং শেষ করা এবং 2 এর লাইন গাইতে শেষ করে ইত্যাদি ঠিক সনাক্ত করার সবচেয়ে শক্তিশালী উপায়টি সন্ধান করছি etc.
আমি একটি সাধারণ মনের অ্যালগরিদমকে একসাথে বাঁধিয়াছি যা রেকর্ডিংয়ের মধ্যে খুব কম পটভূমির শব্দ হলে (যেমন কখন ঘটে?) শব্দটি কার্যকর হয় তবে এটি ক্ষুদ্রতম শব্দের উপস্থিতিতে টুকরো টুকরো হয়ে যায়।
কেউ কি আমাকে আরও শক্তিশালী কিছু দিকে নির্দেশ করতে পারে?