আমি একটি সাউন্ড ফাইল থেকে বৈশিষ্ট্যগুলি বের করার চেষ্টা করছি এবং শব্দটিকে একটি নির্দিষ্ট বিভাগের (যেমন: কুকুরের ছাল, গাড়ির ইঞ্জিন ইত্যাদি) শ্রেণিভুক্ত হিসাবে শ্রেণিবদ্ধকরণ করার চেষ্টা করছি। আমি নিম্নলিখিত বিষয়গুলি সম্পর্কে কিছু স্পষ্টতা চাই:
1) এই আদৌ কি doable? এমন প্রোগ্রাম রয়েছে যা স্পিচকে চিনতে পারে এবং বিভিন্ন ধরণের কুকুরের ছালের মধ্যে পার্থক্য করতে পারে। তবে কী এমন কোনও প্রোগ্রাম করা সম্ভব যা সাউন্ড নমুনা গ্রহণ করতে পারে এবং কেবল এটি কী ধরণের শব্দ বলতে পারে? (ধরে নিই এমন একটি ডেটাবেস রয়েছে যাতে উল্লেখ করার জন্য প্রচুর শব্দ নমুনা রয়েছে)। ইনপুট সাউন্ড নমুনাগুলি কিছুটা গোলমাল হতে পারে (মাইক্রোফোন ইনপুট)।
2) আমি ধরে নিই যে প্রথম ধাপটি অডিও বৈশিষ্ট্য নিষ্কাশন। এই নিবন্ধটি এমএফসিসিগুলি বের করার এবং তাদের একটি মেশিন লার্নিং অ্যালগরিদমকে খাওয়ানোর পরামর্শ দেয়। এমএফসিসি কি যথেষ্ট? এমন কি অন্য কোনও বৈশিষ্ট্য রয়েছে যা সাধারণত শব্দ শ্রেণিবিন্যাসের জন্য ব্যবহৃত হয়?
সময় দেয়ার জন্য ধন্যবাদ.