আমার আগের প্রশ্নের অনুসরণ হিসাবে আমি ভাবছিলাম যে এখানে কোনও স্পিচ সনাক্তকরণ গ্রন্থাগার রয়েছে কিনা। স্পিচ সনাক্তকরণের অর্থ আমার অর্থ একটি অডিও বাফারে পাস করা এবং বক্তৃতাটি কোথায় শুরু হয় এবং কোথায় থামবে তার সূচি ফিরে পাওয়া। সুতরাং যদি আমার কাছে 44kHz এ 10 সেকেন্ডের অডিও স্যাম্পলিং থাকে তবে আমি সংখ্যার একটি অ্যারে যেমন আশা করব:
44000
88000
123000
190334
...
এটি উদাহরণস্বরূপ নির্দেশ করবে যে বক্তৃতাটি এক সেকেন্ড শুরু হয় এবং তারপরে দুটি দ্বিতীয় পয়েন্টে শেষ হয় etc.
আমি যা খুঁজছি না তা হ'ল বক্তৃতা স্বীকৃতি যা কথ্য শব্দ থেকে পাঠ্য লিখে দেয়। দুর্ভাগ্যক্রমে আমি যখন 'স্পিচ সনাক্তকরণ' গুগল করি তখন আমি প্রচুর দেখতে পাই।
আইফোনটির জন্য একটি অ্যাপ লিখছি বলে গ্রন্থাগারটি সি, সি ++ বা এমনকি উদ্দেশ্যমূলক-সিতে থাকলে এটি দুর্দান্ত হবে।
ধন্যবাদ!