নীরবতা / নীরবতায় ফোন কল অডিও কীভাবে ভাগ করবেন?


9

আমার সমস্যাটি হ'ল আমি ব্যাকগ্রাউন্ড শব্দের শক্তি জানি না, তাই আমি কেবল শক্তিটি প্রসারিত করতে পারি না। প্রক্রিয়াটি রিয়েল টাইমে সম্পন্ন হয় এবং আমার কাছে সিদ্ধান্ত নিতে প্রায় 500 মিমি রয়েছে have আদর্শভাবে, আমি নিরবতা হিসাবে বিবেচিত শান্ত ব্যঞ্জনবর্ণ চাই।


6
পুরো উত্তর দেওয়ার মতো পর্যাপ্ত তথ্য আমার কাছে নেই তবে আপনার সমস্যাটি ভয়েস ক্রিয়াকলাপ সনাক্তকরণ হিসাবে উল্লেখ করা হয়েছে । এটি করার এককভাবে সর্বোত্তম উপায় নেই এবং আপনি যদি দেখতে পান তবে আপনি সম্ভবত বিভিন্ন রকমের পন্থা দেখতে পাবেন। সম্ভবত কিছু অন্যরা এটি আরও কিছুটা বের করতে পারে।
জেসন আর

@ মিশেল লিটভিন, এখানে এক শ্রেণীর অ-লিনিয়ার ফিল্টার রয়েছে ('তেজর-কায়সার' নামে শক্তি সনাক্তকরণে ব্যবহৃত হয় I আমি মনে করি এটি 'ভোল্টেরার কার্নেল' নামে পরিচিত of । আরও তথ্যের, কিন্তু আপনি যদি এই কথাগুলো আপনি যা খুঁজছিলেন তা পেতে পারে জন্য প্রায় অনুসন্ধান আমি জানি যে Teager-কায়সার পদ্ধতি ব্যবহার করা হয় 'যখন' তিমি শব্দসমূহ শুরু বনাম শুধু আওয়াজকে।
Spacey

উত্তর:


4

এখানে প্যারামিটারগুলির একটি গুচ্ছ রয়েছে যা আপনি দেখতে পারেন:

  1. সামগ্রিক শক্তি
  2. স্বল্পমেয়াদী বর্ণালী: বক্তৃতাটি বৈদ্যুতিনভাবে আধিপত্যবাদযুক্ত বা "লাল" (অর্থাত্ কম ফ্রিকোয়েন্সি ভারী) যদি সাদা বর্ণ ধারণ করে তবে স্পষ্ট্রাম এবং শব্দ (যা বাক-বাক্সের অংশগুলির মধ্যে ঘটে চলেছে) এর বেশ খানিকটা স্বতন্ত্র "গোলাপী-জাতীয়" বর্ণবাদ রয়েছে has শব্দ বা মাইক্রোফোন শব্দ
  3. প্রশস্ততার পরিসংখ্যান। বেশিরভাগ শব্দ সংকেতগুলিতে একটি গাউসীয় বিতরণ থাকে, বক্তৃতা ল্যাপ্লেস বিতরণের কাছাকাছি থাকে

আমি মনে করি এই তিনটির সংমিশ্রণে মোটামুটি শক্তিশালী সনাক্তকরণ স্কিম দেওয়া উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.