আমি দুই বা ততোধিক পিসিএম অডিও চ্যানেলগুলি (যেমন রেকর্ড করা নমুনাগুলি) ডিজিটালভাবে অ্যাকোস্টিক-বিশ্বস্ত উপায়ে মিশ্রণ করতে চাই, পছন্দসই নিকট-আসল সময়ে (অর্থাত্ সামান্য বা কোনও উঁকি না দেওয়া)।
এটি করার শারীরিকভাবে "সঠিক" উপায় হ'ল নমুনাগুলির সংক্ষিপ্তসার। তবে আপনি যখন দুটি স্বেচ্ছাসেবী নমুনা যুক্ত করেন, ফলস্বরূপ মানটি সর্বোচ্চ মানের দ্বিগুণ হতে পারে।
উদাহরণস্বরূপ, যদি আপনার নমুনাগুলি 16-বিট মান হয় তবে ফলাফলটি 65536 * 2 পর্যন্ত হবে। এই ক্লিপিং ফলাফল।
এখানে নিষ্পাপ সমাধানটি এন দ্বারা ভাগ করা, যেখানে এন মিশ্রিত হওয়া চ্যানেলের সংখ্যা। যাইহোক, এর ফলে প্রতিটি নমুনা 1 / Nth জোরে হয়, যা সম্পূর্ণ অবাস্তব। বাস্তব বিশ্বে যখন দুটি যন্ত্র একযোগে বাজায়, তখন প্রতিটি উপকরণ অর্ধেক জোরে পরিণত হয় না।
চারপাশে পড়া থেকে, মিশ্রণের একটি সাধারণ পদ্ধতি হ'ল: ফলাফল = এ + বি - এ বি, যেখানে এ এবং বি দুটি সাধারণ নমুনা মিশ্রিত হচ্ছে, এবং জোরে উচ্চতর শব্দগুলি ক্রমবর্ধমান "নরম-ক্লিপড" হচ্ছে তা নিশ্চিত করার জন্য এবি একটি শব্দ।
তবে এটি সংকেতের একটি বিকৃতি প্রবর্তন করে। এই স্তরের বিকৃতিটি কি উচ্চ-মানের অডিও সংশ্লেষণে গ্রহণযোগ্য?
এই সমস্যাটি সমাধানের জন্য আর কী কী পদ্ধতি রয়েছে? আমি দক্ষ স্বল্প-মানের আলগোরিদিমগুলির পাশাপাশি কম দক্ষ উচ্চমানের অ্যালগরিদমগুলিতে আগ্রহী।
আমি একাধিক উপকরণ ট্র্যাক একসাথে মিশ্রণের উদ্দেশ্যে, ডিজিটাল সঙ্গীত সংশ্লেষণের প্রসঙ্গে আমার প্রশ্ন জিজ্ঞাসা করছি। ট্র্যাকগুলি অডিও, প্রাক-রেকর্ডকৃত নমুনাগুলি বা রিয়েল-টাইম মাইক্রোফোন ইনপুট সংশ্লেষিত হতে পারে।