অ্যালগরিদম (গুলি) ক্লিপিং ছাড়াই অডিও সংকেতগুলি মিশ্রিত করতে


49

আমি দুই বা ততোধিক পিসিএম অডিও চ্যানেলগুলি (যেমন রেকর্ড করা নমুনাগুলি) ডিজিটালভাবে অ্যাকোস্টিক-বিশ্বস্ত উপায়ে মিশ্রণ করতে চাই, পছন্দসই নিকট-আসল সময়ে (অর্থাত্ সামান্য বা কোনও উঁকি না দেওয়া)।

এটি করার শারীরিকভাবে "সঠিক" উপায় হ'ল নমুনাগুলির সংক্ষিপ্তসার। তবে আপনি যখন দুটি স্বেচ্ছাসেবী নমুনা যুক্ত করেন, ফলস্বরূপ মানটি সর্বোচ্চ মানের দ্বিগুণ হতে পারে।

উদাহরণস্বরূপ, যদি আপনার নমুনাগুলি 16-বিট মান হয় তবে ফলাফলটি 65536 * 2 পর্যন্ত হবে। এই ক্লিপিং ফলাফল।

এখানে নিষ্পাপ সমাধানটি এন দ্বারা ভাগ করা, যেখানে এন মিশ্রিত হওয়া চ্যানেলের সংখ্যা। যাইহোক, এর ফলে প্রতিটি নমুনা 1 / Nth জোরে হয়, যা সম্পূর্ণ অবাস্তব। বাস্তব বিশ্বে যখন দুটি যন্ত্র একযোগে বাজায়, তখন প্রতিটি উপকরণ অর্ধেক জোরে পরিণত হয় না।

চারপাশে পড়া থেকে, মিশ্রণের একটি সাধারণ পদ্ধতি হ'ল: ফলাফল = এ + বি - এ বি, যেখানে এ এবং বি দুটি সাধারণ নমুনা মিশ্রিত হচ্ছে, এবং জোরে উচ্চতর শব্দগুলি ক্রমবর্ধমান "নরম-ক্লিপড" হচ্ছে তা নিশ্চিত করার জন্য এবি একটি শব্দ।

তবে এটি সংকেতের একটি বিকৃতি প্রবর্তন করে। এই স্তরের বিকৃতিটি কি উচ্চ-মানের অডিও সংশ্লেষণে গ্রহণযোগ্য?

এই সমস্যাটি সমাধানের জন্য আর কী কী পদ্ধতি রয়েছে? আমি দক্ষ স্বল্প-মানের আলগোরিদিমগুলির পাশাপাশি কম দক্ষ উচ্চমানের অ্যালগরিদমগুলিতে আগ্রহী।

আমি একাধিক উপকরণ ট্র্যাক একসাথে মিশ্রণের উদ্দেশ্যে, ডিজিটাল সঙ্গীত সংশ্লেষণের প্রসঙ্গে আমার প্রশ্ন জিজ্ঞাসা করছি। ট্র্যাকগুলি অডিও, প্রাক-রেকর্ডকৃত নমুনাগুলি বা রিয়েল-টাইম মাইক্রোফোন ইনপুট সংশ্লেষিত হতে পারে।


আমি অবাক হয়েছি যে কতক্ষণ সম্ভব সংকেতকে কিছুটা সময় বদলে ক্লিপিং এড়ানো সম্ভব।
সেবাস্তিয়ান রিচেল্ট

ভাল ধারণা, যদিও আমি সন্দেহ করি যে এটি খুব সহজ নয়, বিশেষত যখন আপনার খুব বেশি চেহারা নেই (যেমন রিয়েল-টাইমে)। সমস্যাটি হ'ল, কী ধরণের টাইম-শিফ্ট উপযুক্ত হবে তা জানতে আপনাকে আগে থেকেই নমুনাটি জানতে হবে। এটি বলেছে যে, বেশিরভাগ সংগীতে আপনার পারস্পরিক সম্পর্কের উচ্চ সম্ভাবনা থাকে, তাই কিছুটা এলোমেলো সময় বদলানো খুব ভালভাবে কাজ করতে পারে। কারও কি এখানে আঁকতে কোন অভিজ্ঞতা আছে?
bryhoyt

2
@ ব্রাইহয়েট: রিয়েল মিক্সারগুলি সংকেতগুলি একসাথে যোগ করে। এটাই. কোনও সময় বিলম্ব বা অ-লিনিয়ার প্রসেসিংয়ের প্রয়োজন নেই। ক্লিপিং কোনও সমস্যা নয় কারণ আসল সংকেতগুলি এতটা জোরে ছিল না।
এন্ডোলিথ

2
16 + 16 বিট = 17 বিট ;-)
নিকওয়াল

1
কেবল ইনপুট সংখ্যায় ভাগ করুন, তারপরে ক্লিপিং সম্ভব হবে না। এবং যদি শব্দটি খুব শান্ত হয় তবে পরিবর্ধকটি চালু করুন ...
সার্জে বোর্স

উত্তর:


14

আপনার সমস্যার কোনও প্রসঙ্গ না জেনে আপনাকে প্রাসঙ্গিক কৌশলগুলিতে নির্দেশ করা খুব কঠিন।

সুস্পষ্ট উত্তরটি হ'ল প্রতিটি নমুনার লাভকে সামঞ্জস্য করতে বলে যাতে ক্লিপিং খুব কমই ঘটে। একা বাজানোর কথা বলার চেয়ে সংগীতজ্ঞরা কোনও নকশায় নরম খেলবেন এমনটা ধরে নেওয়া অবাস্তব নয়।

A + B - AB দ্বারা প্রবর্তিত বিকৃতিটি কেবল গ্রহণযোগ্য নয়। এটি বি এর সুরেলাগুলির প্রতিটি পক্ষের A এর মিরর চিত্র তৈরি করে - রিং-মডুলেশনের সমতুল্য - যা খুব খারাপ লাগবে যদি A এবং B এর সমৃদ্ধ বর্ণালী না থাকে তবে হারমোনিক্স সমৃদ্ধ বর্ণালী থাকে। উদাহরণস্বরূপ 220 এবং 400 Hz এ দুটি বর্গাকার তরঙ্গে এটি ব্যবহার করে দেখুন।

একটি আরও "প্রাকৃতিক" ক্লিপিং ফাংশন যা প্রতি-নমুনা-ভিত্তিতে নমুনা ভিত্তিতে কাজ করে, তা হ'ল তান কার্য - এটি আসলে কিছু অ্যানালগ উপাদানগুলির নরম-সীমিত আচরণের সাথে মেলে। এর বাইরে, আপনি ক্লাসিক গতিশীল সংকোচনের কৌশলগুলি সন্ধান করতে পারেন - যদি আপনার সিস্টেমটি এগিয়ে দেখতে এবং পিকস কমিংগুলি আগাম দেখতে পারে তবে এটি আরও ভাল।


4
সংযোজন এবং হার্ড ক্লিপিং। যে কোনও ওপেন সোর্স মোড প্লেয়ারের দিকে তাকান। ক্লিপিং কমানোর জন্য ইনপুটগুলি যথাযথভাবে
মাপানো

4
বেশিরভাগ পরিস্থিতিতে সমস্যাটি সমাধান করা বিকাশকারীদের দায়িত্ব নয়। আপনি ব্যবহারকারীর / সুরকারকে প্রতিটি চ্যানেলের ভলিউম সামঞ্জস্য করার সম্ভাবনাটি দিয়ে থাকেন এবং ক্লিপিংটি তাদের কাছে গ্রহণযোগ্য হয় তাই এই মিশ্রণটি ব্যবহারকারীর উপর নির্ভর করে। উদাহরণস্বরূপ, রেনোইসে, ডিফল্টরূপে, প্রতিটি উপকরণ / নোটের লাভ 1 হয় এবং ট্র্যাকগুলি যুক্ত করার সাথে জিনিসগুলি খারাপভাবে ক্লিপ শুরু করে - ম্যাপ্রে ক্লিপিং প্রতিরোধ করার জন্য মডিউলে নোট বা যন্ত্রগুলির ভলিউম সামঞ্জস্য করা ব্যবহারকারীর উপর নির্ভর করে মাস্টার ট্র্যাক (এটি পছন্দ না হলে) এখানে একটি স্ক্রিনশট দেখানো হচ্ছে: i.imgur.com/KVxDt.png
পিচেনেটস

2
আইআইআরসি, ফাস্টট্র্যাকার আরও রক্ষণশীল ছিল, এটি প্রতিটি ট্র্যাকের উপর মনোনিবেশ প্রয়োগ করেছিল এবং তারপরে x1 থেকে x32 এর পছন্দ সংলাপে একটি বৈশ্বিক "মেকআপ লাভ" হয়েছিল। আমার মনে আছে আমি যখন আমার সমস্ত মডিউলগুলি একটি সিডির জন্য রেকর্ড করতে হয়েছিলাম, যখন আমি সবচেয়ে
নিম্নতমটি

2
সূক্ষ্ম স্তর সম্পর্কে, যদি আপনার লুপটিতে কোনও ব্যবহারকারী না থাকে; 1/32 একটি একেবারে নিরাপদ স্তর (কোনও ক্লিপিং নেই)। ধরে নিই যে চ্যানেলগুলি পারস্পরিক সম্পর্কযুক্ত নয় (যা সংগীতের পক্ষে খুব সত্য নয় - পটভূমির মিশ্রণগুলি মিশ্রণের সময় আরও সঠিক), 1 / বর্গক্ষেত্রের মান (32) উচ্চতা এবং ক্লিপিং সম্ভাবনার মধ্যে একটি ভাল সমঝোতা হবে। এখনও সেরা সমাধানটি 1/32 ব্যবহার করা এবং তারপরে একটি গতিশীল সংক্ষেপক সহ আপনার নমুনাগুলি পোস্ট-প্রক্রিয়া করা উচিত।
পিচেনেটস

3
সংযোজন। হার্ডওয়্যার মিক্সারগুলি যেভাবেই এটি করে এবং লোকেদের আচরণের প্রত্যাশার উপায়। সিস্টেম-স্তরের মিক্সারগুলি কেবল ক্লিপ করে। সিস্টেম চালকরা যদি কোনও প্রকারের অ-লিনিয়ার প্রসেসিং বাস্তবায়িত করেন তবে এটি একটি বড় সমস্যা হবে - আমি যে মাস্টারিং ইঞ্জিনিয়ারদের শুনেছি তা তারা যা শুনছেন তা তাদের সংক্ষেপক প্লাগ-ইন সেটিং বা কোনও সিস্টেম-স্তরের গতিশীল প্রক্রিয়াকরণ কিনা তা নির্ধারণের চেষ্টা করার ব্যথাটি আমি কল্পনা করব। সংগীত উত্পাদন সফ্টওয়্যার ডায়নামিক্স সংক্ষেপণ প্লাগইনগুলির একটি বিস্তৃত প্যালেট সরবরাহ করে, এটি তাদের মিক্সটি ক্লিপ না করে তা নিশ্চিত করা ব্যবহারকারীদের উপর নির্ভর করে।
পিকনেটস

16

এটি করার শারীরিকভাবে "সঠিক" উপায় হ'ল নমুনাগুলির সংক্ষিপ্তসার। তবে আপনি যখন দুটি স্বেচ্ছাসেবী নমুনা যুক্ত করেন, ফলস্বরূপ মানটি সর্বোচ্চ মানের দ্বিগুণ হতে পারে। ... এখানে নিষ্পাপ সমাধানটি এন দ্বারা ভাগ করা, যেখানে এন মিশ্রিত হওয়া চ্যানেলের সংখ্যা।

এটি "নিষ্পাপ" সমাধান নয়, এটি একমাত্র সমাধান। প্রতিটি অ্যানালগ এবং ডিজিটাল মিক্সার এটাই করে, কারণ এটি বায়ু যা করে, এবং এটিই আপনার মস্তিষ্ক করে।

দুর্ভাগ্যক্রমে, এটি একটি সাধারণ ভুল ধারণা হিসাবে প্রতীয়মান হয়েছে, যেমন এই অন্যান্য ভুল অ-রৈখিক "মিশ্রণ" (বিকৃতি) অ্যালগোরিদম দ্বারা প্রদর্শিত:

"এন বিভাজক" হেডরুম বলা হয় ; তরঙ্গরূপের আরএমএস স্তরের উপরে বরাদ্দ শৃঙ্গগুলির জন্য অতিরিক্ত ঘর। সিগন্যালের জন্য প্রয়োজনীয় হেডরুমের পরিমাণ সিগন্যালের ক্রেস্ট ফ্যাক্টর দ্বারা নির্ধারিত হয় । (ডিজিটাল সিগন্যাল স্তরের এবং হেডরুমের ভুল বোঝাবুঝি সম্ভবত আংশিকভাবে লাউডনেস ওয়ার এবং এলিফাঙ্কের জন্য দায়ী ।)

অ্যানালগ হার্ডওয়্যারে, হেডরুমটি সম্ভবত 20 ডিবি। একটি হার্ডওয়্যার ডিএসপিতে প্রায়শই স্থির পয়েন্ট ব্যবহৃত হয়, একটি নির্দিষ্ট হেডরুম সহ; উদাহরণস্বরূপ, AD এর সিগমাডিএসপিতে হেডরুমের 24 ডিবি রয়েছে। কম্পিউটার সফ্টওয়্যারগুলিতে অডিও প্রসেসিংটি সাধারণত 32 বিট ভাসমান স্থানে সঞ্চালিত হয়, তাই হেডরুমটি প্রচুর।

আদর্শভাবে, আপনার মোটেও N দ্বারা ভাগ করার দরকার নেই, আপনি কেবল সংকেতগুলিকে একসাথে যোগ করতে চাইবেন, কারণ আপনার সংকেতগুলি 0 ডিবিএফএসে প্রথম স্থানে তৈরি হবে না।

মনে রাখবেন যে বেশিরভাগ সংকেত একে অপরের সাথে সম্পর্কিত নয়, যাইহোক, তাই মিশ্রণের সমস্ত চ্যানেলগুলির জন্য একই মুহূর্তে গঠনমূলকভাবে হস্তক্ষেপ করা অস্বাভাবিক। হ্যাঁ, 10 অভিন্ন, ইন-ফেজ সাইন ওয়েভগুলিকে মিশ্রিত করা শিখর স্তরকে 10 গুণ (20 ডিবি) বাড়িয়ে তুলবে, তবে 10 অ-সুসংহত শব্দ উত্সগুলিকে মিশ্রিত করলে কেবল শিখর স্তরটি 3.2 গুণ (10 ডিবি) বৃদ্ধি পাবে। বাস্তব সংকেতগুলির জন্য, মানটি এই চরমের মধ্যে থাকবে।

ক্লিপিং ছাড়াই কোনও ড্যাকের মিশ্র সংকেত পাওয়ার জন্য, আপনি কেবল মিশ্রণের লাভ হ্রাস করতে পারেন। আপনি যদি হার্ড ক্লিপিং ছাড়াই মিশ্রণের আরএমএস স্তরটি উচ্চ রাখতে চান তবে ওয়েভফর্মের শিখরগুলিকে সীমাবদ্ধ করতে আপনাকে কিছু ধরণের সংক্ষেপণ প্রয়োগ করতে হবে , তবে এটি মিশ্রণের অংশ নয়, এটি একটি পৃথক পদক্ষেপ। আপনি প্রথমে প্রচুর হেডরুমের সাথে মেশান এবং তারপরে এটি পছন্দসই পরে গতিশীল পরিসীমা সংক্ষেপণের মাধ্যমে রাখুন।


1
আমি এই ধারণাগুলি বুঝতে পারি, তবে আমি নিশ্চিত নই যে এটি বেশ সঠিক correct অবশ্যই, আমি যদি 16-বিটের নমুনাগুলির একগুচ্ছ যোগ করি তবে 32 বিট আমাকে সংখ্যাসূচক রুম দেয়। তবে এখনও আমি বাস্তব-বিশ্বের সাউন্ড সিস্টেমের একটি স্বাভাবিকিকৃত ভলিউমে ফলাফলের মিশ্রণটি খেলতে হবে। আমি প্রতিটি চ্যানেল পৃথকভাবে চালিত চেয়ে 2 টি চ্যানেল আরও জোরে শুনতে চাই, তবে আমি ক্লিপিং চাই না। 32 বা এমনকি 64 বিটগুলিতে আমার অঙ্কগুলি করা এটিকে কাজে দেয় না। সম্ভবত আমি আমার নিজের প্রশ্নের উত্তর দিতে শুরু করছি: আসল নমুনাগুলি সর্বাধিক প্রশস্ততার চেয়ে শান্ত স্তরে স্বাভাবিক করা উচিত। আপনি যেমন পরামর্শ দিচ্ছেন, কিছু মিক্সিং হেডরুম রেখে চলেছেন।
bryhoyt

3
@ ব্রাইহয়েট: হ্যাঁ, তবে আপনার এটিও মনে রাখতে হবে যে তরঙ্গগুলি একে অপরের সাথে খুব কমই সম্পর্কযুক্ত, সুতরাং 5 টি শব্দ একসাথে যুক্ত করা 5 গুণ উচ্চতর শিখর তৈরি করে না।
এন্ডোলিথ

1
ধন্যবাদ, @ এন্ডোলিথ, আমি অনুমান করি যে এটি সত্যিই এই সমস্তের কেন্দ্রবিন্দুতে রয়েছে এবং আমাকে ব্যাখ্যা করেছেন যে কেন এটি প্রথম এতটা বড় সমস্যা হিসাবে এত বড় সমস্যা নয়।
bryhoyt

সুতরাং যদি 10 অ-সুসংহত সূত্রগুলি 10 ডিবি দেয়, তবে স্কয়ারটি (উত্সের সংখ্যা) দ্বারা বিভাজন করা কি যুক্তিসঙ্গত হিউরিস্টিক হবে? এটি হ'ল, যদি আপনার কাছে 3 টি উত্স পাওয়া যায় তবে সেগুলি যোগ করুন এবং স্কয়ার্ট (3) দ্বারা ভাগ করুন? (একটি প্রাচীন থ্রেডে মন্তব্য করার জন্য দুঃখিত)
nerdfever.com

@ নার্ডফাইভার.কম আরএমএসের স্তরগুলি কীভাবে একত্রিত করে, তাই ... সম্ভবত?
এন্ডোলিথ

6

সূত্রটি

ফলাফল=একজন+ +B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর-একজনB ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর

একজনB ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর=একজন*B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর

ফলাফল=(একজন+ +B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর)

1

=0.5=1/2

ফলাফল[আমি]=[আমি](একজন[আমি]+ +B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর[আমি])

[আমি]একজনB ইংরেজী বর্ণমালার দ্বিতীয় অক্ষরফলাফল

সম্ভবত এটি:

[আমি]=(একজন[আমি]+ +B ইংরেজী বর্ণমালার দ্বিতীয় অক্ষর[আমি],[আমি-1])

আপডেট: হটপাউ 2 এর পরামর্শ অনুসারে আপনি ইনপুট সিগন্যালটি বিলম্ব করতে পারেন তবে লাভ দমন নয়। এটিকে "চেহারা-এগিয়ে সীমাবদ্ধ" বলা হয়।


"এবি" দ্বারা আমি "এ * বি" বোঝাতে চাইছি। আমি বুঝতে পারি যে প্রশস্ততাটি ইতিবাচক বা নেতিবাচক হতে পারে। আপনি ঠিক বলেছেন, আমার সমীকরণটি নেতিবাচক প্রশস্ততার সাথে জড়িত সংমিশ্রণের জন্য খুব বেশি বোঝায় না।
bryhoyt

আমাকে 8 থেকে 10 (এন) বিভিন্ন সাইনাস ওয়েভ মিশ্রিত করতে হবে। অনুভূতভাবে আমি জানতাম যে সঠিক মানটি 0.3 এর কাছাকাছি ছিল ... 1 / √N সঠিক বলে মনে হচ্ছে ... যে সূত্রটি সঠিক কেন তার কোনও লিঙ্ক?
জিব্রি

5

এক-উপায়ে রিজ-টাইম মিক্সিংয়ের জন্য এটি করা যেতে পারে একটি চেহারা-এগিয়ে এজিসি ব্যবহার করতে, যেখানে যোগ প্রশস্ততা ক্লিপিংয়ের সীমা ছাড়িয়ে যাওয়ার আগে এক বা উভয় চ্যানেলের লাভ একটি হার্ড-টু-বোধ হারে হ্রাস করা হয়। যত কম নজর পাওয়া যায়, তা হয় এজিসি লাভের সামঞ্জস্যটি আরও শ্রবণযোগ্য হয়ে উঠবে, বা নরম উপকারের জন্য অ্যাডজাস্ট র‌্যাম্পের সর্বাধিক উপার্জন সীমাতে প্রতি চ্যানেল প্রতি 0.5 এর কাছাকাছি পৌঁছে যাবে। কিছু পূর্বাভাসের সাথে সাবলীল উত্সগুলির জন্য, কেউ সময় মতো খামের আচরণ সম্পর্কিত পরিসংখ্যানকে অভিযোজিতভাবে একটি লাভের সীমা অনুমান করতে ব্যবহার করতে পারে তবে কিছুটা ব্যর্থতার সম্ভাবনা সহ (যা হঠাৎ এজিসি লাভ সমন্বয় হবে)।


এটি লুক-ফরোয়ার্ড সীমাবদ্ধ, তাত্ক্ষণিক এজিসি নয়।
বজর্ন রোচে

2
@ জর্জনরোচে: কোনও সীমাবদ্ধকে এক প্রকার এজিসি হিসাবে বিবেচনা করা যায় না?
এন্ডোলিথ

কিছু সীমাবদ্ধতা হ'ল এজিসি, তবে লাউয়াহেড সীমাবদ্ধ কোনও এজিসি নয়।
বজর্ন রোচে

1
@ জর্জনরোচ ভাল এটি স্বয়ংক্রিয় এবং লাভ নিয়ন্ত্রণ করে ...
ওলি নিমিত্তালো

2

1990 এর দশকের শেষের দিকে এবং প্রথম 2000 এর ডিজিটাল তরঙ্গ (টিপটোড করার পরে) এর মিশ্র ডিজাইনারের সাথে আমি কথা বললাম। আমি মনে করি লোকটি এসপিএলের একজন ডিজাইনার ছিলেন, তবে সম্ভবত এটি বড় নয়, আমি নামটি কেবল ব্র্যান্ডের কোনওটাই মনে করি না, আমি কেবল মনে করি মেশিনটি আসলেই কত বড় এবং ব্যয়বহুল ছিল।

আমরা দীর্ঘ কথা বলেছিলাম এবং অবশেষে গ্যারান্টি দেওয়ার কৌশলগুলি সম্পর্কে বললাম যে তাদের 64/128 @ 24 বিট চ্যানেলগুলি একত্রে মিশ্রিত হয়েছে 24 টি বিট নির্ভুল মিশ্র আউটপুট চ্যানেল ক্লিপিং ছাড়াই অবশিষ্ট ছিল।

তিনি যে কৌশলটি ব্যাখ্যা করেছিলেন তা বরং সহজ ছিল। ৪৮ টি বিট চ্যানেলে 24৪ টি ট্র্যাক (24 বিটের উপর) যুক্ত করা হয়েছিল, যেখানে ক্লিপিং ঘটতে পারে না। সোজা।

আমি বলতে পারি না যে কীভাবে সেই সংকেতটি 48 টি থেকে 24 বিটের দিকে পিছনে দেওয়া হয়েছিল। সম্ভবত সেখানে কৌশলযুক্ত রান্নাঘরের রেসিপি প্রয়োগ করা হয়।

এবং সম্ভবত এটি অর্জনের জন্য অনেকগুলি কৌশল রয়েছে, সর্বোপরি রিয়েল-টাইমে করা হয়েছে কিনা তা নির্ধারণের জন্য ইতিমধ্যে উচ্চ-শিখরগুলির সাথে ইতিমধ্যে রেকর্ডকৃত সমস্ত সংকেত দিয়ে ... কল্পনা করার জন্য সমস্ত ধরণের স্বাভাবিকীকরণ।


2

গ্লোবাল ভলিউম কম। ইমপুলস ট্র্যাকার ধ্রুপদীভাবে চ্যানেলগুলি প্রায় 33% ভলিউম সর্বোচ্চ ডিফল্টরূপে আউটপুট করে।

এটি কয়েকটি চ্যানেল (4 চ্যানেল অ্যামিগা এমওডি) এবং মিউজিক 50 টি চ্যানেলযুক্ত গানের জন্য যথেষ্ট নরম বলে মনে হয় (যেহেতু চ্যানেলের সামগ্রীগুলি সাধারণত সম্পর্কযুক্ত না হয় তাই ভলিউমটি কোনও নির্দিষ্ট স্তরের অত দ্রুত যোগ করে না ... আরও কিছু চ্যানেল প্রচুর পরিমাণে চলছে সর্বাধিক পরিমাণে আউটপুট হবে)। এটি হার্ড-বাম বা হার্ড-ডান প্যানড চ্যানেলগুলির জন্য পর্যাপ্ত হেডরুম ছেড়ে দেয় (যা রেঞ্জের 66% ব্যবহার করে)।

এছাড়াও আপনি আপনার চ্যানেলগুলি 16 বেটে একসাথে যুক্ত করতে চান না, আপনি এগুলি 32 বেটে একসাথে যুক্ত করতে চান, তারপরে ফলাফলটি ক্লিপ করুন এবং একেবারে শেষের দিকে 16 বীটে হ্রাস করুন। আপনার উচ্চতর পরিসরের প্রয়োজন হবে যাতে এটি গণিত করার সময় চারপাশে আবৃত না হয়। আরেকটি বিকল্প হ'ল 32 বিট ভাসমান পয়েন্ট (যা ফিল্টারগুলি, প্রভাবগুলি ইত্যাদির জন্য সুবিধাজনক) ব্যবহার করা।


0

আমি মনে করি কীটি হ'ল, যদি আপনার 16 বিট মান হয় এবং আপনার 2 টি মান একসাথে থাকে যা সর্বাধিক মান হতে পারে তবে সর্বাধিক মান হতে পারে তবে আপনার কাছে 2 টি বিকল্প রয়েছে:

1) উভয়কে 32 বিট অ্যাড কাস্ট করুন তারপর সংযোজন যে মানটি অতিক্রম করে সর্বাধিক মানটি প্রদান করুন। তারপরে এটিকে 16 বিটে ফিরুন। উদাহরণস্বরূপ, যদি আপনার মানগুলি 32768 এবং 34567 হয় তবে এটি 65535 ছাড়িয়ে গেছে এবং কীটি তারপরে 65535 ফেরত দিতে হবে signed যদি ন্যূনতম মান শেষে স্বাক্ষরিত মানগুলি ব্যবহার করা হয় তবে আপনি একই কাজ করবেন।

2) উভয় মান সংকুচিত করুন, তারপরে তাদের একসাথে যুক্ত করুন।

প্রথমটি হ'ল হার্ড ক্লিপিং, দ্বিতীয়টি নরম ক্লিপিং। অ্যানালগ সিস্টেমগুলি সমস্ত হার্ড ক্লিপিং হয়।


0

উভয় ট্র্যাকের ফ্রিকোয়েন্সি একই স্পেস ফ্রিকোয়েন্সি অনুসারে গ্রহণ করলে এগুলি কেবলমাত্র দ্বিগুণ হয়ে যাবে। প্রতিটি শব্দের জন্য ফ্রিকোয়েন্সি বর্ণালীগুলির ক্ষেত্রগুলি খোদাই করে এবং স্থানান্তরগুলি নিয়ন্ত্রণ করে এবং শব্দগুলির টেকসই করে এটিকে ঘিরে ধরার জন্য eq এবং সংক্ষেপণ ব্যবহার করুন যাতে এটি যেখানে উচিত সেখানে সবকিছু ছুঁড়ে যায়। যদিও এটি প্রশ্নের উত্তর দেয় না যদিও। আপনি কম ফ্রিকোয়েন্সি সংকেত 2 এমএস অবধি বিলম্ব করতে পারেন। এটি পর্যায়ের মাধ্যমে বাতিল হবে না কারণ তরঙ্গদৈর্ঘ্যগুলি উচ্চতর ফ্রিকোয়েন্সিগুলির চেয়ে দীর্ঘ এবং এটি স্থান যুক্ত করবে কারণ ক্ষুধার্ত খাদের সংকেতগুলির সাথে স্থানান্তরগুলি পুরোপুরি সময়মতো হয় না। কিছুটা দেরিতে আরও কিছুটা বিলম্ব যুক্ত করা কম সংকেতটি পরীক্ষা করা আকর্ষণীয় হবে।


-1
A + B + {
    (|A| = A) = (|B| = B) = true: -AB;
    (|A| = A) = (|B| = B) = false: AB;
    else: 0
}

এটি, যদি এ এবং বি উভয়ই একটি সাইন ভাগ করে, একটি সীমিত অফসেট প্রয়োগ করুন। অফসেটটির প্রস্থতা এ এবং বি এর পণ্য the

যদি এ এবং বি কোনও চিহ্নটি ভাগ না করে তবে সীমাবদ্ধতা প্রয়োগ করা হয় না, কারণ উপচে পড়া কোনও উপায় নেই।


মনে রাখবেন এটি পরিবর্তনশীল নয়। আপনি যদি 2 টিরও বেশি ভয়েস মিক্স করতে চান তবে আপনাকে একবারে এগুলি মিশাতে হবে। এক্ষেত্রে আপনার সমস্ত কিছু এক দিকের "সমতল" করা উচিত (যদি আপনি খুব বেশি হন তবে নেতিবাচক মানগুলির সাথে ধনাত্মক মানগুলি সমতল করুন; যদি আপনি খুব কম হন তবে ইতিবাচক মানগুলির সাথে নেতিবাচক মানগুলি সমতল করুন)। একবার আপনি অফসেটের জন্য অ্যাকাউন্ট করেছেন (বাকি মানগুলিতে আনুপাতিকভাবে প্রয়োগ করা হবে); বাইনারি পদ্ধতির ব্যবহার করুন, তবে মিশ্র মানগুলির সংখ্যার উপর ভিত্তি করে সীমাবদ্ধকে স্কেল করুন।
ধনী রিমার

-1

আমার পরামর্শ:

  1. ট্র্যাক অডিও ফর্ম্যাটটি 16 বিট নির্দিষ্ট পয়েন্ট থেকে 32 বিবিট ভাসমান স্থানে রূপান্তর করুন।
  2. মিশ্রিত হওয়ার জন্য সমস্ত ট্র্যাকের বর্তমান নমুনা মান যুক্ত করুন।
  3. আর কিছু করবেন না।

ব্যবহারকারী এই মিশ্র স্ট্রিমটি সংকোচনের সাথে প্রক্রিয়া করতে এবং / অথবা 16 বিট নির্দিষ্ট পয়েন্ট ফর্ম্যাটে পুনর্বিবেচনার আগে সীমাবদ্ধ করতে ইচ্ছুক হতে পারে (এই রূপান্তরটি ধরে নিচ্ছেন ... মাস্টারিং ইঞ্জিনিয়ারদের হাতে মিশ্রণটি সাধারণত উচ্চতর রেজোলিউশন ফর্ম্যাটে রেখে যায়)


2
হ্যালো, এবং DSP.se এ আপনাকে স্বাগতম অবদান দেওয়ার চেষ্টা করার জন্য আমরা আপনাকে ধন্যবাদ জানাই, তবে আমি মোটেই ওপি-র প্রশ্নের উত্তরটি পছন্দ করি না বলে মনে হয় না। ওপিতে তার সিস্টেমের "ব্যবহারকারী" উল্লেখ করা হয়নি: তিনি সম্ভবত এটি নিজের সাথে খেলছেন বা নির্দিষ্ট প্রয়োজনীয়তার সাথে প্রোগ্রামটি লিখে যাচ্ছেন। ডাউনওয়েট করার জন্য আমি দুঃখিত: আপনি যদি নিজের উত্তরটি আরও বেশি করে দেন তবে আমি আমার ভোট সংশোধন করতে পেরে খুশি হব। এছাড়াও, দয়া করে আপনার ফর্ম্যাটিংয়ের যত্ন নিন: কীভাবে ভাল উত্তর লিখতে হয় তা দেখতে FAQ দেখুন।
পেনেলোপ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.