মানুষের কানের শব্দ শুনতে পাচ্ছে যার ফ্রিকোয়েন্সি 20 Hz থেকে 20 kHz পর্যন্ত। Nyquist উপপাদ্যের উপর ভিত্তি করে, রেকর্ডিং হার কমপক্ষে 40 kHz হওয়া উচিত। এটি কি 44.1 kHz বেছে নেওয়ার কারণ?
মানুষের কানের শব্দ শুনতে পাচ্ছে যার ফ্রিকোয়েন্সি 20 Hz থেকে 20 kHz পর্যন্ত। Nyquist উপপাদ্যের উপর ভিত্তি করে, রেকর্ডিং হার কমপক্ষে 40 kHz হওয়া উচিত। এটি কি 44.1 kHz বেছে নেওয়ার কারণ?
উত্তর:
এটি সত্য যে কোনও কনভেনশনের মতো, ৪৪.১ কেএইচজেডের পছন্দটি একটি historicalতিহাসিক দুর্ঘটনা। আরও কয়েকটি historicalতিহাসিক কারণ রয়েছে।
অবশ্যই আপনি যদি 20 কেজি হার্জ ব্যান্ডউইথের সাথে উচ্চমানের অডিও চান তবে স্যাম্পলিং হারটি 40 কেএইচজেডের বেশি হতে হবে।
এটি 48.0 কেএইচজেড তৈরি করার আলোচনা ছিল (এটি 24 ফ্রেম / সেকেন্ড ফিল্ম এবং উত্তর আমেরিকান টিভিতে অস্পষ্ট 30 ফ্রেম / সেকেন্ডের সাথে দুর্দান্তভাবে মিলিত হয়েছিল), তবে 120 মিমি দৈহিক আকার দেওয়া হলে তথ্যটি কতটা পরিমাণে সীমাবদ্ধ ছিল? সিডি ধরে রাখতে পারে, এবং একটি ত্রুটি সনাক্তকরণ এবং সংশোধন স্কিমের প্রয়োজন ছিল এবং এটি ডেটাতে কিছুটা বাড়াবাড়ি প্রয়োজন , সিডি সংরক্ষণ করতে পারে এমন লজিক্যাল ডেটার পরিমাণ (প্রায় 700 এমবি) শারীরিক ডেটার পরিমাণের প্রায় অর্ধেক। এই সমস্ত দেওয়া, 48 কেএইচজেডের হারে, আমাদের জানানো হয়েছিল যে এটি বিথোভেনের 9 তমকে ধরে রাখতে পারে না, তবে এটি একটি সামান্য ধীর গতিতে 9 তমকে পুরো ডিস্কে রাখতে পারে hold সুতরাং 48 kHz আউট আছে is
তবুও, কেন 44.1 এবং 44.0 বা 45.0 kHz বা কিছু দুর্দান্ত গোল সংখ্যা নয়?
তারপরে সেই সময়ে, সনি এফ 1 নামে একটি পণ্য বিদ্যমান ছিল যা সহজেই উপলব্ধ ভিডিও টেপে ডিজিটাল অডিও রেকর্ড করার জন্য ডিজাইন করা হয়েছিল (বেটাম্যাক্স, ভিএইচএস নয়)। এটি ছিল 44.1 kHz (বা আরও স্পষ্টভাবে 44.056 kHz)। সুতরাং এটি F1 থেকে সিডি বা অন্য দিকে, পুনরায় মডেলিং এবং ইন্টারপোলেশন ছাড়াই রেকর্ডিংগুলি স্থানান্তর করা সহজ করে তুলবে।
এটি কীভাবে যায় সে সম্পর্কে আমার বুঝতে পারছি যে এনটিএসসি টিভির অনুভূমিক স্ক্যানের হার ছিল 15.750 কেজি হার্জ এবং ৪৪.১ কাহাহার্টজ এর তুলনায় ঠিক ২.৮ গুণ। আমি পুরোপুরি নিশ্চিত নই, তবে আমি বিশ্বাস করি যে এর অর্থ হ'ল প্রতি অনুভূমিক রেখায় আপনার কাছে তিনটি স্টেরিও নমুনা জোড় থাকতে পারে এবং প্রতি 5 লাইনের জন্য যেখানে আপনার 15 টি নমুনা থাকে সেখানে 14 টি নমুনা এবং কিছু অতিরিক্ত একটি নমুনা থাকে সমতা চেক বা এফ 1 এ রিডানডেন্সি। 5 লাইনের 14 টি নমুনা অনুভূমিক লাইনের প্রতি 2.8 নমুনার সমান এবং প্রতি সেকেন্ডে 15,750 লাইন রয়েছে, যা প্রতি সেকেন্ডে 44,100 নমুনা হিসাবে আসে।
এখন থেকে যেহেতু রঙিন টিভি চালু হয়েছিল, তাই তাদের সামান্য অনুভূমিক রেখার হারটি প্রতি সেকেন্ডে 15734 লাইন থেকে নামিয়ে আনতে হবে। এই সমন্বয়টি সনি এফ 1 এ প্রতি সেকেন্ডে 44,056 টি নমুনা নিয়ে যায়।
উদাহরণস্বরূপ http://www1.cs.columbia.edu/~hgs/audio/44.1.html দেখুন । অ্যান্টি-এলিয়াসিং ফিল্টারগুলির কারণে আপনার 40 কেএইচজেডের বেশি নমুনা হার ব্যবহার করা উচিত। ফিল্টারটির পুনঃস্থাপন opeালের কারণে সংকেত বিকৃতি রোধ করতে আপনার ফ্রিকোয়েন্সিতে কিছুটা রিজার্ভ থাকা উচিত। ১৯৯ 1979 সালে অডিও রেকর্ডিং মানটি যখন আলোচনার মধ্যে ছিল তখন সনি কর্পোরেশন দ্বারা ৪৪.১ কেএইচজেডের আসল মূল্য প্রস্তাব করা হয়েছিল They এই মুহুর্তের জন্য তারা এই হারটি ব্যাপকভাবে ব্যবহার করেছেন।
সুতরাং এটি সাধারণত historicalতিহাসিক কারণ।
ডিজিটাল ফর্ম্যাটগুলিতে রূপান্তর করার সময় অডিওটি ছদ্ম-ভিডিও তরঙ্গরূপে সংরক্ষণ করা হয়েছিল যা কালো বা সাদা হিসাবে দেখা যেতে পারে (বাইনারি ফর্ম্যাট উপস্থাপন করে)।
টেলিভিশন স্ট্যান্ডার্ড দ্বারা ব্যবহৃত মাঠের হার এবং কাঠামোটি 60 হার্জেড ভিডিও হিসাবে নীচে রয়েছে: ক্ষেত্র প্রতি 245 লাইন (প্রথম 35 টি ফাঁকা লাইন বাদে)। প্রতি লাইনে তিনটি নমুনা যা 60 x 245 x 3 = 44100 = 44.1 KHz করে।
এই কনভেনশনটি পরে সিডি ফর্ম্যাটের জন্য ব্যবহৃত হয়েছিল, সরঞ্জামগুলির সামঞ্জস্যতার উদ্বেগের কারণে (সিডি প্রতিবেদনের জন্য ব্যবহৃত সিডি মাস্টার উত্পাদন করতে ব্যবহৃত প্রথম সরঞ্জামটি ছিল ভিডিও ভিত্তিক)।
সাধারণত স্থির সাইনোসয়েডাল তরঙ্গের পরিবর্তে "গতিশীল" সময় রেজোলিউশন দৃষ্টিকোণ থেকে যদি বিবেচনা করা হয় তবে মানুষের জন্য হেইনিগ সীমা 20kHz এর চেয়ে অনেক বেশি হতে পারে। পুনর্নির্মাণ ফিল্টারিংয়ের জন্য 20kHz এবং 22 kHz এর মধ্যে মার্জিন সম্পর্কে আকর্ষণীয় মন্তব্য। প্রকৃতপক্ষে পিটার ক্র্যাভেনের কাছ থেকে টাইম-ডোমেন অপ্টিমাইজড ফিল্টারিংয়ের জন্য আকর্ষণীয় কাজ রয়েছে যা হাই-ফাই প্লেব্যাকের জন্য কমপক্ষে 96kHz এর পক্ষে যুক্তি দেয়।
Pawel
https://en.wikedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F দ্য নাইকুইস্ট – শ্যানন নমুনা উপপাদ বলেছেন যে নমুনাটির ফ্রিকোয়েন্সি পুনরুত্পাদন করতে ইচ্ছুক সর্বাধিক ফ্রিকোয়েন্সি দ্বিগুণ হতে হবে। যেহেতু মানুষের শুনানির পরিমাণটি প্রায় 20 হার্জ থেকে 20,000 হার্জ হার্ট, তাই নমুনার হার 40 কেজি হার্জের চেয়ে বেশি হতে হয়েছিল।
তদ্ব্যতীত, এলিয়াসিং এড়ানোর জন্য সংকেতগুলি স্যাম্পলিংয়ের আগে লো-পাস ফিল্টার করা উচিত। যদিও একটি আদর্শ লো-পাস ফিল্টারটি পুরোপুরি 20 কিলাহার্জ হার্টের নীচে ফ্রিকোয়েন্সি (তাদের মনন না করে) কেটে দেয় এবং 20 KHz এর ওপরে ফ্রিকোয়েন্সি পুরোপুরি কেটে দেয়, যেমন একটি আদর্শ ফিল্টার তাত্ত্বিকভাবে অসম্ভব (এটি ননকসাল), সুতরাং অনুশীলনে একটি ট্রানজিশন ব্যান্ড প্রয়োজনীয়, যেখানে ফ্রিকোয়েন্সি আংশিকভাবে ক্ষীণ হয়। এই ট্রানজিশন ব্যান্ডটি আরও বিস্তৃত, একটি অ্যান্টি-এলিয়জিং ফিল্টার তৈরি করা সহজ এবং আরও অর্থনৈতিক। 44.1 kHz স্যাম্পলিং ফ্রিকোয়েন্সি 2.05 kHz রূপান্তর ব্যান্ডের জন্য অনুমতি দেয় allows
তদ্ব্যতীত, 44,100 হ'ল প্রথম চারটি মৌলিক সংখ্যার (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) এর স্কোয়ারের পণ্য এবং তাই এর মধ্যে অনেকগুলি ছোট ছোট কারণ রয়েছে।
বর্ণনার জন্য [ http://batmobile.blogs.ilrt.org/audio-analysis-on-an- আইফোন দেখুন । .এই উপপাদ্য Nyquist নমুনা উপপাদ্য বলা হয় যে গুণমানের উল্লেখযোগ্য ক্ষতি ছাড়াই X Hz এর সংকেত নমুনার জন্য, আপনার ফ্রিকোয়েন্সি 2X এ নমুনা করা উচিত। মানুষের শুনানির সীমাটি প্রায় 20KHz, যার জন্য প্রায় 40Khz নমুনা হার প্রয়োজন। এই কারণেই সিডিগুলি 44Khz এ নমুনা দেওয়া হয়। যেমন একটি সিডিতে রেকর্ডিংয়ের প্রতিটি সেকেন্ডে রেকর্ডিংয়ে থাকা সর্বোচ্চ সম্ভাব্য ফ্রিকোয়েন্সিটির 44,000 পরিমাপ থাকে।