কেন আমরা রেকর্ডিং স্যাম্পলিং হার হিসাবে 44.1 kHz বেছে নেব?

21

মানুষের কানের শব্দ শুনতে পাচ্ছে যার ফ্রিকোয়েন্সি 20 Hz থেকে 20 kHz পর্যন্ত। Nyquist উপপাদ্যের উপর ভিত্তি করে, রেকর্ডিং হার কমপক্ষে 40 kHz হওয়া উচিত। এটি কি 44.1 kHz বেছে নেওয়ার কারণ?

audio sampling

— new_comer_forever
সূত্র

4

এটি ভিডিও ফ্রেমের হারের সাথে সামঞ্জস্যের জন্য বেছে নেওয়া হয়েছিল। এন.ইউইকিপিডিয়া.org

— উইকি

প্রায় 12-15k এর উপরে ফ্রিকোয়েন্সিগুলি সামান্য বা কোনও মান যোগ করে না us ৪০ বছরের বেশি বয়সী বেশিরভাগ লোকের ব্যবহারকারীর সামান্য পরিমাণ রয়েছে a স্তরের উপরে ud

— ক্রিস হিথ

32

এটি সত্য যে কোনও কনভেনশনের মতো, ৪৪.১ কেএইচজেডের পছন্দটি একটি historicalতিহাসিক দুর্ঘটনা। আরও কয়েকটি historicalতিহাসিক কারণ রয়েছে।

অবশ্যই আপনি যদি 20 কেজি হার্জ ব্যান্ডউইথের সাথে উচ্চমানের অডিও চান তবে স্যাম্পলিং হারটি 40 কেএইচজেডের বেশি হতে হবে।

এটি 48.0 কেএইচজেড তৈরি করার আলোচনা ছিল (এটি 24 ফ্রেম / সেকেন্ড ফিল্ম এবং উত্তর আমেরিকান টিভিতে অস্পষ্ট 30 ফ্রেম / সেকেন্ডের সাথে দুর্দান্তভাবে মিলিত হয়েছিল), তবে 120 মিমি দৈহিক আকার দেওয়া হলে তথ্যটি কতটা পরিমাণে সীমাবদ্ধ ছিল? সিডি ধরে রাখতে পারে, এবং একটি ত্রুটি সনাক্তকরণ এবং সংশোধন স্কিমের প্রয়োজন ছিল এবং এটি ডেটাতে কিছুটা বাড়াবাড়ি প্রয়োজন , সিডি সংরক্ষণ করতে পারে এমন লজিক্যাল ডেটার পরিমাণ (প্রায় 700 এমবি) শারীরিক ডেটার পরিমাণের প্রায় অর্ধেক। এই সমস্ত দেওয়া, 48 কেএইচজেডের হারে, আমাদের জানানো হয়েছিল যে এটি বিথোভেনের 9 তমকে ধরে রাখতে পারে না, তবে এটি একটি সামান্য ধীর গতিতে 9 তমকে পুরো ডিস্কে রাখতে পারে hold সুতরাং 48 kHz আউট আছে is

তবুও, কেন 44.1 এবং 44.0 বা 45.0 kHz বা কিছু দুর্দান্ত গোল সংখ্যা নয়?

তারপরে সেই সময়ে, সনি এফ 1 নামে একটি পণ্য বিদ্যমান ছিল যা সহজেই উপলব্ধ ভিডিও টেপে ডিজিটাল অডিও রেকর্ড করার জন্য ডিজাইন করা হয়েছিল (বেটাম্যাক্স, ভিএইচএস নয়)। এটি ছিল 44.1 kHz (বা আরও স্পষ্টভাবে 44.056 kHz)। সুতরাং এটি F1 থেকে সিডি বা অন্য দিকে, পুনরায় মডেলিং এবং ইন্টারপোলেশন ছাড়াই রেকর্ডিংগুলি স্থানান্তর করা সহজ করে তুলবে।

এটি কীভাবে যায় সে সম্পর্কে আমার বুঝতে পারছি যে এনটিএসসি টিভির অনুভূমিক স্ক্যানের হার ছিল 15.750 কেজি হার্জ এবং ৪৪.১ কাহাহার্টজ এর তুলনায় ঠিক ২.৮ গুণ। আমি পুরোপুরি নিশ্চিত নই, তবে আমি বিশ্বাস করি যে এর অর্থ হ'ল প্রতি অনুভূমিক রেখায় আপনার কাছে তিনটি স্টেরিও নমুনা জোড় থাকতে পারে এবং প্রতি 5 লাইনের জন্য যেখানে আপনার 15 টি নমুনা থাকে সেখানে 14 টি নমুনা এবং কিছু অতিরিক্ত একটি নমুনা থাকে সমতা চেক বা এফ 1 এ রিডানডেন্সি। 5 লাইনের 14 টি নমুনা অনুভূমিক লাইনের প্রতি 2.8 নমুনার সমান এবং প্রতি সেকেন্ডে 15,750 লাইন রয়েছে, যা প্রতি সেকেন্ডে 44,100 নমুনা হিসাবে আসে।

এখন থেকে যেহেতু রঙিন টিভি চালু হয়েছিল, তাই তাদের সামান্য অনুভূমিক রেখার হারটি প্রতি সেকেন্ডে 15734 লাইন থেকে নামিয়ে আনতে হবে। এই সমন্বয়টি সনি এফ 1 এ প্রতি সেকেন্ডে 44,056 টি নমুনা নিয়ে যায়।

— রবার্ট ব্রিস্টো-জনসন
সূত্র

8

উদাহরণস্বরূপ http://www1.cs.columbia.edu/~hgs/audio/44.1.html দেখুন । অ্যান্টি-এলিয়াসিং ফিল্টারগুলির কারণে আপনার 40 কেএইচজেডের বেশি নমুনা হার ব্যবহার করা উচিত। ফিল্টারটির পুনঃস্থাপন opeালের কারণে সংকেত বিকৃতি রোধ করতে আপনার ফ্রিকোয়েন্সিতে কিছুটা রিজার্ভ থাকা উচিত। ১৯৯ 1979 সালে অডিও রেকর্ডিং মানটি যখন আলোচনার মধ্যে ছিল তখন সনি কর্পোরেশন দ্বারা ৪৪.১ কেএইচজেডের আসল মূল্য প্রস্তাব করা হয়েছিল They এই মুহুর্তের জন্য তারা এই হারটি ব্যাপকভাবে ব্যবহার করেছেন।

সুতরাং এটি সাধারণত historicalতিহাসিক কারণ।

— Serj
সূত্র

6

ডিজিটাল ফর্ম্যাটগুলিতে রূপান্তর করার সময় অডিওটি ছদ্ম-ভিডিও তরঙ্গরূপে সংরক্ষণ করা হয়েছিল যা কালো বা সাদা হিসাবে দেখা যেতে পারে (বাইনারি ফর্ম্যাট উপস্থাপন করে)।

টেলিভিশন স্ট্যান্ডার্ড দ্বারা ব্যবহৃত মাঠের হার এবং কাঠামোটি 60 হার্জেড ভিডিও হিসাবে নীচে রয়েছে: ক্ষেত্র প্রতি 245 লাইন (প্রথম 35 টি ফাঁকা লাইন বাদে)। প্রতি লাইনে তিনটি নমুনা যা 60 x 245 x 3 = 44100 = 44.1 KHz করে।

এই কনভেনশনটি পরে সিডি ফর্ম্যাটের জন্য ব্যবহৃত হয়েছিল, সরঞ্জামগুলির সামঞ্জস্যতার উদ্বেগের কারণে (সিডি প্রতিবেদনের জন্য ব্যবহৃত সিডি মাস্টার উত্পাদন করতে ব্যবহৃত প্রথম সরঞ্জামটি ছিল ভিডিও ভিত্তিক)।

উত্স: শব্দ প্রজননের আর্ট, পি। 228

— mhbuur
সূত্র

যদি এফ 1 এটি করে তবে আমাকে অবশ্যই "আমি সংশোধন করলাম" বলতে হবে। আমি ধরে নিয়েছি F1 ফাঁকা লাইন ব্যবহার করছে।

— রবার্ট ব্রিস্টো-জনসন 21

হাই, আমি কেবল এখানে পড়েছি যে "এনটিএসসি রঙিন এনকোডিংটি সিস্টেম এম টেলিভিশন সিগন্যালের সাথে ব্যবহৃত হয়, যা প্রতি সেকেন্ডে 30 / 1.001 (আনুমানিক 29.97) ইন্টারলেসড ফ্রেম সহ ভিডিও থাকে Each প্রতিটি ফ্রেম দুটি ক্ষেত্রের সমন্বয়ে গঠিত, প্রতিটি 262.5 টি সমন্বিত থাকে each স্ক্যান লাইনগুলি, মোট 525 স্ক্যান লাইনের জন্য 48 483 স্ক্যান লাইনগুলি দৃশ্যমান রাস্টার তৈরি করে।

এমনকি 490 লাইনগুলি কিছুতে (মূল এনটিএসসি) ফাঁকা লাইন ব্যবহার করে।

— রবার্ট ব্রিস্টো-জনসন

0

সাধারণত স্থির সাইনোসয়েডাল তরঙ্গের পরিবর্তে "গতিশীল" সময় রেজোলিউশন দৃষ্টিকোণ থেকে যদি বিবেচনা করা হয় তবে মানুষের জন্য হেইনিগ সীমা 20kHz এর চেয়ে অনেক বেশি হতে পারে। পুনর্নির্মাণ ফিল্টারিংয়ের জন্য 20kHz এবং 22 kHz এর মধ্যে মার্জিন সম্পর্কে আকর্ষণীয় মন্তব্য। প্রকৃতপক্ষে পিটার ক্র্যাভেনের কাছ থেকে টাইম-ডোমেন অপ্টিমাইজড ফিল্টারিংয়ের জন্য আকর্ষণীয় কাজ রয়েছে যা হাই-ফাই প্লেব্যাকের জন্য কমপক্ষে 96kHz এর পক্ষে যুক্তি দেয়।

Pawel

— Pawel
সূত্র

ঠিক আছে, খুঁজে বের করার একটি উপায় আছে। একে অন্ধ এবি টেস্টিং বলে । ডাবল-ব্লাইন্ড হওয়ার দরকার নেই (তবে সাধারণত হয়)। এবং আমার মতে ABX পরীক্ষার চেয়ে এবি টেস্টিং ভাল।

— রবার্ট ব্রিস্টো-জনসন 19'17

0

https://en.wikedia.org/wiki/44,100_Hz#Why_44.1_kHz.3F দ্য নাইকুইস্ট – শ্যানন নমুনা উপপাদ বলেছেন যে নমুনাটির ফ্রিকোয়েন্সি পুনরুত্পাদন করতে ইচ্ছুক সর্বাধিক ফ্রিকোয়েন্সি দ্বিগুণ হতে হবে। যেহেতু মানুষের শুনানির পরিমাণটি প্রায় 20 হার্জ থেকে 20,000 হার্জ হার্ট, তাই নমুনার হার 40 কেজি হার্জের চেয়ে বেশি হতে হয়েছিল।

তদ্ব্যতীত, এলিয়াসিং এড়ানোর জন্য সংকেতগুলি স্যাম্পলিংয়ের আগে লো-পাস ফিল্টার করা উচিত। যদিও একটি আদর্শ লো-পাস ফিল্টারটি পুরোপুরি 20 কিলাহার্জ হার্টের নীচে ফ্রিকোয়েন্সি (তাদের মনন না করে) কেটে দেয় এবং 20 KHz এর ওপরে ফ্রিকোয়েন্সি পুরোপুরি কেটে দেয়, যেমন একটি আদর্শ ফিল্টার তাত্ত্বিকভাবে অসম্ভব (এটি ননকসাল), সুতরাং অনুশীলনে একটি ট্রানজিশন ব্যান্ড প্রয়োজনীয়, যেখানে ফ্রিকোয়েন্সি আংশিকভাবে ক্ষীণ হয়। এই ট্রানজিশন ব্যান্ডটি আরও বিস্তৃত, একটি অ্যান্টি-এলিয়জিং ফিল্টার তৈরি করা সহজ এবং আরও অর্থনৈতিক। 44.1 kHz স্যাম্পলিং ফ্রিকোয়েন্সি 2.05 kHz রূপান্তর ব্যান্ডের জন্য অনুমতি দেয় allows

তদ্ব্যতীত, 44,100 হ'ল প্রথম চারটি মৌলিক সংখ্যার (2 ^ 2 * 3 ^ 2 * 5 ^ 2 * 7 ^ 2) এর স্কোয়ারের পণ্য এবং তাই এর মধ্যে অনেকগুলি ছোট ছোট কারণ রয়েছে।

— Zhong
সূত্র

সুতরাং আমরা যদি আমাদের ইউনিট সময়কে দ্বিতীয় থেকে "ফরগ" - তে পরিবর্তন করি যা 1.001 সেকেন্ড হয়, তবে এটি 44100 এবং এর অনেক দরকারী ছোট কারণগুলির সাথে কী করবে?

— রবার্ট ব্রিস্টো-জনসন

-2

বর্ণনার জন্য [ http://batmobile.blogs.ilrt.org/audio-analysis-on-an- আইফোন দেখুন । .এই উপপাদ্য Nyquist নমুনা উপপাদ্য বলা হয় যে গুণমানের উল্লেখযোগ্য ক্ষতি ছাড়াই X Hz এর সংকেত নমুনার জন্য, আপনার ফ্রিকোয়েন্সি 2X এ নমুনা করা উচিত। মানুষের শুনানির সীমাটি প্রায় 20KHz, যার জন্য প্রায় 40Khz নমুনা হার প্রয়োজন। এই কারণেই সিডিগুলি 44Khz এ নমুনা দেওয়া হয়। যেমন একটি সিডিতে রেকর্ডিংয়ের প্রতিটি সেকেন্ডে রেকর্ডিংয়ে থাকা সর্বোচ্চ সম্ভাব্য ফ্রিকোয়েন্সিটির 44,000 পরিমাপ থাকে।

— আকাশ মা
সূত্র

ঠিক আছে, আসলেই তা নয় ...

— জোজেক

এটি আংশিক কারণ। কোনও মানুষের পক্ষে এটি 20k এর উপরে শুনতে খুব বিরল, তাই অডিওফিলের পরিসরটি যথাযথভাবে 40kHz এর চেয়ে কিছুটা উপরে, অর্থাৎ 42, 43, 44 এর উপরে you আপনি যদি 22 কে বিশাল সাইন ওয়েভ দিয়ে কাউকে বিস্ফোরণ করেন, তবে কেবলমাত্র কোনও সন্তানেরই এটি শোনার সুযোগ রয়েছে। বাদুড় 115kHz এবং কিছু ডলফিনগুলি 150kHz এ রয়েছে, এটি পানিতে বাদে, যা পরিষ্কার শোনাচ্ছে। রেকর্ডিং সহ অনলাইনে আপনার উচ্চ ফ্রিকোয়েন্সি উপলব্ধি পরীক্ষা করুন ... উদাহরণস্বরূপ এখানে অডিওচেক.net

— অডিওটেষ্ট_ফ্রিকোয়েন্সি