অডিও সিগন্যাল প্রসেসিং প্রাথমিকের জন্য রোডম্যাপ শেখা

13

আমি অডিও সিগন্যাল প্রক্রিয়াজাতকরণ শিখতে চাই। অনলাইনে প্রচুর বই এবং একাডেমিক কাগজপত্র রয়েছে যা সমস্তই বিষয়টির মূলসূত্রগুলি এড়িয়ে চলেছে বলে মনে হয়।

অডিও সিগন্যাল প্রসেসিং সফলভাবে শেখার জন্য আমি অনুসরণ করতে একটি মোটামুটি রোডম্যাপ জানতে চাই so

আমি পড়েছি যে সিগন্যাল বিশ্লেষণ শুরু করার আগে ক্যালকুলাসই প্রথম পদক্ষেপ।

এটি আমার কাছে মনে হয় অডিও সিগন্যাল বিশ্লেষণের সামগ্রিক জ্ঞানের শুধুমাত্র একটি অংশ। যেখানে অন্যান্য বিষয়গুলি সঙ্গীত তত্ত্ব, অডিও ইঞ্জিনিয়ারিং এবং প্রোগ্রামিং।

যদি আমি এই অঞ্চলে জ্ঞানসম্পন্ন লোকদের অডিও সংকেত বিশ্লেষণ ও কৌশল কীভাবে তৈরি / তৈরি করতে হয় তা বোঝার পক্ষে সম্ভাব্য পদক্ষেপগুলির পরামর্শ দিতে বলতে পারি।

audio

— jarryd
সূত্র

আমি সম্মত হব যে ক্যালকুলাসের একটি পটভূমি (সর্বনিম্ন) আপনার পক্ষে সিগন্যাল এবং সিস্টেম তত্ত্বের পাঠ্য বা কোর্সে যে গণিতের মুখোমুখি হতে পারে তা বোঝার সুযোগ পাওয়ার পক্ষে গুরুত্বপূর্ণ হতে চলেছে। আমি নিশ্চিত করব যে আপনি প্রথমে সেখানে স্নিগ্ধ করতে চলেছেন।

— জেসন আর

1

এই স্লাইডগুলি সাহায্য করতে পারে। অডিও প্রক্রিয়াকরণ এবং অডিও প্রোগ্রামিংয়ের অ-গাণিতিক / ইঞ্জিনিয়ারিং বেসিকগুলির কয়েকটি যদিও তারা পেয়েছে। blog.bjornroche.com/2011/11/…

— বজর্ন রোচে

17

আমি অধ্যাপক জুলিয়াস ও। স্মিথ III এর শারীরিক অডিও সিগন্যাল প্রসেসিং এ একবার দেখার পরামর্শ দিই । এটি অনলাইনে উপলব্ধ, বা অ্যামাজনের প্রিন্ট-অন-ডিমান্ড পরিষেবাদির মাধ্যমে কেনা যাবে।

বিশেষত, বুক সিরিজ ওভারভিউয়ের বিবরণটি উপযুক্ত হতে পারে।

এখানে চিত্র বর্ণনা লিখুন

— পিটার কে
সূত্র

9

আমি মনে করি না ডিএফটি / এফএফটি / আইআইআর / এফআইআর এবং তরঙ্গপত্রগুলির জটিলতায় কোনও বিন্দু ডাইভিং রয়েছে যা প্রথমে না বুঝে অডিওটি মূলত কী এবং অডিও ডিজিটালি উপস্থাপনের বিভিন্ন উপায়গুলি কী।

সাধারণভাবে অডিও কী (বায়ুতে, জল বা অন্যান্য উপকরণ নয়):

অডিও শব্দ চাপ তরঙ্গ সমন্বিত
এগুলি বাতাসের সংকোচন এবং বিরলতা সৃষ্টি করে
উত্সের দিক থেকে এই তরঙ্গগুলি বাইরের দিকে প্রচার করে
তরঙ্গগুলি একে অপরের সাথে হস্তক্ষেপ করতে পারে যার ফলে শিখর এবং কূপ
তরঙ্গগুলি উপাদান দ্বারা শোষণ এবং প্রতিবিম্বিত হতে পারে

কীভাবে অডিও বৈদ্যুতিনভাবে উপস্থাপিত হয়:

একটি মাইক্রোফোন এবং প্রাক-পরিবর্ধক শব্দ চাপ তরঙ্গগুলিকে বৈদ্যুতিক সংকেতে রূপান্তর করে
সাধারণত এই সংকেতটিতে ইতিবাচক এবং নেতিবাচক ভোল্টেজ থাকে (এসি ভোল্টেজের মতো)
চৌম্বকীয় টেপগুলি এই পার্থক্যগুলি উপস্থিত হওয়ার সাথে সাথে সংরক্ষণ করে, সুতরাং শব্দটি অ্যানালগ করে
যখন ইনপুট সিগন্যালের শক্তি সিস্টেমের সীমা সমান হয় তখন তৃপ্তি ঘটে (ভোল্টেজের আরও কোনও বৃদ্ধি সঠিকভাবে উপস্থাপন করা যায় না)
ক্লিপিং ঘটে যখন ইনপুট সিগন্যালটি সিস্টেমের দ্বারা উপস্থাপিত হওয়ার চেয়ে বেশি হয়, তাই সংকেতটি ক্লিপড হয়ে যায় (বা প্রান্তে আবদ্ধ)

অডিও কীভাবে ডিজিটাল উপস্থাপন করা হয়:

অডিওকে প্রথমে একটি এডিসি (ডিজিটাল কনভার্টারের সাথে অ্যানালগ) ব্যবহার করে নমুনা তৈরি করতে হবে
স্যাম্পলিংয়ে পর্যায়ক্রমে একটি অডিও সিগন্যাল বৈদ্যুতিনভাবে পরিমাপ করে
এই পিরিয়ডটিকে নমুনা হার বলা হয় এবং এটি সর্বোচ্চ ফ্রিকোয়েন্সি নির্ধারণ করে যা প্রতিনিধিত্ব করতে পারে (nyquist সীমা)
এনকুইস্ট সীমাটি হ'ল নমুনা হার / ২ (সীমাটি যত কাছাকাছি আসে, তত বেশি খারাপভাবে প্রতিনিধিত্ব করা সংকেত হয়)
বিটরেঞ্জ শব্দের তলটি নির্ধারণ করে, (-96 ডিবি 16 বিটের জন্য -8 বিটের জন্য 48 ডিবি)
অডিওর একক 16 বিটের নমুনা -32768 থেকে 32767 এর মধ্যে একটি (স্বাক্ষরিত) মান হতে পারে (এটি এনালগ সংকেতের নেতিবাচক এবং ইতিবাচক সুইং উভয়েরই প্রতিনিধিত্ব করতে পারে)
প্রতি বাইটে মাত্র 8 টি বিট অনুমোদিত (কম্পিউটার স্টোরেজের ক্ষেত্রে) সুতরাং একটি 16 বিট নমুনা কমপক্ষে 2 বাইট দ্বারা প্রতিনিধিত্ব করতে হবে
এই বাইটগুলি যে ক্রমে সংরক্ষণ করা হয় সেগুলি তাদের এন্ডিয়ান ধরণ (বড় বা ছোট) হিসাবে উল্লেখ করা হয়
স্টেরিও নমুনাগুলির জন্য প্রতিটি চ্যানেলের জন্য পৃথক নমুনা প্রয়োজন, একটি বাম দিকে এবং অন্যটি ডানের জন্য

ডিজিটাল অডিও সঞ্চয় করতে কী কী উপায়ে ব্যবহার করা হয়:

পিসিএম (নাড়ি কোড মড্যুলেটেড) হ'ল ডিজিটালিভাবে অডিও সংরক্ষণের সবচেয়ে সাধারণ উপায় omp
ব্যবহৃত সংখ্যার পরিমাণ হ্রাস করার জন্য অনেকগুলি সংক্ষেপণ বিদ্যমান, কিছু ক্ষতিহীন, কিছু ক্ষয়ক্ষতিযুক্ত
ডাব্লুএইভি ফাইলগুলি সঙ্কুচিত এবং মনো বা স্টেরিও হতে পারে (আন্তঃবিস্তারিত নমুনা)
এমপিথ্রি ফাইলগুলি সংকুচিত, ক্ষতিকারক এবং খুব উচ্চ ডেটা সংকোচনের হার অর্জনের জন্য সাইকো-কৌস্টিক নিয়োগ করে
এমনকি সর্বনিম্ন বিট পরিসীমা (1 বিট) তাদের ব্যবহারের উপর নির্ভর করে দরকারী হতে পারে, সাধারণত উপহার কার্ড যা অডিও খেলায় যা 1 বিট হিসাবে সঞ্চিত থাকে

কীভাবে ডিজিটাল রাজ্যে অডিওর সাথে আরও বেশি পরিচিত হন:

কর এবং আরও কর! অডাসেসির মতো একটি প্রোগ্রাম ডাউনলোড করুন এবং বিভিন্ন নমুনা হার এবং বিট রেঞ্জ ব্যবহার করে বিভিন্ন অডিও ফাইল তৈরি করুন
সাইন / ত্রিভুজাকার / বর্গক্ষেত্র এবং করতল টোন তৈরি করুন এবং পার্থক্য শুনতে
8 বিট 10KHz ফাইল এবং 16 বিট 44.1KHz ফাইলের (সিডি মানের) মতো ধরণের পার্থক্য শুনতে শিখুন
উচ্চ-পাস / লো-পাস / ব্যান্ড-পাস ফিল্টারগুলির পরীক্ষা এবং পার্থক্য শুনতে hear
ক্লিপিং কীভাবে অডিও সংকেতকে প্রভাবিত করে তা বুঝতে তাদের স্যাচুরেশনের সীমা ছাড়িয়ে সিগন্যাল পুশ করুন
আপনার সফ্টওয়্যারটির এই ক্ষমতা থাকলে সিগন্যালে খামগুলি প্রয়োগ করুন
ইনহারমনিক এবং সুরেলা বিকৃতির মধ্যে পার্থক্য রয়েছে, উভয়ের সাথে পরীক্ষা করা
এগুলি এবং অন্যান্য সংকেতগুলির সাথে পরিচিত হওয়ার জন্য একটি বর্ণালী (এফএফটি) ব্যবহার করুন
পার্থক্যগুলি দেখতে লিনিয়ার এবং লোগারিদমিক প্লট উভয়ই ব্যবহার করুন
ডাউনসাম্পল এবং আপসামাল সংকেতগুলি শুনুন এবং শুনুন কীভাবে এটি অডিওকে প্রভাবিত করে
বিভক্তকরণের বিভিন্ন পদ্ধতি ব্যবহার করুন (বিট রেঞ্জকে রূপান্তর করার সময়) এবং পার্থক্যগুলি শুনুন

এটি আশাবাদী যে কোনও ডিজিটাল উপস্থাপিত অডিও কী এবং কোনও ডিএসপি চেষ্টা করার আগে পার্থক্যগুলি কী বলে তা বোঝায়। আপনার এফএফটি বিশ্লেষণে কিছু ভুল আছে তা জানার জন্য এটি সর্বদা সহজ you

— ronnied
সূত্র

উত্তরের জন্য ধন্যবাদ. যদিও আমি এই বিষয়গুলি সম্পর্কে সচেতন এবং এখনই এটির ডিএসপি কোডিংয়ের পাশে যেতে চাই।

— জারি করা হয়েছে