লিনিয়ার প্রেডিকটিভ কোডিং (এলপিসি) এর পিছনে তত্ত্ব

এলপিসির পিছনে তত্ত্বটি কী?
এলপিসির নির্দিষ্ট প্রয়োগগুলি কেন অন্য সংকুচিত ভয়েস এনকোডিং প্রকল্পগুলির তুলনায় সংক্রমণ বা এনকোডিং ~~ত্রুটির~~ পরিমাণকে আরও সহনীয় বলে বলা হয়েছিল ?
এলপিসি পদ্ধতিগুলি কি মসৃণ বা স্বল্পমেয়াদী "ভবিষ্যদ্বাণী" কালামান ফিল্টার পদ্ধতির ব্যবহারের মতো ব্যবহার করা যেতে পারে?
এলপিসি ব্যবহারের ক্ষেত্রে কোন পরিস্থিতিতে বা প্রতিবন্ধকতা বৈধ?

— hotpaw2
সূত্র

"কেন (অন্য) সংকুচিত ভয়েস এনকোডিং প্রকল্পগুলির চেয়ে এলপিসি সংক্রমণ বা এনকোডিং ত্রুটিগুলিকে বেশি সহনশীল বলা হয়েছিল?" কে বলেছে? আমি এলপিসি খুব ভাল জানি না, তবে আমি ভেবেছিলাম এটি রিডানডেন্সি হ্রাস করার সাথে করা উচিত, যা এর বিপরীত প্রভাব ফেলবে।

— এন্ডোলিথ

এটি মিথ্যা ভিত্তিতে হওয়ায় এই প্রশ্নটি বিভ্রান্তিকর । দয়া করে এটি বন্ধ করুন এবং সংশোধন করুন।

— দীপন মেহতা

এখানে একাধিক প্রশ্ন এবং প্রাঙ্গণ রয়েছে। কোনটি (গুলি) আপনার মেরামত করা দরকার বলে মনে করেন?

— হটপাউ 2

বিবৃতি

Why are(were) certain implementations of LPC said to be more tolerant of transmission or encoding errors quantization than other compressed voice encoding schemes?

বরং মিথ্যা। আপনি কি এমন কোনও রেফারেন্স উদ্ধৃত করতে পারেন যা বিশেষত অন্যের চেয়ে ভাল কি বলে?

— দিপান মেহতা

আসলে এটি আমার প্রশ্ন। আমি এটি কোথাও শুনেছি, তবে কেন এটি বলা হয়েছে তা জানি না।

— হটপাউ 2

প্রথমত, লিনিয়ার প্রেডিকটিভ কোডিং (এলপিসি) বলতে "সংক্রমণ বা এনকোডিংয়ের ত্রুটিগুলি আরও সহনশীল" সম্পূর্ণ সত্য নয়। সহগগুলি যে ফর্মটিতে সংক্রমণিত হয় তা একটি বড় পার্থক্য করে। উদাহরণস্বরূপ, যদি লিনিয়ার পূর্বাভাস সহগের জন্য সমাধান করা হয় তবে তারা কোয়ান্টাইজেশনের ক্ষেত্রে খুব সংবেদনশীল হতে পারে, অনেকটা হাই অর্ডার আইআইআর ফিল্টার সহগের মতো (এটি কারণ সংশ্লেষণ ফিল্টারটি আইআইআর হবে তবে এর পরে আরও)। তবে এগুলি যদি অন্য কোনও রূপে সংক্রমণ করা হয় তবে সহজেই এই সমস্যাটি হ্রাস করা যায়।

একটি উপায় হ'ল প্রতিচ্ছবি সহগগুলি স্থানান্তর করা। আপনি যদি কে-থ্রি অর্ডার লিনিয়ার পূর্বাভাস ফিল্টারটির জন্য পুনরাবৃত্তভাবে সমাধান করেন তবে প্রতিটি পর্যায়ে সর্বাধিক অর্ডার সহগকে প্রতিফলন সহগ বলা হয়। সিস্টেমগুলি সম্পূর্ণরূপে বৈশিষ্ট্যযুক্ত করার জন্য এগুলি একসাথে ব্যবহার করা যেতে পারে (যা সহজেই লেবিনসন পুনরাবৃত্তি থেকে দেখা যায়)। প্রকৃতপক্ষে, আপনি লটিস ফিল্টার তৈরি করতে এগুলি সমস্ত একসাথে ব্যবহার করতে পারেন। এই ফিল্টারগুলি প্রায়শই যখন কোয়ান্টাইজেশন একটি উদ্বেগ হিসাবে ব্যবহৃত হয় তখন সেগুলি লো বিট গুনের চেয়ে অনেক বেশি শক্তিশালী। তদতিরিক্ত, যদি এই প্রতিবিম্ব সহগগুলির পরিমাণটি unityক্যের দ্বারা আবদ্ধ থাকে তবে আপনি একটি বিআইবিও স্থিতিশীল ফিল্টারের গ্যারান্টিযুক্ত যা এলপিসির জন্য সমালোচনামূলক যেখানে ফিল্টারটি আপনার সংকেত সংশ্লেষিত করতে ব্যবহৃত হয়। লাইন বর্ণালী জুটির মতো অন্যান্য পদ্ধতি রয়েছে যা প্রায়শই ব্যবহৃত হয়, তবে তারা '

এখন, প্রথম প্রশ্নের সমাধানের জন্য, এলপিসির তত্ত্বটি ভোকাল ট্র্যাক্ট মডেলিংয়ের চারদিকে ঘোরে। মূলত, আমরা কিছু কাঠামোর একটি নলকে একটি ইনপুট হিসাবে বায়ু স্পন্দিত হিসাবে বক্তৃতাকে মডেলিং করছি। আপনি এমন কিছু সংস্থান সন্ধান করতে পারেন যা এই মডেলটির মাংস (টিউবের দৈর্ঘ্য, বায়ুর তীব্রতা, কাঠামো ইত্যাদি) সম্পর্কে আরও বিস্তারিতভাবে চলে। এই সংস্থানগুলি এই কাঠামোগুলি সরাসরি আইআইআর ফিল্টারগুলির সাথে সম্পর্কিত করে বিভিন্ন উদ্দীপনা, সাদা গোলমালের উদাহরণ হিসাবে।

সুতরাং যখন আমরা লিনিয়ার পূর্বাভাস সহগের জন্য সমাধান করি, আমরা সহগগুলি যেমন সন্ধান করি যে আমরা যদি আমাদের সংকেত (উদাহরণস্বরূপ ভয়েস) সহগগুলি থেকে তৈরি একটি এফআইআর ফিল্টারে ইনপুট করি তবে আমরা আউটপুট হিসাবে সাদা গোলমাল পাই। সুতরাং এর অর্থ কী তা নিয়ে ভাবুন। আমরা একটি উচ্চ ইনপুট করছিপারস্পরিক সম্পর্কযুক্ত সংকেত এবং একটি সাদা শব্দের ক্রম আউটপুট। সুতরাং কার্যকরভাবে, আমরা সেই সংকেতের সমস্ত লিনিয়ার নির্ভরতা অপসারণ করছি। এটি দেখার আরেকটি উপায় হ'ল অর্থবহুল তথ্যগুলির মধ্যে সমস্তটি সহগের মধ্যে রয়েছে যা এই রৈখিক নির্ভরতা অপসারণ করে। অতএব, আমরা এই সহগ (বা উপরের হিসাবে তাদের কিছু ফর্ম) স্থানান্তর করতে পারি, এবং প্রাপ্তি শেষটি সংকেতটি পুনরায় তৈরি করতে পারে। এটি একটি আইআইআর ফিল্টার তৈরি করতে লিনিয়ার ভবিষ্যদ্বাণীমূলক এফআইআর ফিল্টারকে উল্টিয়ে দিয়ে এবং সাদা গোলমাল ইনপুট করে করা হয়। সুতরাং এই লিনিয়ার নির্ভরতা অপসারণ, এবং সহগের স্থানান্তরকরণ থেকে সংকোচনের সূচনা ঘটে। এই কারণেই বার্গ পদ্ধতিটিকে কখনও কখনও সর্বাধিক এনট্রপি পদ্ধতি হিসাবেও উল্লেখ করা হয়, কারণ এটি রৈখিক ভবিষ্যদ্বাণী ফিল্টারটিতে আউটপুট আওয়াজের সর্বাধিকতরতা "র্যান্ডমনেস" বা হোয়াইটনেসকে লক্ষ্য করে। এটি দেখার আরেকটি উপায়,

আপনার চূড়ান্ত প্রশ্নের উত্তর দিতে, আপনি নিশ্চিতভাবে কী জিজ্ঞাসা করছেন তা আমি নিশ্চিত নই। এলপিসি, বা লিনিয়ার ভবিষ্যদ্বাণীমূলক কোডিং এর অর্থ সিগন্যালটিকে "সংকুচিত" করে ধরেই নেওয়া হয় যে এটি পূর্বে আলোচিত হিসাবে দক্ষতার সাথে মডেল করা যায়। আপনি যেমন উল্লেখ করেছেন তেমনই "শর্টার্মের পূর্বাভাস" করতে আপনি অবশ্যই লিনিয়ার পূর্বাভাস ব্যবহার করতে পারেন। পাওয়ার বর্ণালী ঘনত্ব অনুমানের জন্য ব্যবহৃত উচ্চ রেজোলিউশন এআর পদ্ধতিগুলির পিছনে এটি অন্তর্নিহিত ভিত্তি। অটোকোররিলেশন ক্রমটি অবিচলিত অনুক্রমের তাত্ত্বিক স্বতঃসংশোধনের ক্রম হিসাবে সীমিত তথ্য রেকর্ড থেকে অনন্তে সীমাবদ্ধ রূপ থেকে পুনরাবৃত্তভাবে বাড়ানো যেতে পারে। এ কারণেই পিএসডি অনুমানের এআর পদ্ধতিগুলি সিডেলোব ঘটনাটি প্রদর্শন করে না।

— ব্রায়ান
সূত্র

"এলপিসির তত্ত্বটি ভোকাল ট্র্যাক্ট মডেলিংয়ের চারদিকে ঘোরে" এটি কি সর্বদা সত্য? এফএলসি কেবল ভয়েস নয়, জেনেরিক অডিও ওয়েভফর্মগুলিতে এলপিসি ব্যবহার করে।

— এন্ডোলিথ

আমার ক্ষমাপ্রার্থী, আমি প্রথমে ভোকাল দুলগুলির উপমা দিয়ে এটি শিখলাম একটি শারীরিক মডেল যা সেখান থেকে এসেছে। যেমনটি আমি বলেছি, এমন জায়গাগুলি রয়েছে যেখানে তারা এটিকে আরও গভীরভাবে অনুধাবন করে। তবে আপনি সঠিক, এলপিসি জেনেরিক অডিও ওয়েভফর্মের জন্য উপযুক্ত। যেমনটি আমি উল্লেখ করেছি, এটি কোনও আবেগপূর্ণ বর্ণালীতে ভাল কাজ করে। একটি ছদ্মবেশ হিসাবে, এটি কোলাহলপূর্ণ সংকেতগুলিতে খারাপভাবে কাজ করে যেখানে বর্ণালী কম আবেগপ্রবণ হয় (এটি কারণ শোরগোলের সংকেতগুলি এআরএমএ প্রক্রিয়া হিসাবে আরও ভাল মডেল করা হয়)।

— ব্রায়ান