ডিএফটি কীভাবে আপনাকে একটি চিত্র স্থানান্তর করতে দেয় তা বোঝার জন্য আপনার কয়েকটি কী অন্তর্দৃষ্টি রয়েছে।
প্রথম, ফুরিয়ার থিয়োরাম: প্রথমে ধারাবাহিক (অর্থাত্ অ্যানালগ) কেসটি দেখানো সম্ভবত সহজ। আপনার কোনও ফাংশন আছে তা কল্পনা করুন, এটিকে জি (টি) কল করুন। সরলতার জন্য, ধরা যাক যে জি (টি) হ'ল একটি অ্যানালগ অডিও রেকর্ডিং, সুতরাং এটি একটি এক-মাত্রিক ফাংশন, যা অবিচ্ছিন্ন এবং সময়ের কাজ হিসাবে তাত্ক্ষণিক চাপকে উপস্থাপন করে।
এখন, জি (টি) হ'ল একটি উপায় যা আমরা আমাদের অডিও রেকর্ডিং উপস্থাপন করতে পারি। আর একটি হ'ল জি (চ)। জি (চ) হ'ল জি (টি) এর ফুরিয়ার রূপান্তর। সুতরাং, জি (চ) == এফটি (জি (টি))। জি (চ) এর সকল তথ্য জি (টি) এর মতো রয়েছে তবে এটি সময় ডোমেনের পরিবর্তে ফ্রিকোয়েন্সি ডোমেনে সেই তথ্য উপস্থাপন করে। ফুরিয়ার ট্রান্সফর্ম সম্পর্কে কিছু নিট-পিক বিশদ রয়েছে, যা আমি উল্লেখ করব না।
আপনি জি (চ) কে জি (টি) এর মধ্যে থাকা "ফ্রিকোয়েন্সিগুলির বিতরণ" হিসাবে ভাবাতে পারেন। সুতরাং, যদি জি (টি) একটি সাইন ওয়েভ (অর্থাত্ একটি খাঁটি স্বর) হয়, তবে জি (চ) সেই স্বরের ফ্রিকোয়েন্সি বাদে সর্বত্র শূন্য হবে। এটি সম্ভবত উল্লেখ করার জন্য একটি ভাল পয়েন্ট যা জি (চ) সাধারণভাবে একটি জটিল ক্রিয়াকলাপ - এটি বলতে বোঝায় যে এটি জটিল সংখ্যার প্রত্যাবর্তন করে, যা একটি বাস্তব এবং কাল্পনিক উপাদান বা একটি মাত্রা এবং পর্যায় থাকার কথা ভাবা যেতে পারে।
এখানে একটি ছোট ডিগ্রেশন: যেহেতু g (টি) অবিচ্ছিন্ন (ডোমেন এবং ব্যাপ্তি উভয়ই), তাই G (f )ও অবিচ্ছিন্ন। সুতরাং, জি (চ) কীভাবে টোন ফ্রিকোয়েন্সি বাদে সর্বত্র শূন্য হতে পারে? ভাল, এফটি (পাপ (ডাব্লুটি)) = । যেখানে হ'ল ডাইরাক ডেল্টা ফাংশন ।δ(w)δ
ঠিক আছে, তাই এখন আমরা আমাদের বেল্টের অধীনে অবিচ্ছিন্ন এফটি পেয়েছি।
এখানে দ্বিতীয় অন্তর্দৃষ্টি: একটি নমুনা সংকেত একটি এনালগ সংকেত হিসাবে একটি ডিস্ক্রিট ফুরিয়ার ট্রান্সফর্ম একটি ফুরিয়ার ট্রান্সফর্ম হিসাবে হয়। এই ক্ষেত্রে, "বিচ্ছিন্ন" ফাংশনের ডোমেনের পরিমাণ (সময় বা ফ্রিকোয়েন্সি) বোঝায়, এটির সীমা নয়। (আপনার সাউন্ড কার্ড থেকে প্রাপ্ত নমুনা ডিজিটাল সিগন্যালটি ডোমেন এবং ব্যাপ্তি উভয় ক্ষেত্রেই কোয়ান্টাইটিসড))
আপনার সাউন্ড কার্ড থেকে আপনি যে ডিজিটাল বাইট-স্ট্রিমটি পান সেটিতে মাইক্রোফোন থেকে মূল অবিচ্ছিন্ন (অ্যানালগ) সংকেতের "নমুনা" থাকে। আমরা যদি আমাদের নমুনাযুক্ত জি (টি) এর ডিএফটি নিই, তবে আমরা একটি জি (চ) পাই। জি (চ), মনে রাখবেন, জি (টি) এর মধ্যে থাকা তথ্যের প্রতিনিধিত্ব করার এক অন্যরকম উপায়। যদি আমরা নাইকুইস্টের তত্ত্বটি মানি , স্যাম্পলড সিগন্যাল জি (টি) মূল অবিচ্ছিন্ন সংকেতের সমস্ত "বুদ্ধি" ধারণ করে, তাই আমাদের বিচ্ছিন্ন জি (চ) অবশ্যই আমাদের মূল অবিচ্ছিন্ন সংকেত থেকে সমস্ত তথ্য থাকতে পারে। জন্মগতভাবে, জি (চ) এখনও একটি জটিল কাজ।
এখানেই সাব-পিক্সেল শিফটিংয়ের ম্যাজিকটি আসে তবে এই ক্ষেত্রে আমি একই সাথে অডিও সিগন্যালটিকে একটি নমুনার চেয়ে কম সময়ে স্থানান্তরিত করতে লিখব, কারণ এটি একই জিনিস।
জি (এফ) কীভাবে একটি জটিল কাজ? টি = 0 তে শূন্য নয় এমন ফ্রিকোয়েন্সিগুলি উপস্থাপনের জন্য এটি জটিল হওয়া দরকার। মনে রাখবেন, পাপ (0) = 0, সুতরাং পাপ (2 * 0) = 0 ইত্যাদি ইত্যাদি তবে আমরা যদি সুরের একটি চক্রের মাধ্যমে চতুর্থাংশের রেকর্ডিং শুরু করি? এখান থেকে জি (চ) এর পর্ব অংশটি এসেছে। এই ক্ষেত্রে, চক্রের চতুর্থাংশের প্রতিনিধিত্ব করার জন্য আপনার পছন্দের উপর নির্ভর করে পর্বটি 90 ডিগ্রি বা পাই / 2 রেডিয়ান হবে ians জি (tone_frequency) অতএব = 0 + I বা।eiπ2
এর অর্থ হ'ল জি (টি) এর পর্যায়ে পরিবর্তন করে আমরা আমাদের অডিও রেকর্ডিংকে সময়ের সাথে ( কোনও নমুনা সময়ের একটি ভগ্নাংশ সহ আমরা যে কোনও পরিমাণ হিসাবে চয়ন করি) দ্বারা স্থানান্তরিত করতে পারি। আসলে, উক্তিটি সম্ভবত কিছুটা নৈমিত্তিক। অ-কোয়ান্টাইজাইজড, নমুনাযুক্ত সংকেতের জন্য পর্বটি নির্বিচারে সামঞ্জস্য করা যেতে পারে (এটি ডোমেনের পরিমাণ এবং পরিসীমা আগেভাগের মধ্যে পার্থক্য করার কারণের একটি অংশ)। তবে, কোয়ান্টাইটিসড স্যাম্পলড সিগন্যালের জন্য (আমাদের অডিওর বাইট-স্ট্রিম, উদাহরণস্বরূপ) কোয়ান্টাইজেশন স্টেপ সাইজ (অর্থাত্ বিটের সংখ্যা) রেজোলিউশনটি নির্ধারণ করে যা আমরা ফেজটি সামঞ্জস্য করতে পারি। যখন আমরা উল্টে ফুরিয়ার ট্রান্সফর্ম জি (এফ) (বা এটি স্যাম্পলড সিগন্যালের জন্য), 'জি' (টি) = ডিআইএফটি (জি (এফ)) এর স্যাম্পেলের নতুন সেটগুলি আমরা যে পরিমাণ বাছাই করে তা সময়মতো স্থানান্তরিত হবে।
এটি আপনার পিক্সেলগুলিতে প্রয়োগ করার অর্থ এখানে আলোচিত 1-মাত্রিক এফটির পরিবর্তে 2-মাত্রিক এফটি ব্যবহার করা।