ডিএফটি ব্যবহার করে উপ-পিক্সেল চিত্রটি কীভাবে কাজ করবে?


12

আমি একটি অ্যাপ্লিকেশনের জন্য সাবপিক্সেল-স্থানান্তরিত চিত্র উত্পন্ন করার জন্য একাধিক চিত্র আন্তঃবিবাহ পদ্ধতির মানের মূল্যায়ন করার চেষ্টা করছি। আমি ভেবেছিলাম যে এই সমস্ত ইন্টারপোলেশন বৈকল্পিকগুলি ব্যবহার করে আমি একটি উপ-পিক্সেল শিফটের ফলাফলগুলি কিছু নিখুঁতভাবে স্থানান্তরিত চিত্রের সাথে তুলনা করতে পারি, তবে সম্ভবত এটি পাওয়া সম্ভব নয় (তখন অন্তরঙ্গকরণের কী দরকার হবে?)।

আমি ফ্রিকোয়েন্সি ডোমেনে ডিএফটি + শিফটিং ব্যবহার করার বিষয়ে ভাবছিলাম এবং আমি স্পষ্টভাবে চিত্রটি ইন্টারপোলেটিংয়ের তুলনায় এটি কীভাবে কাজ করে তা সম্পর্কে নিশ্চিত নই (বিলাইনার, বিউকিউবিক, ইত্যাদি ...)। আমি নিশ্চিত এটি সম্ভবত পুরোপুরি স্থানান্তরিত চিত্র তৈরি করতে পারে না তবে আমি এটিতে আঙুল রাখতে পারি না। ডিএফটি দিয়ে সাবপিক্সেল স্থানান্তর কি ইন্টারপোলেশন প্রয়োগের সমতুল্য এবং যদি তাই হয় তবে কোনটি? এই পদ্ধতিটি ব্যবহার করে প্রাপ্ত চিত্রগুলিতে পিক্সেলের মানগুলির পক্ষপাত কী? ধন্যবাদ!

সম্পাদনা: বিষয়টি বিবেচনা করার পরে, আমি অনুভব করেছি যেহেতু এফএফটি হরমোনিক্স (সাইন ফাংশন) এর ক্ষেত্রে মূল ফাংশনের একটি অনুমান (আরও বেশি ডিএফটি), এটি কোনও ধরণের ত্রিকোণমিতিক অন্তরঙ্গকরণের পরিমাণ হবে। আমি পৃথক ডেটার জন্য একটি "ফুরিয়ার সিরিজ ইন্টারপোলেশন" সূত্রটি স্মরণ করি যা ত্রিকোণমিতিক অন্তরঙ্গ ছিল, তবে নিশ্চিত না যে এটি সংযুক্ত কিনা।


ফাস্ট ফুরিয়ার ট্রান্সফর্ম (এফএফটি) পৃথক ফুরিয়ার ট্রান্সফর্মের জন্য একটি অ্যালগরিদম। ডিএফটি হরমোনিকসের দিক থেকে মূল ফাংশনের একটি অনুমান নয়, বরং জটিল সূচকীয় অরথোগোনাল ভিত্তিতে সিগন্যালের প্রক্ষেপণ।
ব্রায়ান

ঠিক আছে, তবে সিগন্যালটি নিজেই কিছু তীব্রতা বিতরণের একটি নমুনাযুক্ত এবং কোয়ান্টাইটিসড অনুমান এবং ডিফটিটি তাত্ত্বিক বিতরণের তুলনায় সুরেলা বিষয়বস্তুর ক্ষেত্রে সীমাবদ্ধ। আপনি আইডিএফটি থেকে সঠিক সংকেত ফিরে পেতে পারেন তবে আইডিএফটি করার আগে আপনি যদি স্টাফ (শিফটিংয়ের মতো) করেন তবে কিছুটা পক্ষপাত হবে। নাকি আমি কিছু মিস করছি?
neuviemeporte

ডিএফটি প্রকৃতপক্ষে বিচ্ছিন্ন ইনপুট গ্রহণ করে তবে পরিমাণযুক্ত ইনপুটগুলির মধ্যে সীমাবদ্ধ নয়। সিগন্যালটি কী তা বিবেচ্য নয়। আপনি যেমন উল্লেখ করেছেন, আপনি সঠিক সংকেত ফিরে পেতে পারেন। তবে, "শিফটিং" বলতে আপনার অর্থ কী তা আমি নিশ্চিত নই। ফ্রিকোয়েন্সি ডোমেনে স্থানান্তরিত করার বৈশিষ্ট্যগুলি সুপরিচিত (সময়ের ডোমেনে জটিল ফ্রিকোয়েন্সি অনুবাদ)। আপনার ইচ্ছাটি যদি "সময়" ডোমেইনে স্থানান্তরিত হয় তবে তার চেয়ে বেশি আপনাকে ডিএফটি দ্বৈত সম্পর্কে ভাবতে হবে।
ব্রায়ান

1
আমি বোঝাতে চাইছি যে আমি যদি সিগন্যালের ডিএফটি-তে কিছু অপারেশন করি (যেমন আমার ক্ষেত্রে - ফুরিয়ার শিফট তত্ত্বটি ব্যবহার করে "পিক্সেল ডোমেনে" একটি চিত্রের সাবপিক্সেল শিফট), যে আইডিএফটি @ হটপাও 2 এর ব্যাখ্যা অনুসারে ইন্টারপোল্টেড ফলাফলগুলি ফিরিয়ে দেবে উত্তর. এই বিভাজনটি অসম্পূর্ণ কারণ সিগন্যালটি ব্যান্ডলিমিটেড নয় এবং ডিএফটি নিজেই কোয়ান্টাইজড (0-255) নমুনার একটি সীমাবদ্ধ সেট থেকে গণনা করা হয়েছিল।
neuviemeporte

উত্তর:


4

একটি ডিএফটি / এফএফটি, অতিরিক্ত ফ্রিকোয়েন্সি ডোমেনে শূন্য-প্যাডিং যুক্ত করে, তারপরে একটি দীর্ঘ আইডিএফটি / আইএফএফটি, ইন্টারপোলটেড পয়েন্টগুলি প্রদান করে। এই পয়েন্টগুলি পর্যায়ক্রমিক সিনক কার্নেলটি ব্যবহার করে সংহত করা হবে, যা মূল তথ্যগুলির জন্য একটি নিখুঁত প্রবৃত্তি যা মূল নমুনা হারের অর্ধেকের নীচে কঠোরভাবে ব্যান্ড-সীমাবদ্ধ। যাইহোক, তথ্যটি বৃত্তাকারভাবে মোড়ানো ছিল এমনভাবে কাজ করা হবে যা কিছু চিত্রের প্রান্তে বিজোড় ফলাফল আনতে পারে। সুতরাং আপনি সংক্ষিপ্তকরণের আগে মূল উত্সের প্রান্তগুলিকে কোনও ভাল ফিলার বা ফ্রেমিং রঙ দিয়ে প্যাড করতে চাইতে পারেন।

যদি আপনি 2X (আইএফএফটির আগে দৈর্ঘ্য দ্বিগুণ করার জন্য এফএফটি জিরো-প্যাড) উপস্থাপনা করেন তবে আপনি বিরতিযুক্ত পয়েন্টগুলি ব্যবহার করে অর্ধ-পিক্সেল শিফট করতে পারেন। তৃতীয় পিক্সেল শিফট ইত্যাদির জন্য 3 এক্স ইত্যাদি স্থানান্তরিত করার জন্য, আপনি পছন্দসই আকারটি পেতে মূল পয়েন্টগুলি এবং কোনও অতিরিক্ত ইন্টারপোল্টেড পয়েন্টগুলি ফেলে দিতে পারেন।


5
@ হটপাও ২: ডিএফটি-র জন্য ইন্টারপোলটিং কার্নেলটি অসীম পরিমাণের একটি সংশ্লেষ () নয়, আসলে ডিএফটি একটি পৃথক, সসীম রূপান্তর। ডিএফটি দ্বারা বিভাজন ডিরিচলেট কার্নেলের সাথে সমঝোতার সমতুল্য, এটি কিছু লেখক দ্বারা পর্যায়ক্রমিক সিনক () নামেও পরিচিত : en.wikedia.org/wiki/Dirichlet_kernel
অ্যারিগো

@ আরিগো: সম্মত হন। ঠিক করার উত্তর সম্পাদিত।
হটপাউ 2

@ হটপাউ ২: আমি যখন এফএফটিকে দ্বিগুণ আকারে প্যাড করব তখন আইএফএফটি দ্বিগুণ আকারের পুনর্গঠন করবে। উদ্বৃত্ত নিয়ে কী করবেন তা নিশ্চিত নন? ধন্যবাদ
neuviemeporte

আপনার প্রয়োজন নেই এমন উদ্বৃত্ত পয়েন্টগুলি ফেলে দিন। একটি 2 এক্স উত্সরে, পুনর্নির্মাণের মূল পয়েন্টগুলির সাথে পর্যায়ক্রমে অন্য প্রত্যেকে স্থানান্তরিত হয়। একটি 3 এক্স উত্সরে আপনি 2 টি স্থানান্তরিত পয়েন্ট পাবেন (1/3 দ্বারা এবং 2/3 দ্বারা) মূলগুলির সাথে পর্যায়ক্রমে। ইত্যাদি আপনি যত বেশি আপসামাল করবেন ততই আপনি ফেলে দেবেন।
হটপাউ 2

7

ডিএফটি কীভাবে আপনাকে একটি চিত্র স্থানান্তর করতে দেয় তা বোঝার জন্য আপনার কয়েকটি কী অন্তর্দৃষ্টি রয়েছে।

প্রথম, ফুরিয়ার থিয়োরাম: প্রথমে ধারাবাহিক (অর্থাত্ অ্যানালগ) কেসটি দেখানো সম্ভবত সহজ। আপনার কোনও ফাংশন আছে তা কল্পনা করুন, এটিকে জি (টি) কল করুন। সরলতার জন্য, ধরা যাক যে জি (টি) হ'ল একটি অ্যানালগ অডিও রেকর্ডিং, সুতরাং এটি একটি এক-মাত্রিক ফাংশন, যা অবিচ্ছিন্ন এবং সময়ের কাজ হিসাবে তাত্ক্ষণিক চাপকে উপস্থাপন করে।

এখন, জি (টি) হ'ল একটি উপায় যা আমরা আমাদের অডিও রেকর্ডিং উপস্থাপন করতে পারি। আর একটি হ'ল জি (চ)। জি (চ) হ'ল জি (টি) এর ফুরিয়ার রূপান্তর। সুতরাং, জি (চ) == এফটি (জি (টি))। জি (চ) এর সকল তথ্য জি (টি) এর মতো রয়েছে তবে এটি সময় ডোমেনের পরিবর্তে ফ্রিকোয়েন্সি ডোমেনে সেই তথ্য উপস্থাপন করে। ফুরিয়ার ট্রান্সফর্ম সম্পর্কে কিছু নিট-পিক বিশদ রয়েছে, যা আমি উল্লেখ করব না।

আপনি জি (চ) কে জি (টি) এর মধ্যে থাকা "ফ্রিকোয়েন্সিগুলির বিতরণ" হিসাবে ভাবাতে পারেন। সুতরাং, যদি জি (টি) একটি সাইন ওয়েভ (অর্থাত্ একটি খাঁটি স্বর) হয়, তবে জি (চ) সেই স্বরের ফ্রিকোয়েন্সি বাদে সর্বত্র শূন্য হবে। এটি সম্ভবত উল্লেখ করার জন্য একটি ভাল পয়েন্ট যা জি (চ) সাধারণভাবে একটি জটিল ক্রিয়াকলাপ - এটি বলতে বোঝায় যে এটি জটিল সংখ্যার প্রত্যাবর্তন করে, যা একটি বাস্তব এবং কাল্পনিক উপাদান বা একটি মাত্রা এবং পর্যায় থাকার কথা ভাবা যেতে পারে।

এখানে একটি ছোট ডিগ্রেশন: যেহেতু g (টি) অবিচ্ছিন্ন (ডোমেন এবং ব্যাপ্তি উভয়ই), তাই G (f )ও অবিচ্ছিন্ন। সুতরাং, জি (চ) কীভাবে টোন ফ্রিকোয়েন্সি বাদে সর্বত্র শূন্য হতে পারে? ভাল, এফটি (পাপ (ডাব্লুটি)) = । যেখানে হ'ল ডাইরাক ডেল্টা ফাংশনδ(w)δ

ঠিক আছে, তাই এখন আমরা আমাদের বেল্টের অধীনে অবিচ্ছিন্ন এফটি পেয়েছি।

এখানে দ্বিতীয় অন্তর্দৃষ্টি: একটি নমুনা সংকেত একটি এনালগ সংকেত হিসাবে একটি ডিস্ক্রিট ফুরিয়ার ট্রান্সফর্ম একটি ফুরিয়ার ট্রান্সফর্ম হিসাবে হয়। এই ক্ষেত্রে, "বিচ্ছিন্ন" ফাংশনের ডোমেনের পরিমাণ (সময় বা ফ্রিকোয়েন্সি) বোঝায়, এটির সীমা নয়। (আপনার সাউন্ড কার্ড থেকে প্রাপ্ত নমুনা ডিজিটাল সিগন্যালটি ডোমেন এবং ব্যাপ্তি উভয় ক্ষেত্রেই কোয়ান্টাইটিসড))

আপনার সাউন্ড কার্ড থেকে আপনি যে ডিজিটাল বাইট-স্ট্রিমটি পান সেটিতে মাইক্রোফোন থেকে মূল অবিচ্ছিন্ন (অ্যানালগ) সংকেতের "নমুনা" থাকে। আমরা যদি আমাদের নমুনাযুক্ত জি (টি) এর ডিএফটি নিই, তবে আমরা একটি জি (চ) পাই। জি (চ), মনে রাখবেন, জি (টি) এর মধ্যে থাকা তথ্যের প্রতিনিধিত্ব করার এক অন্যরকম উপায়। যদি আমরা নাইকুইস্টের তত্ত্বটি মানি , স্যাম্পলড সিগন্যাল জি (টি) মূল অবিচ্ছিন্ন সংকেতের সমস্ত "বুদ্ধি" ধারণ করে, তাই আমাদের বিচ্ছিন্ন জি (চ) অবশ্যই আমাদের মূল অবিচ্ছিন্ন সংকেত থেকে সমস্ত তথ্য থাকতে পারে। জন্মগতভাবে, জি (চ) এখনও একটি জটিল কাজ।

এখানেই সাব-পিক্সেল শিফটিংয়ের ম্যাজিকটি আসে তবে এই ক্ষেত্রে আমি একই সাথে অডিও সিগন্যালটিকে একটি নমুনার চেয়ে কম সময়ে স্থানান্তরিত করতে লিখব, কারণ এটি একই জিনিস।

জি (এফ) কীভাবে একটি জটিল কাজ? টি = 0 তে শূন্য নয় এমন ফ্রিকোয়েন্সিগুলি উপস্থাপনের জন্য এটি জটিল হওয়া দরকার। মনে রাখবেন, পাপ (0) = 0, সুতরাং পাপ (2 * 0) = 0 ইত্যাদি ইত্যাদি তবে আমরা যদি সুরের একটি চক্রের মাধ্যমে চতুর্থাংশের রেকর্ডিং শুরু করি? এখান থেকে জি (চ) এর পর্ব অংশটি এসেছে। এই ক্ষেত্রে, চক্রের চতুর্থাংশের প্রতিনিধিত্ব করার জন্য আপনার পছন্দের উপর নির্ভর করে পর্বটি 90 ডিগ্রি বা পাই / 2 রেডিয়ান হবে ians জি (tone_frequency) অতএব = 0 + I বা।eiπ2

এর অর্থ হ'ল জি (টি) এর পর্যায়ে পরিবর্তন করে আমরা আমাদের অডিও রেকর্ডিংকে সময়ের সাথে ( কোনও নমুনা সময়ের একটি ভগ্নাংশ সহ আমরা যে কোনও পরিমাণ হিসাবে চয়ন করি) দ্বারা স্থানান্তরিত করতে পারি। আসলে, উক্তিটি সম্ভবত কিছুটা নৈমিত্তিক। অ-কোয়ান্টাইজাইজড, নমুনাযুক্ত সংকেতের জন্য পর্বটি নির্বিচারে সামঞ্জস্য করা যেতে পারে (এটি ডোমেনের পরিমাণ এবং পরিসীমা আগেভাগের মধ্যে পার্থক্য করার কারণের একটি অংশ)। তবে, কোয়ান্টাইটিসড স্যাম্পলড সিগন্যালের জন্য (আমাদের অডিওর বাইট-স্ট্রিম, উদাহরণস্বরূপ) কোয়ান্টাইজেশন স্টেপ সাইজ (অর্থাত্ বিটের সংখ্যা) রেজোলিউশনটি নির্ধারণ করে যা আমরা ফেজটি সামঞ্জস্য করতে পারি। যখন আমরা উল্টে ফুরিয়ার ট্রান্সফর্ম জি (এফ) (বা এটি স্যাম্পলড সিগন্যালের জন্য), 'জি' (টি) = ডিআইএফটি (জি (এফ)) এর স্যাম্পেলের নতুন সেটগুলি আমরা যে পরিমাণ বাছাই করে তা সময়মতো স্থানান্তরিত হবে।

এটি আপনার পিক্সেলগুলিতে প্রয়োগ করার অর্থ এখানে আলোচিত 1-মাত্রিক এফটির পরিবর্তে 2-মাত্রিক এফটি ব্যবহার করা।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.