চিত্রগুলির ক্ষেত্রে ফ্রিকোয়েন্সি ডোমেনটি কী বোঝায়?


110

আমি কেবল চিত্রগুলিতে ফ্রিকোয়েন্সি ডোমেন সম্পর্কে শিখছিলাম।

আমি তরঙ্গের ক্ষেত্রে ফ্রিকোয়েন্সি বর্ণালী বুঝতে পারি। এটি তরঙ্গে কোন ফ্রিকোয়েন্সি উপস্থিত তা বোঝায়। আমরা যদি ফ্রিকোয়েন্সি স্পেকট্রাম আঁকা cos(2πft) , আমরা একটি প্রৈতি সংকেত পেতে f এবং +f । এবং আমরা নির্দিষ্ট তথ্য নিষ্কাশন করতে সংশ্লিষ্ট ফিল্টার ব্যবহার করতে পারি।

তবে চিত্রগুলির ক্ষেত্রে ফ্রিকোয়েন্সি বর্ণালী বলতে কী বোঝায়? যখন আমরা ওপেনসিভিতে কোনও চিত্রের এফএফটি নিই, তখন আমরা একটি অদ্ভুত চিত্র পাই। এই চিত্রটি কী বোঝায়? এবং এর প্রয়োগ কী?

আমি কয়েকটি বই পড়েছি, তবে সেগুলি শারীরিক জড়িততার চেয়ে প্রচুর গাণিতিক সমীকরণ দেয়। সুতরাং যে কেউ ইমেজ প্রসেসিংয়ে এটির একটি সাধারণ প্রয়োগ সহ চিত্রগুলিতে ফ্রিকোয়েন্সি ডোমেনের একটি সহজ ব্যাখ্যা সরবরাহ করতে পারে?


5
কোনও রূপান্তর কী তা বোঝার সর্বোত্তম উপায় হ'ল বিপরীত রূপান্তরটিতে সাধারণ ইনপুটগুলিকে খাওয়ানো around
এন্ডোলিথ


@ ইন্দোলিথ হ্যাঁ! কী ঘটছে এবং কেন এটি হচ্ছে তা পুরোপুরি বুঝতে আপনার আগেই ডোমেনে কিছু জ্ঞান প্রয়োজন ..
এসআইস্লাম

প্রিয় চিত্রটির ফ্রিকোয়েন্সি ডোমেন হার্টিজের নির্দিষ্ট ফ্রিকোয়েন্সি যেমন (ডিসি উপাদান, কম ফ্রিকোয়েন্সি এবং উচ্চ ফ্রিকোয়েন্সি) এর প্রতি শ্রদ্ধার সাথে ওয়াটের পাওয়ার তীব্রতার প্রতিনিধিত্ব করে
মন্টেসার

উত্তর:


93

তবে চিত্রগুলির ক্ষেত্রে ফ্রিকোয়েন্সি বর্ণালী বলতে কী বোঝায়?

"গাণিতিক সমীকরণ" গুরুত্বপূর্ণ, সুতরাং এগুলি পুরোপুরি এড়িয়ে যাবেন না। তবে 2 ডি এফএফটির একটি স্বজ্ঞাত ব্যাখ্যাও রয়েছে। উদাহরণস্বরূপ, আমি কয়েকটি নমুনা চিত্রের বিপরীত FFT গণনা করেছি:

এখানে চিত্র বর্ণনা লিখুন

আপনি দেখতে পাচ্ছেন, ফ্রিকোয়েন্সি ডোমেনে কেবল একটি পিক্সেল সেট করা আছে। চিত্র ডোমেনের ফলাফল (আমি কেবল আসল অংশটি প্রদর্শিত করেছি) একটি "ঘোরানো কোসাইন প্যাটার্ন" (কল্পিত অংশটি সংশ্লিষ্ট সাইন হবে)।

যদি আমি ফ্রিকোয়েন্সি ডোমেনে একটি আলাদা পিক্সেল সেট করি (বাম সীমান্তে):

এখানে চিত্র বর্ণনা লিখুন

আমি একটি ভিন্ন 2 ডি ফ্রিকোয়েন্সি প্যাটার্ন পেয়েছি।

যদি আমি ফ্রিকোয়েন্সি ডোমেনে একাধিক পিক্সেল সেট করি:

এখানে চিত্র বর্ণনা লিখুন

আপনি দুটি কোসাইন যোগফল পাবেন।

সুতরাং 1 ডি ওয়েভের মতো, এটি সাইনস এবং কোসাইনগুলির যোগফল হিসাবে উপস্থাপিত হতে পারে, উপরের মতো দেখানো হয়েছে যে কোনও 2 ডি চিত্রকে "ঘোরানো সাইন এবং কোসাইন" এর যোগফল হিসাবে উপস্থাপন করা যেতে পারে।

যখন আমরা ওপেনসিভিতে কোনও চিত্রের ফিট পাই, তখন আমরা অদ্ভুত চিত্র পাই। এই চিত্রটি কী বোঝায়?

এটি সাইন / কোসাইনগুলির বিস্তৃতি এবং ফ্রিকোয়েন্সি বোঝায় যা যুক্ত হয়ে গেলে, আপনাকে মূল চিত্র দেবে।

এবং এর প্রয়োগ কী?

তাদের সবার নামকরণের জন্য সত্যই অনেক বেশি। সহযোগিতা এবং সমঝোতা একটি এফএফটি ব্যবহার করে খুব দক্ষতার সাথে গণনা করা যেতে পারে, তবে এটি একটি অপ্টিমাইজেশনের আরও বেশি, আপনি তার জন্য এফএফটি ফলাফলটি "চেহারা" না। এটি চিত্র সংকোচনের জন্য ব্যবহৃত হয়, কারণ উচ্চ ফ্রিকোয়েন্সি উপাদানগুলি কেবলমাত্র শব্দ হয়।


3
আপনি নির্দিষ্ট করতে পারবেন কোনটি ফ্রিকোয়েন্সি অংশ এবং কম ফ্রিকোয়েন্সি অংশটি ফ্রিকোয়েন্সি ডোমেন চিত্রে?
আবিদ রহমান কে

4
@ ইয়াকিয়াজ: আমি যে চিত্রগুলি দেখিয়েছি তাতে সর্বাধিক ফ্রিকোয়েন্সি চিত্রের কেন্দ্রস্থলে, সর্বনিম্ন ফ্রিকোয়েন্সি (অর্থাত্ ইনপুট চিত্রের গড়) এফএফটি ফলাফলের শীর্ষে বাম পিক্সেল। সর্বাধিক এফএফটি বাস্তবায়ন আপনাকে তা দেয়। আপনি যদি এফএফটি ফলাফলটি প্রদর্শন করেন তবে প্রদর্শিত চিত্রের কেন্দ্রে সর্বনিম্ন ফ্রিকোয়েন্সি সরানো সাধারণ।
নিকি এস্টনার

1
@ মোহাম্মদ: আমি ম্যাথেমেটিকার InverseFourierকাজটি ব্যবহার করেছি । অষ্টাভ / মতলব ifft2কি একই রকম করে না?
নিকি এস্টনার

1
@ জিমক্লে রঙের চিত্রগুলির জন্য, আমি আসলে YUV ডোমেন ব্যবহার করার পরামর্শ দেব । Y = পরম তীব্রতা এবং UV = রঙ। এমনকি রঙিন চিত্রগুলির জন্যও, আপনি আগ্রহী বেশিরভাগ তথ্য চিত্রটির তীব্রতার অংশ। আপনি সমস্ত গাণিতিক সরঞ্জাম ব্যবহার করেন, কেবল ফিরে রূপান্তর করতে মনে রাখবেন।
আটভ 32

4
এনিমেশন হিসাবে দুর্দান্ত হবে, যেমন পয়েন্টটি চারদিকে সরানো এবং তরঙ্গগুলি প্রস্থ এবং কোণকে কীভাবে পরিবর্তন করে তা দেখায়
এন্ডোলিথ

29

আমি মনে করি এটি সুপরিচিত "ডিএসপি গাইড" ( অধ্যায় 24, বিভাগ 5 ) এ খুব ভালভাবে দেওয়া হয়েছিল :

ফুওরি বিশ্লেষণ এক-মাত্রিক সংকেতগুলির সাথে একইভাবে চিত্র প্রক্রিয়াকরণে ব্যবহৃত হয়। যাইহোক, চিত্রগুলি ফ্রিকোয়েন্সি ডোমেনে তাদের তথ্য এনকোড করে না, কৌশলগুলি খুব কম দরকারী করে তোলে। উদাহরণস্বরূপ, যখন ফুরিয়ার ট্রান্সফর্মটি অডিও সংকেত গ্রহণ করা হয়, তখন বিভ্রান্তিকর সময় ডোমেন ওয়েভফর্মটি ফ্রিকোয়েন্সি বর্ণালী বুঝতে সহজ রূপান্তরিত হয়।

তুলনায়, কোনও চিত্রের ফুরিয়ার রূপান্তর গ্রহণ স্থানিক ডোমেনের সোজাসুজি তথ্যকে ফ্রিকোয়েন্সি ডোমেনে স্ক্যাম্বলড ফর্মে রূপান্তরিত করে। সংক্ষেপে, ফুরিয়ার রূপান্তরটি আপনাকে চিত্রগুলিতে এনকোড করা তথ্য বুঝতে সহায়তা করার আশা করবেন না।

সুতরাং অবশ্যই একটি সাধারণ চিত্রের ডিএফটি গ্রহণের ফলে আপাতদৃষ্টিতে এলোমেলো প্যাটার্নের পিছনে কিছু কাঠামো এবং অর্থ রয়েছে (যেমন নীচের উদাহরণ হিসাবে) তবে এটি এমন কোনও রূপে নয় যা মানুষের মস্তিষ্ক স্বজ্ঞাতভাবে বুঝতে প্রস্তুত হয়, কমপক্ষে ভিজ্যুয়াল ধারণা সম্পর্কে।

Imgur

এখানে একটি চিত্রের ফুরিয়ার ট্রান্সফর্মটিতে কী রয়েছে এবং কীভাবে এটি ব্যাখ্যা করা যেতে পারে তার আরও একটি আকর্ষণীয় এবং বেশ পঠনযোগ্য এক্সপোজেশন রয়েছে। এটিতে এমন একাধিক চিত্র রয়েছে যা ফুরিয়ার-রূপান্তরিত এবং মূল চিত্রের মধ্যে চিঠিপত্র কী তা একেবারে পরিষ্কার করে দেয়।

সম্পাদনা করুন: এই পৃষ্ঠাটি একবার দেখুন , যা শেষের দিকে প্রদর্শন করে - কোনও চিত্রের বোধগম্যভাবে গুরুত্বপূর্ণ তথ্য কীভাবে ফ্রিকোয়েন্সি উপস্থাপনের পর্যায়ে (কোণ) অংশে সংরক্ষণ করা হয়।

2 সম্পাদনা করুন: ফুরিয়ার প্রতিনিধিত্বের মধ্যে পর্ব এবং মাত্রার অর্থের আরেকটি উদাহরণ: টিউ ডেলফ্টের পাঠ্যপুস্তক " চিত্র প্রসেসিংয়ের ফান্ডামেন্টালস " এর "বিভাগ 3.4.1, পর্ব এবং মাত্রার গুরুত্ব " এটি একেবারে স্পষ্টভাবে দেখায়:

Imgur


হে! আমি আপনার প্রশ্নের দ্বিতীয় লিঙ্কটি অনুসরণ করার চেষ্টা করেছি ( "আরও একটি আকর্ষণীয় এবং বেশ পঠনযোগ্য এক্সপোশন ..." ) তবে লিঙ্কটি কাজ করছে না। আমি মন্তব্যে প্রদত্ত লিঙ্কটি চেষ্টা করেছিলাম, কিন্তু কাজ করে না। আপনি কি একটি কাজের লিঙ্কে সন্ধান এবং সম্পাদনা করতে পারেন দয়া করে?
পেনেলোপ

@ স্প্যানেলোপ আপনি লিঙ্কটি নিয়ে সমস্যা লক্ষ্য করার দ্বিতীয় ব্যক্তি (আমার পূর্ববর্তী মন্তব্য দেখুন)। পৃষ্ঠাটি সত্যই অস্থির বলে মনে হচ্ছে। আমি আগেই বলেছি, আমি লিঙ্কটি ওয়েব সংরক্ষণাগার সংস্করণ দিয়ে প্রতিস্থাপন করব। এই বিষয়টি চিহ্নিত করার জন্য ধন্যবাদ!
ওয়াল্ডরিয়াস

1
আসলে, (শেষ পর্যন্ত কাজ করা) লিঙ্কে উদাহরণ এবং ব্যাখ্যাগুলি দুর্দান্ত :)
পেনেলোপ

12

তরঙ্গ এক-মাত্রিক তরঙ্গ; এটি কেবল উপর নির্ভর করে । তরঙ্গ একটি দ্বিমাত্রিক তরঙ্গ। এটি এবং উপর নির্ভর করে । যেমন আপনি দেখতে পাচ্ছেন, আপনার দুটি দিক রয়েছে eithert f ( x , y ) = c o s ( ω x + ψ y ) x yf(t)=cos(ωt)tf(x,y)=cos(ωx+ψy)xy

অতএব, ফুরিয়ার রুপান্তর এর (FFT) দিতে হবে শুধু এর FFT মত আপনি দেয় । এবং যদি আপনার ইনপুটটি 2D কোসিন সমষ্টি করে এমন একটি ফাংশন হয়, তবে আপনার 2D এফএফটি সেই কোসিনগুলির ফ্রিকোয়েন্সিগুলির যোগফল হবে - আবার 1D এফএফটির সরাসরি এনালগ।ω , ψ c o s ( ω x ) ω ωcos(ωx+ψy)ω,ψcos(ωx)ω


10

এটি লক্ষণীয় যে ফুরিয়ার অ্যানালাইসিস অর্থোথোনাল ফাংশন নামে একটি ধারণার একটি বিশেষ ক্ষেত্রে । প্রাথমিক ধারণাটি হ'ল আপনি একটি জটিল সিগন্যালকে সরল "ভিত্তি" ফাংশনের লিনিয়ার সুপারপজিশনে বিভক্ত করেন। আপনি বেসিক ফাংশনগুলিতে আপনার প্রসেসিং বা বিশ্লেষণ করতে পারেন এবং তারপরে মূল সংকেতের ফলাফল পাওয়ার জন্য বেস ফাংশনগুলির জন্য ফলাফলগুলি যোগ করতে পারেন।

এটি কাজ করার জন্য ভিত্তি ফাংশনের জন্য কিছু গাণিতিক প্রয়োজনীয়তা রয়েছে, অর্থাত তারা আদর্শিকভাবে একটি গোঁড়ামির ভিত্তি তৈরি করে। ফুরিয়ার ট্রান্সফর্মের ক্ষেত্রে ভিত্তি ফাংশনগুলি জটিল তাত্পর্যপূর্ণ। তবে এর জন্য আরও অনেকগুলি ক্রিয়া ব্যবহার করা যেতে পারে।


সেটা সত্য. অন্যান্য কোন ধরণের ভিত্তিক কাজ রয়েছে? আমি ডাবিচিজ ওয়েভলেটগুলি ভাবছি, তবে অন্য কি আছে? তাদের পার্থক্য কি হবে?
স্পেসি

সম্ভবত সর্বাধিক পরিচিত হ'ল বহুবর্ষ; বহুবর্ষের সেট হিসাবে কোনও ফাংশনের প্রতিনিধিত্বকে এটির টেলর সিরি হিসাবে পরিচিত । এই সিরিটি সহজেই ফাংশন ডেরাইভেটিভস থেকে গণনা করা হয়।
এমসাল্টার্স

2
বেস ফাংশনগুলি সন্ধান করার একটি উপায় হ'ল প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস প্রয়োগ করা । ফলস্বরূপ 'ইগেন-চিত্রগুলি' এর প্রায়শই পাপ / কোস ফাংশনগুলির চেয়ে বেশি মানব-স্বজ্ঞাত উপস্থিতি ঘটে। উদাহরণস্বরূপ, আইগেনফেসগুলি দেখুন । ফ্রিকোয়েন্সি ডোমেনটি উপলব্ধি করার জন্য এখনও প্রাসঙ্গিক (আমাদের চোখ / মস্তিষ্কে এজ-ডিটেক্টর রয়েছে যা ফ্রিকোয়েন্সি সংবেদনশীল, বিশেষত যখন গতিতে জড়িত থাকে); ভিত্তি ফাংশনগুলি চিত্র হিসাবে খুব বেশি অর্থবহ নয়।
ড্যান ব্রায়ান্ট

পিসিএ হ'ল একটি দুর্দান্ত ভিত্তি গণনা কৌশল যা ব্যাপকভাবে বোঝা যায়, তবে এমন আরও অনেক লোক রয়েছে যা কীভাবে ডেটা তৈরি হয়েছিল সে সম্পর্কে বিভিন্ন ধারণা তৈরি করে; স্বতন্ত্র উপাদান বিশ্লেষণ (আইসিএ) এর একটি জনপ্রিয় উদাহরণ। আরও কিছুদূর, স্পার্স কোডিং ব্যবহার করে জেনেরিক বেস ফাংশন লার্নিংয়ের জন্য অ্যালগরিদম রয়েছে (যেমন জে মাইরাল এট আল। "স্পার্স কোডিংয়ের জন্য অনলাইন অভিধান শিখন," আইসিএমএল ২০০৯), এবং তারপরে গভীর জাল দ্বারা বিকশিত "বৈশিষ্ট্য শেখার" পদ্ধতিগুলি ভাবেন।
lmjohns3

1
ফাংশনগুলি অরথোগোনাল হতে হবে কেন?
কোয়ান্টাম 231

8

চিত্রগুলিতে ক্রমবর্ধমান ফ্রিকোয়েন্সি উজ্জ্বলতা বা রঙে আরও আকস্মিক পরিবর্তনের সাথে সম্পর্কিত। তদ্ব্যতীত, শব্দটি বর্ণালীটির উচ্চ প্রান্তে এম্বেড থাকে, তাই কম-পাস ফিল্টারিং শব্দ কমানোর জন্য ব্যবহার করা যেতে পারে।


1
সুতরাং আপনি বোঝাচ্ছেন যে হঠাৎ ট্রানজিশনগুলি কখনও কখনও শব্দ হিসাবে বিবেচিত হয়?
আবিদ রহমান কে

1
হ্যা মাঝেমাঝে. সাধারণ উদাহরণগুলির মধ্যে রয়েছে মশার শব্দ (প্রান্তের চারপাশে বেড়ানো), ম্যাক্রোব্লকগুলির প্রান্তে জেপিজি ব্লক শব্দ এবং অবশ্যই শস্য। একটি সাধারণ গ্রেডিয়েন্টের একটি চিত্র বিবেচনা করুন। এই চিত্রটিতে শস্য যুক্ত করা পুরো চিত্র জুড়ে মিনিট ট্রানজিশনগুলি প্রবর্তন করে এর উচ্চ-ফ্রিকোয়েন্সি সামগ্রী বাড়িয়ে তোলে।
এমরে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.