চিত্রের প্রক্রিয়াকরণে কেন গাউসীয় ফিল্টারগুলি লো পাস ফিল্টার হিসাবে ব্যবহৃত হয়?


30

1 ডি সংকেত প্রক্রিয়াকরণে, অনেক ধরণের লো পাস ফিল্টার ব্যবহৃত হয়। যদিও গাউসিয়ান ফিল্টারগুলি প্রায় কখনও ব্যবহৃত হয় না।

তারা কেন চিত্র প্রক্রিয়াকরণ অ্যাপ্লিকেশনগুলিতে এত জনপ্রিয়? এই ফিল্টারগুলি কোনও মানদণ্ডকে অনুকূলকরণের ফলস্বরূপ বা চিত্র 'ব্যান্ডউইথ' সাধারণত ভালভাবে সংজ্ঞায়িত না হওয়ায় কেবল অ্যাডহক সমাধান হয়।

উত্তর:


28

চিত্র প্রক্রিয়াকরণ অ্যাপ্লিকেশনগুলি অডিও প্রসেসিং অ্যাপ্লিকেশনগুলি বলতে আলাদা, কারণ তাদের মধ্যে অনেকগুলি চোখের জন্য সুর করা। গাউসিয়ান মুখোশগুলি প্রায় পুরোপুরি অপটিকাল ব্লার সিমুলেট করে ( স্প্রেড ফাংশনগুলিও দেখায় )। শৈল্পিক উত্পাদন ভিত্তিক কোনও চিত্র প্রক্রিয়াকরণ অ্যাপ্লিকেশনটিতে, গাউসিয়ান ফিল্টারগুলি ডিফল্টরূপে অস্পষ্ট হওয়ার জন্য ব্যবহৃত হয়।

গাউসিয়ান ফিল্টারগুলির আরেকটি গুরুত্বপূর্ণ পরিমাণগত সম্পত্তি হ'ল এগুলি সর্বত্র অ-নেতিবাচক । এটি গুরুত্বপূর্ণ কারণ বেশিরভাগ 1D সংকেত প্রায় 0 ( ) পরিবর্তিত হয় এবং ইতিবাচক বা নেতিবাচক মান থাকতে পারে। চিত্রগুলি এই অর্থে পৃথক যে কোনও চিত্রের সমস্ত মান ( )। গাউসিয়ান কার্নেল (ফিল্টার) সহ কনভলিউশন একটি অ-নেতিবাচক ফলাফলের গ্যারান্টি দেয়, সুতরাং এই জাতীয় ফাংশন মানচিত্রহীন অন্যান্য মানগুলিকে অন্য অ-নেতিবাচক মানগুলিতে মান দেয় ( )। ফলস্বরূপ সর্বদা অন্য বৈধ চিত্র। এক্স x আর +: আর +আর +xRxR+f:R+R+

সাধারণভাবে, ইমেজ প্রসেসিংয়ে ফ্রিকোয়েন্সি প্রত্যাখ্যান 1 ডি সংকেতের মতো গুরুত্বপূর্ণ নয়। উদাহরণস্বরূপ, মড্যুলেশন স্কিমগুলিতে আপনার ফিল্টারগুলি বিভিন্ন ক্যারিয়ারের ফ্রিকোয়েন্সি ইত্যাদিতে প্রেরিত অন্যান্য চ্যানেলগুলি প্রত্যাখ্যান করার জন্য খুব নির্ভুল হওয়া দরকার। আমি কেবল চিত্র প্রক্রিয়াকরণের সমস্যার জন্য সীমাবদ্ধ হিসাবে কিছুই ভাবতে পারি না।


21

গাউসিয়ান ফিল্টারগুলি ইমেজ প্রসেসিংয়ে ব্যবহৃত হয় কারণ তাদের এমন একটি সম্পত্তি রয়েছে যা সময় ডোমেনে তাদের সমর্থন, ফ্রিকোয়েন্সি ডোমেনে তাদের সমর্থনের সমান। এটি গাউসিয়ান নিজস্ব ফুরিয়ার ট্রান্সফর্ম হিসাবে এসেছে।

এর অর্থ কী? ঠিক আছে, যদি ফিল্টারটির সমর্থন উভয় ডোমেইনে একই হয়, এর অর্থ উভয় সমর্থনের অনুপাত 1 it এটি দেখা যাচ্ছে, এর অর্থ গাউসিয়ান ফিল্টারগুলির 'সর্বনিম্ন সময় ব্যান্ডউইথ পণ্য' রয়েছে।

তাহলে আপনি কি বলতে পারেন? ঠিক আছে, ইমেজ প্রসেসিংয়ে, একটি খুব গুরুত্বপূর্ণ কাজ হ'ল সাদা আওয়াজ সরিয়ে ফেলা, সমস্ত সময় প্রধান প্রান্তগুলি বজায় রেখে। এটি একটি স্ববিরোধী কাজ হতে পারে - সাদা আওয়াজ সমস্ত ফ্রিকোয়েন্সিগুলিতে সমানভাবে উপস্থিত থাকে, যখন প্রান্তগুলি উচ্চ ফ্রিকোয়েন্সি ব্যাপ্তিতে থাকে। (স্থানিক সংকেতগুলিতে হঠাৎ পরিবর্তন)। ফিল্টারিংয়ের মাধ্যমে চিরাচরিত শব্দের অপসারণে, একটি সিগন্যাল লো পাস ফিল্টারযুক্ত, যার অর্থ আপনার সিগন্যালে উচ্চ ফ্রিকোয়েন্সি উপাদানগুলি সম্পূর্ণভাবে মুছে ফেলা হয়।

তবে যদি চিত্রগুলিতে উচ্চ ফ্রিকোয়েন্সি উপাদান হিসাবে প্রান্ত থাকে তবে traditionalতিহ্যবাহী এলপিএফ'ইং এগুলি সরিয়ে ফেলবে, এবং দৃশ্যত, এটি নিজেকে আরও ধীরে ধীরে ধীরে ধীরে পরিণত হওয়ার কারণে প্রকাশ পায়।

তাহলে কীভাবে, শব্দটি সরানো, তবে উচ্চ ফ্রিকোয়েন্সি প্রান্তগুলি সংরক্ষণ করা যায়? গাউসির কর্নেলটি প্রবেশ করান। যেহেতু গাউসের ফুরিয়ার ট্রান্সফর্মটিও একজন গাউসিয়ান, তাই গাসু ফিল্টারটির কোনও পাস ব্যান্ড ফ্রিকোয়েন্সিতে একটি ধারালো কাটঅফ নেই যা এর বাইরে সমস্ত উচ্চতর ফ্রিকোয়েন্সি সরিয়ে ফেলা হয়। পরিবর্তে, এর একটি করুণ এবং প্রাকৃতিক লেজ রয়েছে যা ফ্রিকোয়েন্সি বাড়ার সাথে সাথে সর্বদা কম হয়। এর অর্থ হ'ল এটি একটি লো পাস ফিল্টার হিসাবে কাজ করবে তবে উচ্চতর ফ্রিকোয়েন্সি উপাদানগুলিতে এটির লেজ ক্ষয়ে দ্রুত কমে যাওয়ার সাথে সামঞ্জস্য করে। (অন্যদিকে, এলপিএফের একটি উচ্চতর সময় ব্যান্ডউইথ পণ্য থাকবে, কারণ এফ-ডোমেনে এটির সমর্থন কোনও গাউসিয়ানদের তুলনায় প্রায় বড় নয়))

এটি তখন উভয় দুনিয়ার সেরা শব্দ অর্জনের অনুমতি দেয় - গোলমাল অপসারণ, এবং প্রান্ত সংরক্ষণ।


2
আমি নিশ্চিত নই যে আপনি দুটি সমর্থন সরাসরি তুলনা করতে পারেন যেহেতু একটি সময় / দৈর্ঘ্যে এবং অন্যটি হার্জেড / রেডিয়েন্সে পরিমাপ করা হয়। তাদের রূপবিজ্ঞানটি অভিন্ন, তবে সর্বজনীন স্কেলিং সম্পত্তিটি এখনও ধারণ করে।
ফোনন

সর্বনিম্ন সময় ব্যান্ডউইথ পণ্যটি মনে করিয়ে দেওয়ার জন্য ধন্যবাদ Thanks যাইহোক, ফোনন যেমন উল্লেখ করেছেন, স্থানিক (~ সময়) ডোমেন সমর্থন হ্রাস করা অগত্যা ব্যান্ডউইথ বৃদ্ধি করে। সরল গাউসিয়ান ফিল্টার দিয়ে আপনার উভয় শব্দ দমন এবং প্রান্তগুলি সংরক্ষণের কোনও উপায় নেই। এজন্য পেরোনা ও মালিক অ্যানিসোট্রপিক ফিল্টারিং বিকাশ করেছেন।
নিমরোডম

@ ফনন আমি যেমন দেখেছি, সমর্থনগুলি কেবলমাত্র কোনও ডোমেনে ফ্রি-র শূন্য-শূন্য এন্ট্রি বর্ণনা করে - আমি বিশ্বাস করি যে তারা একই রকম। (অতএব, অনুপাত 1)। বলা হচ্ছে, টাইম-ব্যান্ডউইথ পণ্যটি সময় এবং ফ্রিকোয়েন্সিতে ফাংশনের ভিন্নতার পণ্য হিসাবে পরিমাপ করা হয়। এটির সাধারণীকরণ লেখকদের চেয়ে কীভাবে আলাদা, আমি দেখেছি এটি 1/2 বা 1/4 এর সমান।
স্পেসি

1
@ নিম্রডম "স্থানিক (~ সময়) কমানোর ডোমেন সমর্থন অগত্যা ব্যান্ডউইথকে বাড়িয়ে তোলে" "হ্যাঁ, এটিই প্রবণতা , সময়-ফ্রিকোয়েন্সি বিপরীত সম্পর্ক থেকে উদ্ভূত। (এখান থেকেই সময়-ফ্রিকোয়েন্সি অনিশ্চয়তা আসে)। তবে গাউসিয়ান ফাংশনটি এমন একটি শ্রেণীর যা এই পণ্যটিকে পুরোপুরি হ্রাস করে। সময় এবং ফ্রিকোয়েন্সি মধ্যে বিপরীত সম্পর্ক দেওয়া, এটি করার কোনও উপায় নেই যদি না এটির উভয় ডোমেনে সমান সমর্থন থাকে।
স্পেসি

@ নিমরোডম অ্যানিসোট্রপিক প্রসারণে, আমি যে কার্নেলগুলি দেখেছি এখনও সেগুলি গাউসিয়ান, যদিও কোভারিয়েন্স ম্যাট্রিক্সগুলি ইমেজের গ্রেডিয়েন্টের উপর নির্ভরশীল। (এটিও একটি অ-রৈখিক পদ্ধতি, ভিএস গাউসি স্মুথিং যা লিনিয়ার। তবে, গাউসীয় বৈশিষ্ট্যগুলির কারণে এটি ব্যবহৃত হয়।
স্পেসি

11

আপনার কাছে ইতিমধ্যে ভাল উত্তর রয়েছে তবে আমি 2 ডি গাউসিয়ান ফিল্টারগুলির আরও একটি দরকারী সম্পত্তি যুক্ত করব, এটি হ'ল এগুলি পৃথকযোগ্য , অর্থাত 2 ডি ফিল্টারটি দুটি 1 ডি ফিল্টারে বিভক্ত হতে পারে। বৃহত্তর কার্নেল আকারের জন্য এটি একটি গুরুত্বপূর্ণ পারফরম্যান্স বিবেচনা করা যেতে পারে, যেহেতু একটি এমএক্সএন বিভাজ্য ফিল্টারটি M+Nমাল্টিপল- অ্যাডের সাথে প্রয়োগ করা যেতে পারে তবে একটি নন-বিচ্ছেদযোগ্য এমএক্সএন ফিল্টারটির গুণক M*N-সংযোজন প্রয়োজন।


2
এটি একটি ভাল যুক্তি। একটি 2 ডি গাউসিয়ান ফিল্টার উভয়ই রেডিয়ালি সিমেট্রিক এবং এখনও পৃথকযোগ্য তাই বাস্তবায়নের জটিলতা হ্রাস পেয়েছে।
নিমরোডম

1
একটি রেফারেন্স হিসাবে, সায়েন্টিস্ট এবং ইঞ্জিনিয়ারের ডিএসপি-র গাইড গাইড অধ্যায় 24 এ এই সম্পত্তির একটি দুর্দান্ত বর্ণনা সরবরাহ করে ।
কালেব রেজিস্টার

6

ইমেজম্যাগিকের ম্যানুয়ালটিতে সিনস ফাংশনগুলির সাথে ফিল্টারিং কেন "বাজানো" প্রভাবের দিকে পরিচালিত করে, যখন গাউসিয়ানরা তা না করে তার দুর্দান্ত ব্যাখ্যা রয়েছে। ( http://www.imagemagick.org/Usage/fourier/#blurring এবং http://www.imagemagick.org/Usage/fourier/#circle_spectrum )। আপনার ইমেজে প্রান্তগুলি (বিচ্ছিন্নতা) থাকলে (যা বেশিরভাগ চিত্রগুলি করে) তারপরে সমস্ত উচ্চ ফ্রিকোয়েন্সি পুরোপুরি কেটে ফেলা হলে আপনাকে স্থানিক ডোমেনে রিপ্লেস দেয়। আপনি যখন বর্গাকার তরঙ্গগুলিকে এক মাত্রায় সংশ্লেষিত ফাংশন দিয়ে ফিল্টার করেন তখন আপনি বেজে উঠেন।


2

ইতিমধ্যে সুন্দর উত্তর রয়েছে, তবে আমি আমার লবণের দানা যুক্ত করব, না বরং ভিন্ন দৃষ্টিকোণ:

সর্বাধিক বিমূর্ত স্তরে ফিল্টারিং কিছু কাঁচা ডেটাতে পূর্বের জ্ঞান প্রয়োগ হিসাবে বিবেচনা করা যেতে পারে। এর অর্থ হ'ল কিছু ফিল্টারিং অ্যালগরিদম প্রয়োগ করা হ'ল শব্দের অনুপাতের সংকেতটিতে সর্বোত্তম সন্ধান করার আগে এটি প্রয়োগ করা।

চিত্রের জন্য, একটি শাস্ত্রীয় পূর্ব হ'ল মানের স্বচ্ছতা (উদাহরণস্বরূপ তীব্রতা) অবস্থান সম্পর্কিত (এটি @ ফোননের দ্বারা উল্লিখিত পয়েন্ট স্প্রেড ফাংশন হিসাবে দেখা যায়)। এটি প্রায়শই গাউসিয়ান হিসাবে মডেল করা হয় কারণ এটি কোনও আকৃতি হিসাবে পরিচিত মসৃণতা ব্যাসার্ধের সাথে বিভিন্ন বস্তুর মিশ্রণ করার সময় আপনি যে আকারটি অর্জন করতে পারেন (এটি কেন্দ্রীয় সীমার উপপাদ্য বলা হয় )। এটি বেশিরভাগ ক্ষেত্রে কার্যকর যখন আপনি কোনও চিত্রের ডেরিভেটিভগুলি তৈরি করতে চান: কাঁচা সংকেত (যা একটি শোরগোলের আউটপুট উত্পন্ন করতে পারে) তার চেয়ে আলাদা করার পরিবর্তে আপনার স্মুথযুক্ত চিত্রটিতে এটি করা উচিত। এটি ভ্যাবলেট-মতো অপারেটর যেমন গ্যাবার ফিল্টার প্রয়োগ করার সমতুল্য ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.