গাউসিয়ান ব্লার - স্ট্যান্ডার্ড বিচ্যুতি, ব্যাসার্ধ এবং কার্নেলের আকার


19

আমি জিএলএসএলে গাউসিয়ান ব্লার ফ্রেগমেন্ট শেডার প্রয়োগ করেছি। আমি এর সবগুলির মূল ধারণাগুলি বুঝতে পারি: দৃ conv়বিশ্বাস, রৈখিকতা ব্যবহার করে এক্স এবং ওয়াইয়ের বিভাজন, ব্যাসার্ধ বাড়ানোর জন্য একাধিক পাস ...

যদিও এখনও আমার কয়েকটি প্রশ্ন রয়েছে:

  • সিগমা এবং ব্যাসার্ধের মধ্যে কী সম্পর্ক?

    আমি পড়েছি যে সিগমা ব্যাসার্ধের সমতুল্য, আমি দেখতে পাই না যে সিগমা কীভাবে পিক্সেলে প্রকাশ করা হয়। বা "ব্যাসার্ধ" কি কেবল সিগমার নাম, পিক্সেলের সাথে সম্পর্কিত নয়?

  • আমি সিগমা কীভাবে বেছে নেব?

    সিগমা বাড়াতে আমি একাধিক পাস ব্যবহার করে বিবেচনা করে, যে কোনও পাসে আমি চাইলে সিগমাটি পেতে একটি ভাল সিগমা কীভাবে বেছে নেব? যদি সিগমাসের বর্গের যোগফলের বর্গমূলের সমান ফলাফল হয় এবং সিগমা ব্যাসার্ধের সমতুল্য হয় তবে কোনও পছন্দসই ব্যাসার্ধ পাওয়ার সহজ উপায় কী?

  • কার্নেলের জন্য ভাল আকারটি কী এবং এটি সিগমার সাথে কীভাবে সম্পর্কিত?

    আমি বেশিরভাগ বাস্তবায়নগুলিতে 5x5 কার্নেল ব্যবহার করতে দেখেছি। এটি সম্ভবত শালীন মানের সহ দ্রুত বাস্তবায়নের জন্য একটি ভাল পছন্দ, তবে অন্য কার্নেলের আকার চয়ন করার আরও কোনও কারণ আছে কি? সিগমা কার্নেলের আকারের সাথে কীভাবে সম্পর্কিত? আমার সবচেয়ে ভাল সিগমা খুঁজে পাওয়া উচিত যাতে আমার কর্নেলের বাইরের সহগগুলি তুচ্ছ হয় এবং কেবল স্বাভাবিক হয়?

উত্তর:


21

সিগমা এবং ব্যাসার্ধের মধ্যে কী সম্পর্ক? আমি পড়েছি যে সিগমা ব্যাসার্ধের সমতুল্য, আমি দেখতে পাই না যে সিগমা কীভাবে পিক্সেলে প্রকাশ করা হয়। বা "ব্যাসার্ধ" কি কেবল সিগমার নাম, পিক্সেলের সাথে সম্পর্কিত নয়?

এখানে তিনটি জিনিস খেলছে। বৈকল্পিক, ( ), ব্যাসার্ধ এবং পিক্সেলের সংখ্যা। যেহেতু এই একটি 2-মাত্রিক গসিয়ান ফাংশন, এটা সহভেদাংক ম্যাট্রিক্স আলাপ জ্ঞান করে তোলে Σ পরিবর্তে। এটি যাই হোক না কেন, সেই তিনটি ধারণা দুর্বলভাবে সম্পর্কিত।σ2Σ

প্রথমত, 2-ডি গাউসী সমীকরণ দ্বারা দেওয়া হয়:

g(z)=1(2π)2|Σ|e12(zμ)TΣ1 (zμ)

যেখানে হ'ল একটি কলাম ভেক্টর যেখানে আপনার চিত্রের মধ্যে x এবং y স্থানাঙ্ক থাকে। সুতরাং, z- র = [ X Y ] , এবং μ আপনার গসিয়ান ফাংশনের গড় codifying একটি কলাম ভেক্টর, হয় এক্স এবং ওয়াই দিকনির্দেশ μ = [ μ এক্স μ Y ]zxyz- র=[এক্সY]μএক্সYμ=[μএক্সμY]

উদাহরণ:

এখন, আমাদের বলতে আমরা সহভেদাংক ম্যাট্রিক্স সেট দিন , এবং μ = [ 0 0 ] । আমি পিক্সেলের সংখ্যাটি 100 x 100 হিসাবে সেট করব । তদ্ব্যতীত, আমার 'গ্রিড', যেখানে আমি এই পিডিএফটির মূল্যায়ন করি সেখানে X এবং y উভয় ক্ষেত্রে - 10 থেকে 10 হতে চলেছে । এর অর্থ আমার কাছে গ্রিড রেজোলিউশন 10 - ( - 10 )Σ=[1001]μ=[00]100100-1010এক্সY। তবে এটি সম্পূর্ণ নির্বিচারে। এই সেটিংস সহ, আমি বামে সম্ভাব্যতা ঘনত্ব ফাংশন চিত্রটি পেয়ে যাব। এখন, আমি যদি 'বৈকল্পিক', (সত্যই, সমবায়) পরিবর্তন করি, যেমনΣ=[ 9 0 0 9 ]এবং অন্য সমস্ত কিছু একই রাখি, আমি ডানদিকে চিত্রটি পাই।10-(-10)100=0.2Σ=[9009]

এখানে চিত্র বর্ণনা লিখুন

পিক্সেল সংখ্যা এখনও x 100 উভয়ের জন্য একই , তবে আমরা বৈচিত্রটি পরিবর্তন করেছি। পরিবর্তে ধরুন আমরা একই পরীক্ষা না, কিন্তু ব্যবহার 20 এক্স 20 পরিবর্তে পিক্সেল, কিন্তু আমি এখনও থেকে দৌড়ে - 10 থেকে 10 । তারপরে, আমার গ্রিডটির রেজোলিউশন আছে 10 - ( - 10 )1001002020-1010। আমি যদি আগের মতো একই সমবায় ব্যবহার করি তবে আমি এটি পেয়েছি:10-(-10)20=1

এখানে চিত্র বর্ণনা লিখুন

এইগুলি আপনাকে কীভাবে সেই পরিবর্তনশীলগুলির মধ্যে ইন্টারপ্লে বুঝতে হবে। আপনি কোডটি পছন্দ করতে চাইলে আমি এখানেও পোস্ট করতে পারি।

আমি সিগমা কীভাবে বেছে নেব?

আপনার গাউসী ফিল্টারটির বৈকল্পিক / কোভারিয়েন্স-ম্যাট্রিক্সের পছন্দটি অত্যন্ত প্রয়োগ নির্ভর। কোন সঠিক উত্তর নেই. এটি ব্যান্ডউইথ একটি ফিল্টার জন্য চয়ন করা উচিত জিজ্ঞাসা মত হয়। আবার এটি আপনার আবেদনের উপর নির্ভর করে। সাধারণত, আপনি গাউসিয়ান ফিল্টারটি নির্বাচন করতে চান যাতে আপনি আপনার ছবিতে যথেষ্ট পরিমাণে উচ্চ ফ্রিকোয়েন্সি উপাদানগুলি সরিয়ে ফেলছেন। একটি ভাল পরিমাপ পাওয়ার জন্য আপনি যা করতে পারেন তা হ'ল আপনার চিত্রের 2D ডিএফটি গণনা করা এবং এর 2-গাউসী ইমেজের সাথে এর সহ-কার্যকারীদের ওভারলে করা। এটি আপনাকে বলবে যে কোন সহ-কার্যকারীকে ভারীভাবে শাস্তি দেওয়া হচ্ছে।

উদাহরণস্বরূপ, যদি আপনার গাউসীয় চিত্রটির এতই প্রসারিত কোনও সমবায় রয়েছে যা এটি আপনার চিত্রের অনেকগুলি উচ্চ ফ্রিকোয়েন্সি সহগকে ঘিরে রেখেছে, তবে আপনাকে এর আধ্যাত্মিক উপাদানগুলিকে আরও ছোট করে তুলতে হবে।


1
এই চিত্রগুলি সিক্যুয়াল রঙিন ম্যাপ ব্যবহার করা ভাল। জেট সবচেয়ে খারাপ।
এন্ডোলিথ

@endolith "বেটার" প্রয়োগের উপর নির্ভর করে। যখন ভিজ্যুয়াল কনট্রাস্ট বৈষম্য প্রয়োজন তখন আমি জেট ব্যবহার করি না। (গরম আরও ভাল) এখানে যদিও, বার্তাটি গাউসের আকারের মধ্যে রয়েছে, তাই জেট দিয়ে কোনও ক্ষতি হয়নি। যদিও লিঙ্ক জন্য ধন্যবাদ।
তারিন জিয়াই

2
এটি একটি সুন্দর চিন্তাভাবনা এবং সত্যিই ভাল-ভিজ্যুয়ালাইজড উত্তর! উদাহরণস্বরূপ, উপরের-বাম চিত্রটি ধরুন। এটি পরিষ্কার যে বৈকল্পিক এবং কার্নেলের আকারের সংমিশ্রণটি ব্যর্থ হবে, কারণ এটি একটি 100x100 কার্নেল যেখানে কেবলমাত্র কেন্দ্রটি 30x30 (~ 9%) শূন্য নয়।
অ্যাডাম স্মিথ

5

পরামিতি সিগমা একটি অবিচ্ছিন্ন দৃষ্টিকোণ থেকে গাউসিয়ান ব্লার সংজ্ঞায়িত করার জন্য যথেষ্ট is অনুশীলনে তবে চিত্র এবং কনভোলশন কার্নেলগুলি পৃথক disc অবিচ্ছিন্ন গাউসিয়ান কর্নেলের একটি সর্বোত্তম বিচ্ছিন্ন সাদৃশ্যটি কীভাবে চয়ন করবেন?

বৃহত্তর ব্যাসার্ধ ব্যবহার করার সময় বিচ্ছিন্ন আনুমানিকতা অবিচ্ছিন্ন গাউসিয়ান কর্নেলের কাছাকাছি হবে। তবে এটি যোগ করার সময়কালের জন্য ব্যয় করতে পারে।

আদর্শভাবে, কেউ সিগমার জন্য একটি মান নির্বাচন করবে, তারপরে এমন একটি ব্যাসার্ধ গণনা করবে যা বিশ্বাসের সাথে সম্পর্কিত ধারাবাহিক গাউসিয়ান কর্নেলকে বিশ্বস্তভাবে উপস্থাপন করতে পারে। প্রদত্ত আনুমানিক ত্রুটির জন্য, বৃহত্তর সিগমা হয়, ব্যাসার্ধটি বৃহত্তর হতে হবে।

মজার বিষয় হল এটি সঠিকভাবে পেতে এটি খুব জটিল হয়ে উঠতে পারে। গাউসিয়ান ম্যাট্রিক্স নির্মানের সময়, অবিচ্ছিন্ন কার্নেলের নমুনার সর্বোত্তম সমাধান কি আরও ভাল আনুমানিকতা রয়েছে? কাটা জন্য অ্যাকাউন্টে গণনা করা বিচ্ছিন্ন কার্নেলকে কীভাবে সাধারণ করা যায়? প্রভৃতি

একটি রেফারেন্স হিসাবে, গাণিতিকায় ফাংশন গাউসিয়ান ম্যাট্রিক্সে গাউসিয়ান বিচ্ছিন্ন ম্যাট্রিক্স গণনা করার বিভিন্ন উপায় রয়েছে, যেমন: ডিসক্রিট বেসেল অনুমান ব্যবহার করে। ডিফল্টরূপে, ব্যাসার্ধ = 2 * সিগমা, যার অর্থ সিগমা = 1 দিয়ে ম্যাট্রিক্স 5x5 হবে।


এটি বেশ পুরানো প্রশ্ন। তবে 2 * সিগমা ব্যাসার্ধের ফলাফল 9x9 এর ম্যাট্রিক্সে আসবে না?
বিভ্রান্তিকর যুক্তি

সিগমা = 1, ব্যাসার্ধ = 2 সহ @ ডিলিউশনাললোগিক, সুতরাং ম্যাট্রিক্সের আকার 4 হবে তবে বিজোড় আকারের প্রয়োজন তাই আকার 5x5। কমপক্ষে আমি এটি কীভাবে বুঝি ..
মিকা

ব্যাসার্ধটি যদি 2 হয় তবে প্রতিবেশটি মধ্য পিক্সেলটি 2 পিক্সেল বাম দিকে 2 ডানদিকে প্রসারিত করে It's
ম্যাথিয়াস ওডিসিও

2

দেখা যাচ্ছে যে পাসকালের ত্রিভুজটির সারিগুলি একটি গাউসিয়াকে প্রায় খুব সুন্দরভাবে অনুমান করে এবং পূর্ণসংখ্যার মানগুলির যোগফলের যোগফলের 2 পাওয়ার শক্তি (যা আমরা এই মানগুলিকে ঠিক পূর্ণসংখ্যা, স্থির বিন্দুর মান বা ভাসমান হিসাবে সংরক্ষণ করতে পারি) এর ব্যবহারিক সুবিধা অর্জন করে। উদাহরণস্বরূপ, বলুন যে আমরা একটি 7x7 গাউসিয়ান কার্নেল নির্মাণ করতে চাই যা আমরা পাস্কালের ত্রিভুজটির 7 তম সারিটি নীচে ব্যবহার করে এটি করতে পারি:

এখানে চিত্র বর্ণনা লিখুন

মনে রাখবেন যে পূর্ণসংখ্যার মূল্য থাকা অবস্থায় এই ফিল্টারটি কোণে সর্বনিম্ন প্রভাব ফেলে has আপনি এক্ষেত্রে আনুমানিক গাউসিয়ানদের জন্য সংশ্লিষ্ট মানক বিচ্যুতি সিগমা যা 64 / (20 * স্কয়ার্ট (2 * পাই)) = 1.276 হয় তা নির্ধারণ করতে আপনি মধ্যমানের 20/64 ব্যবহার করতে পারেন। আপনি করতে পারেন গসিয়ান গ্রাফ দেখতে এই একটি চমৎকার য়োগ্য নয়। '

সুতরাং গাউসিয়ান কার্নেলের জন্য যুক্তিসঙ্গত স্ট্যান্ডার্ড বিচ্যুতি নির্ধারণের জন্য একটি ভাল সূচনার পয়েন্ট আসে পাস্কালের ত্রিভুজ (ওরফে দ্বি-পদার্থ সহগ ) - উপরের নির্মাণ ব্যবহারের সাথে সম্পর্কিত একটি (এন + 1) এক্স (এন + 1) ফিল্টারটির জন্য

এখানে চিত্র বর্ণনা লিখুন

ওল্ফ্রাম আলফার গাউসিয়ান ম্যাট্রিক্স [3] সবেমাত্র r / 2 = 1.5 ব্যবহার করে। আশ্চর্যজনকভাবে যথেষ্ট, গাউসিয়ান ম্যাট্রিক্স [{3,1.276}] আমার হিসাবে একই 2D ফিল্টার সরবরাহ করে না এবং x, y এর জন্য -3 এবং 3 এর মধ্যে নিম্নলিখিত নয় :

এখানে চিত্র বর্ণনা লিখুন

আমি নিশ্চিত নই কেন? আমার 2 ডি ফিল্টার একটি দুর্দান্ত ফিট।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.