চিত্র প্রক্রিয়াকরণে সমঝোতার জন্য অনুভূতি


9

আমি চিত্র প্রক্রিয়াকরণে কনভলশন সম্পর্কে অনেকগুলি নথি পড়েছি এবং তাদের বেশিরভাগই এর সূত্রটি সম্পর্কে কিছু অতিরিক্ত পরামিতি বলে। কোনও চিত্রকে বোঝানোর জন্য অন্তর্দৃষ্টি এবং আসল অর্থটি কেউ ব্যাখ্যা করে না। উদাহরণস্বরূপ, গ্রাফে ডার্কিভেশন অন্তর্নিহিতকরণ এটি আরও লিনিয়ার করে তোলে।

আমি মনে করি সংজ্ঞাটির দ্রুত সংক্ষিপ্তসারটি হল: সমষ্টিটি চিত্র এবং কার্নেলের মধ্যে ওভারল্যাপ বর্গক্ষেত্রকে আবার গুণফলের পরে আবার অ্যাঙ্কারে রাখে। এবং এটি আমার সাথে কোনও মানে করে না।

সমঝোতা সম্পর্কে এই নিবন্ধ অনুসারে কেন অনুগতি কিছু "অবিশ্বাস্য" জিনিস করতে পারে তা আমি কল্পনা করতে পারি না। উদাহরণস্বরূপ, এই লিঙ্কের শেষ পৃষ্ঠায় লাইন এবং প্রান্ত সনাক্তকরণ। কেবল উপযুক্ত কনভোলশন কার্নেলটি বেছে নিন দুর্দান্ত প্রভাব (লাইনটি সনাক্ত করুন বা প্রান্ত সনাক্ত করুন) করুন।

এটি কীভাবে করতে পারে সে সম্পর্কে কেউ কি কিছু অন্তর্দৃষ্টি (একটি ঝরঝরে প্রমাণ হওয়ার দরকার নেই) সরবরাহ করতে পারে?

উত্তর:


13

আমি মনে করি কনভলিউশনটি ভাবার সহজতম উপায় হ'ল কাছের পিক্সেলের ওজনের উপর ভিত্তি করে একটি পিক্সেলের মানকে একটি নতুন মানকে পরিবর্তন করার একটি পদ্ধতি হিসাবে।

বক্স ব্লার কেন এটি সহজে দেখা যায়:

_____________
|1/9|1/9|1/9|
|1/9|1/9|1/9|
|1/9|1/9|1/9|
-------------

কাজ করে। এই কার্নেলটি কনভলভ করা ছবির প্রতিটি পিক্সেল দিয়ে যাওয়া এবং পিক্সেলের নতুন মানটিকে নিজের এবং আটটি পার্শ্ববর্তী পিক্সেলের গড় তৈরি করার সমান।

যদি আপনি এটি পান তবে আপনি দেখতে পারেন কেন গাউসিয়ান ব্লার কাজ করে:

_____________________
|.01|.04|.07|.04|.01|
|.04|.16|.26|.16|.04|
|.07|.26|.41|.26|.07|
|.04|.16|.26|.16|.04|
|.01|.04|.07|.04|.01|
---------------------

এটি মূলত একই জিনিস, ব্যয় করা গড় ব্যতীত আরও নিকটবর্তী পিক্সেলের দিকে আরও বেশি দৃ .়ভাবে ওজন করা হয়। আপনি আরও দূরে সরে যাওয়ার সাথে সাথে ওজনগুলি কত দ্রুত কমে যায় তা ফাংশনটি গাউসিয়ান ফাংশন , তবে এটি ঝাপসা করার জন্য আপনাকে ফাংশনের বিশদটি জানতে হবে না।

লিঙ্কযুক্ত নিবন্ধে প্রান্ত সনাক্তকরণ কার্নেলটি যদি আপনি এটির দিকেও দীর্ঘক্ষণ তাকাচ্ছেন তবে তা বোঝা যায়:

__________
|-1|-1|-1|
|-1|.8|-1|
|-1|-1|-1|
----------

এটি মূলত বলছে যে কোনও পিক্সেলের মান এর মূল মূল্যের 8/9 তম থেকে শুরু হয়। আপনি তারপরে আপনার নতুন পিক্সেলটিতে পৌঁছানোর জন্য চারপাশের প্রতিটি পিক্সেলের মানগুলি বিয়োগ করুন।

সুতরাং যদি কোনও পিক্সেলের মান বেশি হয় এবং এর চারপাশের পিক্সেলের মানও বেশি হয় তবে তারা একে অপরকে বাতিল করে দেবে। যদি পিক্সেলের মান কম হয় এবং চারপাশের সমস্ত পিক্সেলও কম হয় তবে তারা একে অপরকে বাতিলও করে দেবে। যদি পিক্সেলের মান বেশি হয় এবং চারপাশের পিক্সেলের মান কম হয় (কোনও বস্তুর প্রান্তে পিক্সেলের মতো) তবে নতুন পিক্সেলের মান বেশি হবে।


6

সমঝোতা / ক্রসকোরিলেশন সম্পর্কে ভাবার একটি উপায় হ'ল আপনি নিজের ডেটাতে কিছু সংকেত সন্ধান করছেন। কার্নেলের মতো ডেটা যত বেশি দেখায় ফলাফলের মান তত বেশি। আমি আসলে কার্নেলের বিপরীতটি গ্রহণ করি, যেমন ক্রস-সম্পর্ক সম্পর্কিত, তবে এটি মূলত একই জিনিস।

উদাহরণস্বরূপ, আসুন ধরা যাক আপনি আপনার 1 ডি ডেটাতে দিকনির্দেশক পদক্ষেপের সন্ধান করছেন।

কার্নেল হতে পারে

[-1 1]

এবং এটি ডেটা প্রয়োগ করি

[2 2 2 2 2 1 1 1 1 1]

ফলাফল হবে

[0 0 0 0 0 1 0 0 0 0]

যা পদক্ষেপের অবস্থান সনাক্ত করে। একটি বৃহত্তর পদক্ষেপ একটি বৃহত্তর মান দিতে হবে।

এটি কাজ করে কারণ আপনি যখন কার্নেলের মধ্যে উপস্থিত একটি দ্বারা কোনও প্যাটার্নটি গুন করেন তখন আপনি উচ্চ মূল্য পান।

এজ সনাক্তকরণ (বা অন্য কোনও প্যাটার্ন সনাক্তকরণ) একইভাবে কাজ করে, উদাহরণস্বরূপ কার্নেলের সাথে

[-1 2 -1]

উচ্চতর মাত্রার বর্ধনগুলি যদি এইভাবে হয় তবে চিন্তাও করা যায়।

এটি আপনাকে কনভলিউশন ইমেজ প্রসেসিংয়ের কয়েকটি অ্যাপ্লিকেশন সম্পর্কে অন্তর্দৃষ্টি দেয়।


4

যদি আপনি মনে করেন যে কনভোলিউশনটি বোঝার জন্য কিছুটা কঠিন, আমি আপনাকে চিত্র প্রক্রিয়াকরণের ক্ষেত্রে প্রয়োগ করা গাণিতিক মুরফোলজি সম্পর্কে অনুসন্ধান শুরু করার পরামর্শ দিচ্ছি, গাণিতিক মরফোলজির পিছনে বড় ধারণাটি হ'ল আপনি "পরিবর্তন" করার জন্য কনভলিউশনের খুব কাছাকাছি একটি অপারেশন করবেন the চিত্রটির রূপচর্চা, তবে টপোলজির তথ্য ধরে রাখুন, এভাবে আপনি স্থায়ী মানবের একটি চিত্র তৈরি করতে পারেন, একটি কঙ্কাল, যা বেশ কাঠি মানুষ, ক্ষয়ের অপারেশন প্রয়োগ করার চেষ্টা করুন, তারপরে অপারেশন চালিয়ে যান, তারপরে খোলাতে যান / বন্ধ অপারেশন, আপনি বুঝতে পারবেন যে প্রতি পিক্সেল চিত্রের উপর প্রয়োগ করা কোনও মাস্ক কী করতে পারে এবং দুর্দান্ত ফলাফল অর্জনের জন্য কীভাবে এগুলি একটি বড় দৃশ্যে ব্যবহার করা যায় (শেষ ক্ষয়টি ব্যবহার করে কিছু শুরু করার জন্য স্পট সন্ধান করা), একবার once আপনি গাণিতিক মোড়বিজ্ঞান বুঝতে পারেন, বোঝাটি কিছুটা শক্ত,কারণ এটি ক্যালকুলাসের উপর ভিত্তি করে, এবং সংহত করার পরে সংজ্ঞায়িত করা হয়েছে তবে তবুও প্রচুর পরিমাণে সমঝোতা বোঝা সহজ, যেমন মিডিয়ান ব্লার, গাউসিয়ান ব্লার, শার্পেন, এজ ডিটেকশন, লেপ্লেস, গ্রেডিয়েন্ট ইত্যাদি understand

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.