হারিস কর্নার পয়েন্ট সনাক্তকরণের গণিত


23

এটি হ্যারিস কোণার সনাক্তকরণের জন্য গাণিতিক প্রকাশ:

এটি হ্যারিস কোণার সনাক্তকরণের জন্য গাণিতিক প্রকাশ ...

তবে আমার নিম্নলিখিত সন্দেহ আছে:

  1. এবং এর শারীরিক তাত্পর্য কী ? অনেক রেফারেন্স বলে যে এটি সেই परिमाण যা উইন্ডো স্থানান্তরিত করেছিল। উইন্ডোটি কতটা স্থানান্তরিত হয়? একটি পিক্সেল বা দুটি পিক্সেল?ভি ডাব্লুuvw
  2. উইন্ডো দ্বারা আচ্ছাদিত পিক্সেল পজিশনের উপরে সংক্ষেপটি কি?
  3. সহজেই ধরে , একক পিক্সেলের তীব্রতা বা কেন্দ্রের সাথে সাথে উইন্ডোর তীব্রতার সংমিশ্রণ ?আমি ( x , y ) ( x , y ) ( x , y )w(x,y)=1I(x,y)(x,y)(x,y)
  4. উইকির মতে তারা বলে যে চিত্রটি 2D, আমি দ্বারা চিহ্নিত করা হয়েছে এবং তারপরে অঞ্চলটির উপর একটি চিত্র প্যাচ বিবেচনা করতে বলে , তারপরে স্বরলিপিটি ব্যবহার করুনআমি ( x , y )(x,y)I(x,y)

আমি গাণিতিক ব্যাখ্যা উপলব্ধি করার জন্য এটি বিভ্রান্তিকর হয়ে উঠছি। কারও ধারণা আছে?


2
হ্যারিস কর্নার ডিটেক্টরটিতে এই বক্তৃতাটি দেখুন। এটি খুব স্পষ্ট: youtube.com/watch?v=P35WsRDnTsU&t=41m12s

আমি আমার ব্যক্তিগত ব্লগে একটি পোস্ট লিখেছি যা উপরের বক্তৃতার উপর ভিত্তি করে। matlabcorner.wordpress.com/2012/11/17/…
আন্দ্রে রুবস্টেইন

উত্তর:


31

এই সূত্রটির অর্থটি বেশ সহজ। কল্পনা করুন যে আপনি একটি চিত্রের দুটি একই আকারের ছোট ছোট অঞ্চল গ্রহণ করেছেন, নীল একটি এবং লাল একটি:

এখানে চিত্র বর্ণনা লিখুন

উইন্ডো ফাংশনটি লাল আয়তক্ষেত্রের বাইরে 0 সমান (সরলতার জন্য, আমরা ধরে নিতে পারি যে উইন্ডোটি লাল আয়তক্ষেত্রের মধ্যে কেবল ধ্রুবক)। সুতরাং উইন্ডো ফাংশনটি আপনাকে বেছে নিতে পারে যে পিক্সেলগুলি দেখতে চান এবং প্রতিটি পিক্সেলের তুলনামূলক ওজন নির্ধারণ করে। (গাউসীয় উইন্ডোটি সর্বাধিক সাধারণ, কারণ এটি ঘূর্ণমানগতভাবে প্রতিসম, এটি গণনার পক্ষে দক্ষ এবং উইন্ডোর কেন্দ্রের নিকটবর্তী পিক্সেলগুলিকে জোর দেয়)) নীল আয়তক্ষেত্রটি (ইউ, ভি) দ্বারা স্থানান্তরিত হয়।

এরপরে আপনি চিত্রের অংশগুলির মধ্যে লাল এবং নীল চিহ্নিত বর্গাকার পার্থক্যের যোগফল গণনা করুন, অর্থাত আপনি পিক্সেল দ্বারা সেগুলি পিক্সেলটি বিয়োগ করুন, পার্থক্যটি বর্গ করুন এবং ফলাফলটির সমষ্টি করুন (ধরে নিবেন, সরলতার জন্য যা আমরা যে অঞ্চলটিতে দেখছি তাতে উইন্ডো = 1 এ)। এটি আপনাকে প্রতিটি সম্ভাব্য (ইউ, ভি) -> ই (ইউ, ভি) এর জন্য একটি নম্বর দেয়।

আসুন দেখি কী হয় যদি আমরা তা ইউ / ভি এর বিভিন্ন মানের জন্য গণনা করি:

প্রথমে v = 0 রাখুন:

এখানে চিত্র বর্ণনা লিখুন

এটি কোনও আশ্চর্য হওয়া উচিত নয়: যখন চিত্রগুলির অংশগুলির মধ্যে অফসেট (ইউ, ভি) 0 হয় তখন পার্থক্যটি সর্বনিম্ন হয় কারণ আপনি দুটি প্যাচের মধ্যবর্তী দূরত্ব বাড়ানোর সাথে সাথে স্কোয়ার পার্থক্যের যোগফলও বৃদ্ধি পায়।

আপনার = 0 রাখা:

এখানে চিত্র বর্ণনা লিখুন

প্লটটি দেখতে অনুরূপ, তবে আপনি দুটি দিকের অংশের মধ্যে বর্গক্ষেত্রের পার্থক্যের যোগফল যখন প্রান্তের দিকে নীল আয়তক্ষেত্রটি স্থানান্তরিত করেন তখন অনেক ছোট হয়।

E এর সম্পূর্ণ প্লট (ইউ, ভি) এর মতো দেখাচ্ছে:

এখানে চিত্র বর্ণনা লিখুন

প্লটটি কিছুটা "গিরিখাত" এর মতো দেখাচ্ছে: আপনি যদি গিরিটির দিক থেকে চিত্রটি স্থানান্তর করেন তবে কেবলমাত্র একটি সামান্য পার্থক্য রয়েছে। কারণ এই চিত্র প্যাচের একটি প্রভাবশালী (উল্লম্ব) ওরিয়েন্টেশন রয়েছে।

আমরা আলাদা ইমেজ প্যাচের জন্য একই কাজ করতে পারি:

এখানে চিত্র বর্ণনা লিখুন

এখানে, ই (ইউ, ভি) এর প্লটটি আলাদা দেখাচ্ছে:

এখানে চিত্র বর্ণনা লিখুন

আপনি কোন উপায়ে প্যাচটি স্থানান্তরিত করবেন না, এটি সর্বদা আলাদা দেখায়।

সুতরাং ফাংশন E (u, v) এর আকারটি আমাদের চিত্র প্যাচ সম্পর্কে কিছু বলে

  • যদি ই (ইউ, ভি) সর্বত্র 0 এর কাছাকাছি থাকে তবে আপনি যে চিত্র প্যাচটি দেখছেন তাতে কোনও টেক্সচার নেই
  • যদি ই (ইউ, ভি) "ক্যানিয়ন আকৃতির" হয়, প্যাচের একটি প্রভাবশালী অভিযোজন রয়েছে (এটি একটি প্রান্ত বা টেক্সচার হতে পারে)
  • যদি ই (ইউ, ভি) "শঙ্কু-আকৃতির" হয়, প্যাচটির টেক্সচার রয়েছে তবে প্রভাবশালী অভিযোজন নেই। এই ধরণের প্যাচটি কর্নার-ডিটেক্টর খুঁজছে।

অনেক উল্লেখ বলে যে এটি সেই মাত্রা যা দ্বারা উইন্ডো 'ডাব্লু' স্থানান্তরিত হয়েছিল ... সুতরাং উইন্ডোটি কতটা স্থানান্তরিত হবে? এক পিক্সেল ... দুটি পিক্সেল?

সাধারণত, আপনি মোটেই ই (ইউ, ভি) গণনা করেন না। আপনি কেবল (u, v) = (0,0) এর আশেপাশে এর আকারে আগ্রহী। সুতরাং আপনি কেবল ই (ইউ, ভি) এর কাছাকাছি (0,0) এর টেলর সম্প্রসারণ চান যা এটির "আকৃতি" সম্পূর্ণরূপে বর্ণনা করে।

উইন্ডো দ্বারা আচ্ছাদিত পিক্সেল পজিশনের উপরে সংক্ষেপটি কি?

গাণিতিকভাবে বলতে গেলে, সমস্ত পিক্সেলের উপরের যোগফলের সীমা ছাড়িয়ে দেওয়া আরও মার্জিত। ব্যবহারিকভাবে বলতে গেলে যেখানে উইন্ডো 0 আছে সেখানে পিক্সেল যোগ করার কোনও মানে নেই।


একটি টন নিকিকে থ্যাঙ্কস ....
ঘোরাঘুরি_মাজ

2
আমি জানতাম আপনি এখানে একটি দুর্দান্ত উত্তর পাবেন, @rotating_image
করলফিলিপ

থ্যাঙ্কস করলফিলিপ ..
ঘূর্ণায়মান_মেজ

1
এক মিলিয়ন কোটি টাকা!
ফোনন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.