বাইনারি শক্তিশালী স্বাধীন প্রাথমিক বৈশিষ্ট্যগুলি ("BRIEF") বোঝা

ব্রিআইএফ অ্যালগরিদমের বর্ণনাকারীরা একে অপরের সাথে কীভাবে মিলছে?

অন্য চিত্রটিতে টেমপ্লেট চিত্রটি কীভাবে পাওয়া যায়? আমরা কীভাবে বর্ণনাকারীদের তুলনা করব? আমি নিবন্ধটি পড়েছি কিন্তু তারা কীভাবে এটি করেছে তা বুঝতে পারি নি।

তারা লিখেছিল যে তারা হামিং দূরত্ব ব্যবহার করে বর্ণনাকারীদের তুলনা করে, তবে আলোকসজ্জা, আকার ইত্যাদির পরিবর্তনের সাথে কীভাবে আক্রমণ করা যায়?

computer-vision algorithms local-features

— Maximus
সূত্র

প্রথমত, এই কাগজে 'টেম্পলেট' বলে কিছুই নেই - কম্পিউটার ভিশনে 'টেমপ্লেট (গুলি)' শব্দের আলাদা অর্থ রয়েছে।

এই কাগজে ব্যবহৃত পদ্ধতি তুলনামূলকভাবে সোজা-এগিয়ে forward আমি তোমাদের জন্য এটা ভেঙ্গে যাক। স্থানীয় বৈশিষ্ট্যগুলি ব্যবহার করে অবজেক্ট রিকোনিশন, ইমেজ ম্যাচিং, ইমেজ সেলাই এবং এই জাতীয় অন্যান্যগুলির মতো কাজগুলি করার জন্য আপনাকে তিনটি গুরুত্বপূর্ণ কাজ করতে হবে

প্রথম গুরুত্বপূর্ণ জিনিসটি সনাক্তকরণ ction; এই পদক্ষেপে আপনি পয়েন্ট-অফ-ইন্টারেস্ট বা কীপয়েন্টগুলি সনাক্ত করতে চান এবং এর অর্থ হ'ল আপনি স্থানীয় পয়েন্টগুলি বেছে নিতে চান (মূলত ছোট প্যাচগুলি) যা আপনি ইমেজটিতে আকর্ষণীয় বলে মনে করেন, তা করার অনেকগুলি উপায় রয়েছে; এই কাগজ এই ক্ষেত্রে অবদান রাখে না। তবে, মনে হয় যে তারা এসআরএফ বৈশিষ্ট্য সনাক্তকারী এবং সেনসুর কী-পয়েন্টগুলি ব্যবহার করেন (আপনি যদি তাদের সম্পর্কে আরও জানতে চান তবে আপনি তাদের সন্ধান করতে পারেন, আমি এই পদক্ষেপের বিষয়ে কথা বলব না কারণ তারা গ্রেডিয়েন্টস এবং এর মতো বৈশিষ্ট্যগুলি ব্যবহার করে, যার অর্থ আপনার যদি ছবি থাকে তবে আকাশের মাঝামাঝি একটি বিন্দুকে আগ্রহের পয়েন্ট হিসাবে বেছে নেওয়া অসম্ভব, কারণ because পয়েন্টের চারপাশের পিক্সেলগুলি সমস্ত একই তীব্রতা, 'ব্যস্ত' জিনিসগুলি আগ্রহ পয়েন্ট হিসাবে বেছে নেওয়ার ঝোঁক রয়েছে (যেমন টেবিল / বিল্ডিং প্রান্ত / কোণ))।

সনাক্তকরণ শেষ হওয়ার পরে, বৈশিষ্ট্য বিবরণঅনুসরণ করে। আপনি চিত্রটির আকর্ষণীয় পয়েন্টগুলি জানেন এবং এখন আপনি সেগুলি বর্ণনা করতে চান (মূলত আপনি আকর্ষণীয় পয়েন্টগুলির চারপাশে পয়েন্টগুলি / প্যাচটি বর্ণনা করতে চান)। SIFT হ'ল একটি জনপ্রিয় বৈশিষ্ট্য বর্ণনাকারী। এই কাগজটিতে, তারা একটি নতুন নিয়ে আসে, যার নাম BRIEF। BRIEF তুলনার উপর ভিত্তি করে, সুতরাং আসুন আমরা আমাদের প্যাচ (50 পিক্সেল দ্বারা 50 পিক্সেল) বলে থাকি, আমরা দুটি পয়েন্ট চয়ন করি এবং দুটি পয়েন্টের তীব্রতার সাথে তুলনা করি, যদি প্রথম বিন্দু দ্বিতীয় বিন্দুর চেয়ে বড় হয়, আমরা মান নির্ধারণ করি ' 1 ', অন্যথায়' 0 ', আমরা বেশ কয়েকটি জোড়ের জন্য এটি করি এবং আমরা বুুলিয়ান মানগুলির একটি স্ট্রিং দিয়ে শেষ করি। এখন বড় প্রশ্নটি হল 'আপনি কীভাবে পয়েন্টগুলির জুড়িটি বেছে নেবেন?', কাগজে তারা 5 টি উপায় ব্যাখ্যা করেছেন, তুলনামূলকভাবে অনুরূপ, আমি প্রথমটির বর্ণনা করব। আপনি যা করেন তা কি আপনি সমান (সমান সম্ভাবনা) -S / 2 থেকে এস / 2 পর্যন্ত একটি বিন্দু চয়ন করেন, আমাদের উদাহরণে আমরা বলেছিলাম যে প্যাচের আকার 50, সুতরাং আমরা -25 থেকে 25 এর মধ্যে একটি বিন্দু বেছে নিই Ass 0,0 স্থানাঙ্কটি প্যাচটির কেন্দ্রে অবস্থিত Ass সুতরাং এখানে একটি উদাহরণ;

আমরা প্রথম জোড়টি নির্বাচন করতে চাই, প্রতিটি বিন্দুতে (এক্স, ওয়াই) স্থানাঙ্ক থাকে যাতে আমরা অভিন্নভাবে প্রথম বিন্দুর এক্স-সমন্বয় নির্বাচন করি, তারপরে প্রথম পয়েন্টের ওয়াই-স্থানাঙ্ক, ধরে নেওয়া যাক এটি (10, -1) , এখন দ্বিতীয় পয়েন্ট; আমরা দ্বিতীয় পয়েন্টের জন্য এক্স-স্থানাঙ্ককে অভিন্নভাবে নির্বাচন করি এবং দ্বিতীয় পয়েন্টের জন্য ওয়াই-স্থানাঙ্ক, ধরে নিই এটি (-2,20), এখন আমরা প্রতিটি পয়েন্টের জন্য তীব্রতা মান পাই এবং দেখি কোনটির বৃহত্তর তীব্রতা মান রয়েছে - যদি প্রথমটি বড় হয় আমরা প্রথম বুলিয়ান মানকে '1' হিসাবে নির্ধারণ করি, যদি না হয়, তবে আমরা '0' বরাদ্দ করি। আমরা এটি বহু জোড়ের জন্য করি এবং আমরা বুুলিয়ান মানগুলির একটি ভেক্টর দিয়ে শেষ করি।

* খুব গুরুত্বপূর্ণ বিষয়: আমি এটি কাজ করার জন্য ধরে নিচ্ছি, এলোমেলো জেনারেটরের আগে আপনাকে একটি বীজ মান নির্দিষ্ট করতে হবে। এর অর্থ হ'ল আপনি প্রতিটি প্যাচের জন্য একই মানগুলি চয়ন করতে চান - এটি অত্যন্ত গুরুত্বপূর্ণ কারণ আপনি যখন প্যাচগুলি তুলনা / ম্যাচ করবেন তখন পুরো সিস্টেমটি ঠিক একইভাবে না বাছাই করা হলে তা ভেঙে যাবে। - আশা করি আপনি যখন ম্যাচের ধাপটি পড়বেন তখন এটি উপলব্ধি হয়ে যাবে।

সুতরাং, আমরা প্রতিটি আগ্রহের পয়েন্টের জন্য এটি করি যা সনাক্তকারী দ্বারা সনাক্ত করা হয়েছিল। প্রতিটি আগ্রহের পয়েন্টের জন্য, আমরা বুলিয়ান মানগুলির একটি ভেক্টর পাব।

এখন দুটি চিত্রের মিলের জন্য ( তৃতীয় ধাপ; মিল ), আমরা অন্য চিত্রের জন্য ঠিক একই জিনিসটি করি, আমরা সনাক্ত করি এবং তারপরে BRIEF ব্যবহার করে বর্ণনা করি। উদাহরণস্বরূপ বলা যাক যে প্রতিটি প্রতিচ্ছবিতে আমাদের 10 টি আগ্রহের পয়েন্ট রয়েছে (প্রতিটি চিত্রের মধ্যে 10 টি সবচেয়ে আকর্ষণীয় পয়েন্ট পেলে এটি সর্বদা কাজ করতে পারে), উদাহরণস্বরূপ 50 টি জোড়া ব্যবহার করে আমরা প্রতিটি প্যাচ বর্ণনা করতে BRIEF ব্যবহার করি, সুতরাং প্রতিটি চিত্র বর্ণিত হবে 50 বুলিয়ান মানগুলির 10 ভেক্টর।

দুটি চিত্রের তুলনা করতে আমরা প্রথম চিত্র থেকে দ্বিতীয় চিত্র থেকে একে অপরের ভেক্টরের প্রতিটি ভেক্টরের নিকটতম প্রতিবেশী খুঁজে পাই find আমরা হামিং দূরত্ব ব্যবহার করি যা বেশ দ্রুত, হ্যামিং দূরত্বের উদাহরণ

হামিং দূরত্ব ((0, 1, 1), (0, 0, 0)) = 2

হামিং দূরত্ব ((0, 1, 1), (0, 1, 1)) = 0

হামিং দূরত্ব ((0, 1, 1), (1, 0, 0)) = 3

হামিং ডিস্টেন্স ((0, 1, 1), (1, 1, 1)) = 1

মূলত কত ভুল চিঠিপত্র

আশা করি এইটি কাজ করবে

— রোরোনোয়া জোরো
সূত্র

আপনাকে অনেক ধন্যবাদ, আমি অ্যালগরিদম বুঝতে পারি। তবে আমার এখনও কিছু প্রশ্ন আছে, অ্যাফাইন, দৃষ্টিভঙ্গি পরিবর্তন এবং আলোকসজ্জার পরিবর্তনগুলি কীভাবে? আলোকসজ্জার পরিবর্তন বা দৃষ্টিকোণ পরিবর্তন হলে বিট স্ট্রিং কি একইরকম হবে?

— ম্যাক্সিমাস

যদি আলোকসজ্জা-পরিবর্তনের পরিমাণ সমস্ত পিক্সেলের সমান হয় তবে হ্যাঁ এটি এখনও কাজ করবে, যদি এটি পিক্সেল থেকে পিক্সেল থেকে আলাদা হয় (কিছু পিক্সেল আলোকসজ্জা বৃদ্ধি পায়, অন্য হ্রাস পায়), তবে এটি একটি সমস্যা। আত্মীয়তা ঠিক মত কাজ করছে বলে মনে হচ্ছে (তাদের ফলাফলের ভিত্তিতে) তবে এটি অবশ্যই এমন এক পর্যায়ে পৌঁছে যাবে যেখানে এটি কাজ করা বন্ধ করে দেয় (আসলে তাদের ফলাফলগুলিতে (চিত্র 3) তারা দেখায় যে - আপনি চিত্রগুলি ডাউনলোড করতে পারেন এবং ওয়াল 1 কি দেখুন | 2, ওয়াল 1 | 3 এর সাথে সম্পর্কিত)। তাদের পদ্ধতিটি ঘূর্ণন আক্রমণকারী নয় (এটি দেখতে এতটা কঠিন নয়) এবং তারা স্পষ্টভাবে এটি উল্লেখ করে।

— রোরোনোয়া জোরো

আপনার ব্যাখ্যার জন্য ধন্যবাদ Y আমি সত্যিই খুব ভাল ব্রাইএফ বর্ণনাকারী বুঝতে।