সিআইএফটি বর্ণনাকারী গল্পটির পেছনের গল্পটি কী?


9

নিম্নলিখিত 2004 লোভের কাগজ ( http://www.cs.ubc.ca/~lowe/papers/ijcv04.pdf ) থেকে প্রাপ্ত।

একটি সুস্পষ্ট পদ্ধতি হ'ল যথাযথ স্কেলে কীপয়েন্টের আশেপাশের স্থানীয় চিত্রের তীব্রতা নমুনা করা এবং এটি একটি স্বাভাবিকতর পারস্পরিক সম্পর্কের পরিমাপ ব্যবহার করে মেলাতে। যাইহোক, চিত্র প্যাচগুলির সহজ পারস্পরিক সম্পর্কগুলি এমন পরিবর্তনগুলির ক্ষেত্রে অত্যন্ত সংবেদনশীল যা আফ্রিকান বা 3 ডি ভিউপয়েন্ট পরিবর্তন বা অ-অনমনীয় বিকৃতকরণগুলির মতো নমুনাগুলির অনিবন্ধির কারণ। এডেলম্যান, ইন্টেরেটর এবং পোগিও (1997) এর দ্বারা আরও ভাল পদ্ধতির প্রদর্শিত হয়েছে। তাদের প্রস্তাবিত প্রতিনিধিত্ব জৈবিক দৃষ্টিভঙ্গির মডেল, বিশেষত প্রাথমিক ভিজ্যুয়াল কর্টেক্সের জটিল নিউরনের উপর ভিত্তি করে তৈরি হয়েছিল।এই জটিল নিউরনগুলি একটি নির্দিষ্ট অভিযোজন এবং স্থানিক ফ্রিকোয়েন্সিতে গ্রেডিয়েন্টকে প্রতিক্রিয়া জানায়, তবে রেটিনার উপর গ্রেডিয়েন্টের অবস্থানটি নির্দিষ্টভাবে স্থানীয়করণের পরিবর্তে ছোট্ট গ্রহণযোগ্য fi বড়ের উপরে স্থানান্তরিত হওয়ার অনুমতি দেয়। এডেলম্যান এট আল। অনুমান করা হয়েছিল যে এই জটিল নিউরনের কাজটি বিভিন্ন দৃষ্টিকোণ থেকে 3 ডি অবজেক্টের মিল এবং স্বীকৃতি দেওয়ার অনুমতি দেয়।

আমি SIFT বর্ণনাকারী বোঝার চেষ্টা করছি am আমি পূর্বের পর্যায়ে (কীপয়েন্ট ডিটেক্টর) বুঝি।

কেন এটি সেভাবে বাস্তবায়ন করা হয় তা আমি জানি না। আমি গল্পটির পিছনের গল্পটি জানতে চাই।

উত্তর:


1

বর্ণনাকারী a থেকে প্রাপ্ত 64×64 প্রাপ্ত স্কেল এ আগ্রহের পয়েন্ট

এটি এই বিভক্ত হবে 64×64 অঞ্চল থেকে 16×16 প্যাচগুলি যা 16 প্যাচগুলিতে নেতৃত্ব দেয়।

প্রতিটি প্যাচের জন্য আমরা গ্রেডিয়েন্টগুলি গণনা করি এবং তারপরে গ্রেডিয়েন্টগুলির প্রভাবশালী দিক খুঁজে পাই (যার কিছু বিশদ রয়েছে), তারপরে প্রভাবশালী দিকটি রেফারেন্স দিক হিসাবে গ্রহণ করে আমরা 360 ডিগ্রি 8 টি কৌণিক অঞ্চলে বিভক্ত করব যার প্রত্যেকটিতে 45 ​​ডিগ্রি থাকবে, তার পরে সমষ্টি হবে প্রতিটি কোণার অঞ্চলে থাকা প্রতিটি গ্রেডিয়েন্টের প্রস্থতা।

আমরা এটিকে ডিস্ট্রিবিউশন বা গ্রেডিয়েন্ট দিকের ৮ টি বাইন হিস্টগ্রাম হিসাবে বিবেচনা করতে পারি (শক্তিশালী গ্রেডিয়েন্টগুলির বিবেচনায় আমাদের কাছে বিতরণের গণনায় উচ্চতর ওজন সহ তাদের ব্যবহার করতে হবে যাতে আমরা তাদের দৈর্ঘ্যকে তাদের ওজন হিসাবে ব্যবহার করি যা তাদের দৈর্ঘ্যের উপরে যোগ করতে পারে)। তারপরে আমরা এই হিস্টোগ্রামগুলি স্বাভাবিক করব।

প্রতিটি প্যাচটির শেষে আমাদের কাছে একটি 8 টি হিস্টোগ্রাম রয়েছে এবং আমাদের 16 টি প্যাচ রয়েছে যা 128 নম্বর বর্ণনাকারীর দিকে নিয়ে যায়।

প্রভাবশালী দিক আবিষ্কার করে আমাদের বর্ণনাকারীও আবর্তনকারী হয়ে উঠেছে। গ্রেডিয়েন্টগুলি ব্যবহার করে আমাদের বর্ণনাকারী বেসলাইন আলোকসজ্জার বিষয়ে অদম্য হয়ে ওঠে এবং প্রাপ্ত হিস্টোগ্রামগুলিকে সাধারণীকরণের মাধ্যমে আমাদের বর্ণনাকারী চিত্রের বিপরীতে পরিবর্তিত হয়ে ওঠে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.