হ্যারিস কোণে অবস্থিত ভিজ্যুয়াল বৈশিষ্ট্যগুলির জন্য কীভাবে অষ্টভাল এবং আকার অনুমান করা যায়


9

আমি বর্তমানে ভিজ্যুয়াল ফিচারের মিলের ভিত্তিতে ওপেনসিভি দ্বারা সরবরাহ করা বেশ কয়েকটি ফিচার ডিটেক্টরগুলির পারফরম্যান্সের সাথে কাজ করছি এবং তুলনা করছি।

আমি SIFT বর্ণনাকারী ব্যবহার করছি । এমএসইআর এবং ডজির (সিআইএফটি) বৈশিষ্ট্যগুলি সনাক্ত করার সময় আমি সন্তোষজনক মিলটি ( খারাপ ম্যাচগুলি প্রত্যাখ্যান করার পরে ) অর্জন করেছি

বর্তমানে, আমি তুলনা পেতে জিএফটিটি (ট্র্যাক্ট থেকে ভাল বৈশিষ্ট্যগুলি - হ্যারিস কর্নার) এর সাথে আমার কোডটি পরীক্ষা করছি এবং চূড়ান্ত অ্যাপ্লিকেশনটিতে, জিএফটিটি বৈশিষ্ট্যগুলির একটি সেট ভিজ্যুয়াল বৈশিষ্ট্য ট্র্যাকিং প্রক্রিয়া থেকে পাওয়া যাবে।

আমি ব্যবহার করছি cv::FeatureDetector::detect(...)যা আমাকে সনাক্ত করা বৈশিষ্ট্য / কীপয়েন্টস / আগ্রহের অঞ্চলগুলিতেstd::vector<cv::KeyPoint> ভরাট করে । গঠন সম্পর্কে বৈশিষ্ট্যের অবস্থান সম্পর্কে মৌলিক তথ্য, সেইসাথে তথ্য ও যা keypoint সনাক্ত করা হয়েছে।cv::KeyPointsizeoctave

জিএফটিটি সহ আমার প্রথম ফলাফলগুলি ভয়ানক ছিল যতক্ষণ না আমি বিভিন্ন ধরণের বৈশিষ্ট্যগুলিতে আদর্শ sizeএবং octaveপরামিতিগুলি তুলনা করি :

  • MSER আকার নির্ধারণ করে (10 এবং 40px এর মধ্যে) এবং অষ্টকটি 0 এ চলে যায়
  • ডগ (SIFT) আকার এবং অষ্টক উভয় সেট করে ( আকার 20/40 এর মধ্যে / অকটভের অনুপাত)
  • জিএফটিটি প্যারামিটারগুলি সর্বদা : আকার = 3 , অকটভ = 0

আমি অনুমান করি যে কারণ জিএফটিটি বৈশিষ্ট্যগুলির প্রাথমিক উদ্দেশ্যটি ম্যাচিংয়ে নয় কেবল ট্র্যাকিংয়ে ব্যবহৃত হয়েছিল। এটি মিলে যাওয়া ফলাফলের নিম্ন মানের ব্যাখ্যা করে, যেহেতু এই জাতীয় ক্ষুদ্র বৈশিষ্ট্যগুলি থেকে বর্ণিত বর্ণনাকারীরা ছোট, 1-পিক্সেল শিফট সহ অনেক কিছুতে বৈষম্যমূলক এবং আক্রমণকারী হওয়া বন্ধ করে দেয়।

আমি নিজে সেট করেন তাহলে sizeএর GFTT করার 10 - 12 , আমি ভালো ফল, খুব ব্যবহার করে যখন অনুরূপ পেতে MSER বা কুকুর (টালা)

আমার প্রশ্ন হ'ল 10-দেখুন-যদি-এটি-এর কাজ করে-এর চেয়ে কতটা বাড়ানো যায় size(এবং / অথবা octave) আরও কত নির্ধারণ করা যায় তার আরও ভাল উপায় ? আমি hardcoding এড়াতে চান যদি সম্ভব বৃদ্ধি এবং এটা প্রোগ্রামেটিক্যালি নির্ধারণ, কিন্তু hardcoding ঠিক আছে আমি নতুন আমার পছন্দগুলি ব্যাক আপ কিছু কঠিন আর্গুমেন্ট আছে যতদিন / বৃদ্ধি / প্রাক্কলন অ্যালগরিদমsizesizesizesize


1
আরে @ পেনেলোপ: এই লিঙ্কটি পরীক্ষা করে দেখুন এই লোকটি ইতিমধ্যে কিছু ভাল কাজ করেছে computer

@ সিস্তু হে যা দেখতে খুব সাধারণ একটি সাধারণ ক্ষেত্রে বর্ণনাকারীদের তুলনায় খুব ভাল, এবং পরিকল্পনাকারী বস্তু সহ, তবে আমি নির্দিষ্ট ধরণের চিত্রগুলিতে কাজ করছি এবং আমার নিজের পরীক্ষা করা দরকার। এছাড়াও, "আমার বিভিন্ন ধরণের ডিক্রিপটরের পারফরম্যান্সের সাথে তুলনা করার জন্য রেফারেন্স উপকরণগুলি প্রয়োজন" এর চেয়েও প্রশ্নটি আরও নির্দিষ্ট ছিল। এটি যদিও একটি দুর্দান্ত লিঙ্ক, এটি পরীক্ষা করে দেখবে।
পেনেলোপ

উত্তর:


4

আমি নিশ্চিত নই যে আপনার সুনির্দিষ্ট প্রশ্নের আসলে একটি ভাল প্রতিক্রিয়া আছে: এসআইএফটি এবং এসআরএফের স্কেল-স্পেস জিনিসটি একটি কোণার মতো কীপয়েন্টের আশেপাশের "ভাল" প্রাসঙ্গিক আকারটি স্বয়ংক্রিয়ভাবে অনুমান করার জন্য তৈরি করা হয়েছিল (এটি ভাল বৈশিষ্ট্যগুলি কী ট্র্যাক করা হয়)।

এখন, আরও ইতিবাচক উত্তরগুলি হ'ল:

  • কী-পয়েন্টস এবং ভাল মিলগুলির একটি ডেটাবেস তৈরি করুন (উদাহরণস্বরূপ স্কোয়ার ক্যালিব্রেশন প্যাটার্ন ব্যবহার করে) এবং সঠিক আকারটি খুঁজতে এই ডাটাবেসে একটি স্বয়ংক্রিয় পারফরম্যান্স মূল্যায়ন তৈরি করুন। এই টাস্কটি আসলেই স্বয়ংক্রিয়ভাবে চালিত হতে পারে (পিক্স মিলের মূল্যায়নের বিষয়ে মিকোলাজকিজিক এবং শ্মিডের কাজ দেখুন)

  • আপনার ভাল বৈশিষ্ট্যগুলি ইমেজ পিরামিডে এম্বেড করুন যাতে তাদের সাথে কোনও ধরণের স্কেল যুক্ত থাকে। আপনি মাল্টি-স্কেল FAST এবং হ্যারিসের আগ্রহের বিষয়গুলিতে রেফারেন্স সন্ধান করতে পারেন, যা এই পদ্ধতির সাথে খুব সামঞ্জস্যপূর্ণ কিছু করে।

সর্বাধিক ব্লকের আকার অনুসন্ধানের জন্য, আপনি নিজের ছবিগুলির অনুমানগুলি একটি বাক্সে অস্পষ্টতার সাথে গণনা করতে পারেন (যা ব্লকসাইজ অপারেটরটি কমবেশি কম করে) এবং কোণটি অদৃশ্য হয়ে গেলে দেখুন। তবে খেয়াল করুন যে আরও অস্পষ্টতা কোণারটিকে তার আসল অবস্থান থেকে দূরে সরিয়ে নিয়েছে।

যদি আপনি সত্যিই কিছু দ্রুত এবং মলিন সংশোধন খুঁজছেন, 5x5 এবং 11x11 (স্টেরিও ব্লক ম্যাচিংয়ে ব্যবহৃত সাধারণ আকার) এর মধ্যে মাপ চেষ্টা করুন। যদি আপনি কোনও বৌদ্ধিকভাবে সন্তুষ্ট মানদণ্ডের সন্ধান করে থাকেন তবে আপনার আওয়াজ স্তরের অধীনে দুটি বৈশিষ্ট্য পয়েন্টের ভাল মিলের সম্ভাবনা সর্বাধিক করার চেষ্টা করুন।


আমি এমন একটি সমাধান খুঁজছিলাম যা আপনার প্রস্তাবিত কিছুটা দ্রুত এবং ময়লা ছিল। আমার কীপয়েন্টগুলি উত্তোলন করা এবং কোনও কিছুর সাথে মিলে যাওয়ার পরে আমি কেবল আবহাওয়া নির্ধারণ করতে পারি যে ম্যাচটি ভাল বা খারাপ। এমনকি যদি আমি এগুলি সম্পূর্ণরূপে এলোমেলোভাবে মিলে যাই তবে আমি কিছু ভাল ম্যাচ পাই - তাই আপনার প্রথম পরামর্শটি তেমন সহায়ক নয়। দ্বিতীয় অংশ হিসাবে, আরও দ্রুত এবং নোংরা: আমি জানি যে কোনও নিখুঁত প্যারামিটার নেই, তবে যেমনটি আমি বলেছি, আকারটি 12-এ বাড়ানো সাহায্য করেছে - গুণটি সিআইএফটি এবং এমএসইআর মেলানোর সাথে তুলনীয় ছিল। আমার 100 বা 34 বা তারও বেশি 12 বাছাই করার কোনও যুক্তি নেই ...
পেনেলোপ

0

আপনাকে ডিটেক্টরগুলির সেরা পরামিতিগুলি নির্ধারণে সহায়তা করতে, ওপেনসিভিতে সেই উদ্দেশ্যে এজাস্টার অ্যাডাপ্টার রয়েছে । আমি নিজে এটি কখনও ব্যবহার করি নি তবে পরামিতিগুলি অগ্রগতিগতভাবে নির্ধারণ করার এটি সম্ভবত স্ট্যান্ডার্ড উপায়। এও সচেতন থাকুন যে কীপয়েন্টগুলিতে বেশ কয়েকটি বৈশিষ্ট্য থাকলেও সমস্ত অ্যালগরিদমে সমস্ত ধারণা নেই। যেহেতু কীপয়েন্ট স্ট্রাকচারটি ডিফেরেন্ট অ্যালগরিদমগুলির জন্য ব্যবহৃত হয়, এতে সমস্ত ক্ষেত্র রয়েছে তবে কখনও কখনও সেগুলি ব্যবহার করা হয় না, এজন্য আপনি সেই অষ্টকটি = 0 পান; আইএমও।


আমি জানি যে কিছু ধরণের বৈশিষ্ট্যগুলি কখনও কখনও কোনও উদ্দেশ্যে সর্বোত্তম ধরণের হয় না তবে সাম্প্রতিক কাজগুলিতে এমন পদ্ধতির চেষ্টা করা হয়েছে যেখানে তারা 1 টিরও বেশি ভিফিয়ার্স / আগ্রহের অঞ্চল ব্যবহার করে এবং কোনও একক প্রকারের চেয়ে সংমিশ্রণের সাথে আরও ভাল ফলাফল অর্জন করে এটি নিজেই (আপনি আগ্রহী হলে আমি লিঙ্কগুলিতে যুক্ত করতে পারি)। এছাড়াও, আমি যা করছি তা হ'ল কমপক্ষে অংশ গবেষণা, সুতরাং বিভিন্ন কীপয়েন্ট টাইপের সাহায্যে প্রাপ্ত ফলাফলগুলি পরীক্ষা করে দেখার এবং মূল্যায়ণ করা হ'ল আমার কী করা উচিত, এমনকি যদি সেগুলির ফলাফলগুলির মধ্যে কিছু স্টেট অফ দ্য-অফ-দ্য- শিল্প. আমি অ্যাডজাস্টার অ্যাডাপ্টারটি সন্ধান করব, ধন্যবাদ
পেনেলোপ

আমি কেবল ইন্টারফেসটি সরবরাহ করে ফাংশনটি দেখেছি। এটি কেবল সনাক্তকারী সনাক্তকারী বৈশিষ্ট্যের সংখ্যা বাড়াতে বা হ্রাস করতে পারে। তদতিরিক্ত, সনাক্ত করা বৈশিষ্ট্যগুলির সাথে আমার কোনও সমস্যা নেই। আমি তাদের আকারটি সামঞ্জস্য করার একটি উপায় চাই যাতে তারা মেলাতে আরও ভালভাবে ব্যবহার করতে পারে (আকারটি 10-এ বাড়িয়ে দেয় তবে এটি পছন্দ করার জন্য আমার কোনও কংক্রিট (পর্যাপ্ত) যুক্তি নেই)
পেনেলোপ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.