স্কেল এবং আবর্তন অবিস্মরণীয় বৈশিষ্ট্য বর্ণনাকারী


16

বৈশিষ্ট্য সনাক্তকরণে ব্যবহারের জন্য আপনি কিছু স্কেল এবং আবর্তনীয় আক্রমণকারী বৈশিষ্ট্য বিবরণকারী তালিকাভুক্ত করতে পারেন।

মাল্টি-ক্লাস শ্রেণিবদ্ধকারী ব্যবহার করে কোনও ইউএভি দ্বারা ক্যাপচার করা ভিডিওতে গাড়ি এবং মানুষ সনাক্ত করার জন্য অ্যাপ্লিকেশনটি।

এখনও অবধি আমি SIFT এবং MSER (যা affine invariant) এর দিকে তাকিয়ে আছি। আমি লেশের দিকেও লক্ষ্য করেছি, এলইএসএইচ স্থানীয় শক্তির মডেলের উপর ভিত্তি করে তৈরি করা হয় তবে এটি এমনভাবে গণনা করা হয় যা ঘোরানোভাবে আক্রমণকারী নয়, আমি স্থানীয় শক্তির ব্যবহার করার জন্য, একটি আবর্তিতভাবে আক্রমণকারী তৈরির উপায় নিয়ে ভাবতে চেষ্টা করেছি বৈশিষ্ট্য বর্ণনাকারী, আমি এখানে পড়েছি SIFT / SURF- এর কিছু বিনামূল্যে বিকল্প কী যা বাণিজ্যিক অ্যাপ্লিকেশনগুলিতে ব্যবহার করা যেতে পারে? , এটি "যদি আপনি আগ্রহের পয়েন্টকে ওরিয়েন্টেশন নির্দিষ্ট করে দেন এবং সেই অনুযায়ী চিত্রের প্যাচটি ঘোরান, তবে আপনি নিখরচায় আবর্তনীয় আগ্রাসন পান" তবে জানেন না যে এটি এমনকি স্বস্তিযুক্ত কিনা বা আমি কীভাবে আমার সমস্যার সাথে এটি প্রয়োগ করতে পারি, কোনও সহায়তা হবে ধন্যবাদ, ধন্যবাদ


ওপেনসিভি লাইব্রেরি থেকে ওআরবি (ওরিয়েন্টেড এফএসটি এবং ঘোরানো ব্রিআইএফ) ব্যবহার করুন।
হর্ষ ওয়ারধান

উত্তর:


9

সিআইএফটি / এসআরএফের বিকল্পগুলি হিসাবে, আপনার লিঙ্ক করা প্রশ্নটি খুব ভাল উত্তর সরবরাহ করে।

আমি আরও দুটি প্রশ্ন পড়তে পারি:

  • "আমি কীভাবে একটি দরকারী (উদাহরণস্বরূপ ঘূর্ণন আক্রমণকারী) বৈশিষ্ট্য বিবরণী তৈরি করতে পারি"?
  • "লিঙ্কিত প্রশ্ন থেকে বিবৃতি সম্পর্কে, তিনি কীভাবে বিনামূল্যে ঘূর্ণায়মান আগ্রাসনটি সম্পাদন করেন?"

বিল্ডিং বৈশিষ্ট্য বর্ণনাকারী

এটি একটি বৈধ গবেষণা বিষয়। ভাল বৈশিষ্ট্য বিবরণকারী এমন কিছু নয় যা কেবল বিকেলে যে কেউ তৈরি করতে পারে। লোকেরা নিবন্ধগুলি প্রকাশ করে যখন তারা সফলভাবে পছন্দসই বৈশিষ্ট্যগুলির সাথে বর্ণনাকারীদের মডেল করে। এটি একটি কারণ যা বর্তমানে কেবলমাত্র হাতে গোনা কয়েকটি অত্যাধুনিক বর্ণনাকারী ব্যবহৃত হয় এবং আমি আপনাকে যা করতে পরামর্শ দিই: আপনার প্রয়োজনের জন্য এমন একটি বৈশিষ্ট্য বর্ণনাকারী সন্ধান করুন

"বিনামূল্যে"

0|black->gray->white||white->gray->black|-9090

আপনি সর্বদা একই প্রভাবশালী অভিযোজন (ঘোরানো প্যাচ) সহ কোনও চিত্র প্যাচে বর্ণনাকারী গণনা করবেন এবং এইভাবে আপনি ঘূর্ণন আগ্রাসন অর্জন করতে পারেন।


4

বিনামূল্যে রোটেশনাল ইনভেরিয়েন্স পাওয়ার আরেকটি উপায় হ'ল ঘূর্ণনগতভাবে অদম্য objects উদাহরণস্বরূপ, একটি চেনাশোনা বা একটি রিং আবর্তনের জন্য অবিচ্ছিন্ন।

বৈশিষ্ট্য নিষ্কর্ষক : প্রান্ত সনাক্তকরণ চালান। NxNপিক্সেলের প্রতিটি পাড়ার জন্য , প্রান্তের দিক এবং 2D হিস্টোগ্রামের গণনা করুন। সমস্ত পয়েন্টের সন্ধান করুন যা উচ্চ মোট পরিমাণ এবং উচ্চ কৌণিক স্প্রেড রয়েছে । রেডিয়াল প্রতিসাম্য নেই এমন সমস্ত পয়েন্টগুলি সরান।

বৈশিষ্ট্য বর্ণনাকারী : প্রতিটি বৃত্তাকার বস্তুর কেন্দ্র সন্ধান করুন। যেহেতু বস্তুটি বিজ্ঞপ্তিযুক্ত, এর কোনও প্রভাবশালী গ্রেডিয়েন্ট কোণ নেই। সমস্ত কোণ সমান। সুতরাং, একটি রেডিয়াল প্রোফাইল (মেরু স্থানাঙ্কে পিক্সেল মানের যোগফল) একটি কোণ অদলীয় বর্ণনাকারী।


যাইহোক, বৈদ্যুতিন সার্কিট বোর্ডগুলিতে চেনাশোনা হিসাবে ফিডুসিয়ালস উত্পাদিত হওয়ার অন্যতম কারণ:

এখানে চিত্র বর্ণনা লিখুন


আমরা কীপয়েন্ট (বৈশিষ্ট্য) বর্ণনাকারী সম্পর্কে কথা বলছি । যদি আমরা বৈশিষ্ট্যগুলি (আগ্রহের পয়েন্টগুলি) সম্পর্কে কথা বলি , তবে বিজ্ঞপ্তিযুক্ত প্যাচগুলি সনাক্ত করা কার্যকর হতে পারে - এগুলি প্রতিটি বর্ণনাকারীর সাথে মিশ্রিত করে আবর্তিত হয়। তবে একটি বৃত্তাকার প্যাচে গণনা করা কোনও বিবরণকারী নয় - একটি কালো বৃত্তাকার অনুভূমিক ব্যাসযুক্ত একটি সাদা বৃত্ত, এবং একটি উল্লম্ব সহ একটি ঘূর্ণমানভাবে আক্রমণকারী পদ্ধতিটি ব্যবহার না করা হলে খুব আলাদা বর্ণনাকারী উত্পন্ন করবে
পেনেলোপ

@ স্পেনোলোপ, কেন নয়? নীচের বর্ণনাকারী বিবেচনা করুন - প্যাচটির একটি থাম্বনেইল এবং আপনি এটিকে অন্য বর্ণনাকারীর সাথে সাধারণ ক্রস পারস্পরিক সম্পর্কের সাথে তুলনা করুন। আপনি অন্য বস্তুর সাথে এভাবে ভুল করতে পারবেন না।
আন্দ্রে রুবস্টেইন

দুঃখিত, "প্যাচটির একটি থাম্বনেইল" বলতে আপনি কী বোঝাতে চেয়েছেন তা আমি বুঝতে পারি না? এবং বর্ণনাকারী: আপনার প্যাচকে সাধারণীকরণ কর্স-সম্পর্কিতকরণই এটিকে আবর্তিতভাবে অবিচ্ছিন্ন করে তোলে, এটি নয় যে আপনার প্যাচটি একটি রিং বা বৃত্ত ছিল।
পেনেলোপ

@ স্পেনোলোপ, আমি এখন অনুমান করি যে আমি যথেষ্ট পরিষ্কার ছিলাম না। আমি আগামীকাল এটি প্রসারিত করার চেষ্টা করব। আপনার মন্তব্যের জন্য আপনাকে ধন্যবাদ।
অ্যান্ড্রে রুবস্টেইন

এটির অপেক্ষায় :)
পেনেলোপ

1

আমি বরং KAZ / AKAZE সন্ধান করব, যা উল্লেখযোগ্য গতির সাথে সমানভাবে দুর্দান্ত পারফর্ম করে। বিকৃতকরণের মামলাগুলিও সহ্য করা হয়। ওপেনসিভি সম্প্রতি জিএসওসি 2014 এর মাধ্যমে একটি বাস্তবায়ন পেয়েছে You আপনি এটি এখানে খুঁজে পেতে পারেন ।


1

আপনি যদি লগ to পোলার স্থানাঙ্কগুলিতে (আগ্রহের বিন্দুতে উত্স সহ) কোনও বৈশিষ্ট্য বিন্দুর চারপাশে স্থানীয় প্যাচটি পুনরায় তৈরি করেন, স্কেল পরিবর্তনগুলি লগ – রেডিয়াল অক্ষের সাথে একটি অনুবাদের সাথে মিলিত হয়, তবে ঘূর্ণনগুলি অনুবাদগুলির সাথে মিলিত হয় (মোড়কের চারপাশে) কৌণিক অক্ষ বরাবর। আপনি যদি তখন দ্বি-মাত্রিক ফুরিয়ার রূপান্তর গণনা করেন তবে রেডিয়াল এবং কৌণিক দিকনির্দেশগুলিতে অনুবাদগুলি ফ্রিকোয়েন্সি ডোমেনে ফেজ শিফটে পরিণত হয়। তারপরে আপনি যদি ফুরিয়ার ট্রান্সফর্মের পরম মানটি গণনা করেন তবে পর্যায়টি সম্পূর্ণরূপে অদৃশ্য হয়ে যায় এবং মূল চিত্র প্যাচের স্কেল পরিবর্তন এবং আবর্তন অদৃশ্য হয়ে যায়। সুতরাং লগ – পুলার স্থানাঙ্কগুলিতে 2D ফুরিয়ার রূপান্তরটির পরম মান আপনার বৈশিষ্ট্য বর্ণনাকারী হবে।

ভাল, কমপক্ষে তত্ত্বে। অনুশীলনে, আপনাকে আপনার প্যাচের রেডিয়াল এক্সটেনশন সীমাবদ্ধ করতে হবে। এর অর্থ হ'ল ফুরিয়ার ট্রান্সফর্ম (যা সত্যই একটি ফুরিয়ার সিরিজ) গণনা করার আগে আপনাকে আপনার ডেটার একটি বৃহত অংশ কেটে ফেলতে হবে, সুতরাং লগ – রেডিয়াল দিক log পোলার স্থানাঙ্কের সাথে একটি অনুবাদ ঠিক ঠিক একটির সাথে মিলে না ফ্রিকোয়েন্সি ডোমেনে আর পর্বের স্থানান্তর, সুতরাং পদ্ধতিটি পুরোপুরি স্কেল-ইনগ্রেন্ট নয়। আমি সন্দেহ করি যে আপনি যদি কিছু উইন্ডো ফাংশন ব্যবহার করেন - বিচ্ছিন্নতা ছাড়াই - লগ ius ব্যাসার্ধকে সমন্বয় করে এবং রঙের তীব্রতার সাথে গুণিত করেন তবে এই সমস্যাটি কিছুটা প্রশমিত হবে।

তবে বৈশিষ্ট্য বর্ণনাকারী এটি এখনও পুরোপুরি ঘোরানো-আক্রমণকারী হওয়া উচিত।

তথ্যসূত্র: স্কেল নির্বাচন ছাড়াই স্কেল ইনভেরিয়েন্স ar


0

আপনি দ্রুত এবং ব্রিজও পরীক্ষা করতে পারেন ।


যতদূর আমি অনুসন্ধান করেছি, কেবলমাত্র বিভিন্ন ডিস্ট্রিপ্টর সংমিশ্রণে ব্যবহৃত FAST কেবল ডিটেক্টর। এবং, ওপি নিজেই যে প্রশ্নটি যুক্ত করেছে তার মধ্যে ইতিমধ্যে দ্রুত এবং ব্রিসক উল্লেখ করা হয়েছে, সুতরাং আমি মনে করি যে এই পদ্ধতিগুলি ইতিমধ্যে তার অস্তিত্ব সম্পর্কে তথ্য রয়েছে।
পেনেলোপ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.