আপনি যদি কোনও এসভিএম বাস্তবায়ন করতে পারেন তবে আপনি বৈশিষ্ট্যগুলিকে পরিমাণ দিতে পারেন। :)
সাধারণত বৈশিষ্ট্যগুলি কে-মানে ক্লাস্টারিং ব্যবহার করে কোয়ান্টাইজ করা হয়। প্রথমে আপনি সিদ্ধান্ত নিন যে আপনার "শব্দভান্ডার আকার" কী হওয়া উচিত (200 "ভিজ্যুয়াল শব্দগুলি বলুন") এবং তারপরে আপনি এই সংখ্যাটির ক্লাস্টার (200) এর জন্য কে-মানে ক্লাস্টারিং চালাবেন। SIFT বর্ণনাকারী হ'ল 128 টি উপাদানগুলির ভেক্টর, অর্থাৎ 128-মাত্রিক স্থানের পয়েন্ট। সুতরাং আপনি অন্যান্য পয়েন্টগুলির মতো এগুলিও ক্লাস্টার করার চেষ্টা করতে পারেন। আপনি ব্যাগ-অফ-বৈশিষ্ট্যগুলি ব্যবহার করে শ্রেণিবদ্ধকরণ করতে চান তার অনুরূপ আপনি প্রচুর সংখ্যক চিত্র থেকে SIFT বর্ণনাকারী বের করেন। (আদর্শভাবে এটি চিত্রের একটি পৃথক সেট হওয়া উচিত, তবে অনুশীলনে লোকেরা প্রায়শই কেবল তাদের প্রশিক্ষণ চিত্রের সেট থেকে বৈশিষ্ট্যগুলি পান Then) তারপরে আপনি কে-মানে এই 200 টি (বা যাই হোক না কেন) ক্লাস্টারে বিভক্ত করতে SIFT বর্ণনাকারীর এই বিশাল সেটটিতে ক্লাস্টারিং চালান run , অর্থাত্ একটি ক্লাস্টারে প্রতিটি বর্ণনাকারী বরাদ্দ করা। কে-মানে আপনাকে 200 টি ক্লাস্টার সেন্টার দেবে,
তারপরে আপনি নিজের ছবিতে প্রতিটি সিআইফটি বর্ণনাকারী নেবেন এবং এটির নিকটবর্তী ক্লাস্টারের কেন্দ্রটি সন্ধান করে এটি 200 টি ক্লাস্টারের কোনটির সাথে সম্পর্কিত তা নির্ধারণ করুন। তারপরে আপনি কেবল প্রতিটি ক্লাস্টারের কতগুলি বৈশিষ্ট্য রয়েছে তা গণনা করুন। সুতরাং, যে কোনও সংখ্যক SIFT বৈশিষ্ট্যযুক্ত কোনও চিত্রের জন্য আপনার কাছে 200 টি বিনের হিস্টোগ্রাম রয়েছে। এটি আপনার বৈশিষ্ট্য ভেক্টর যা আপনি এসভিএমকে দেন। (দ্রষ্টব্য, শব্দ বৈশিষ্ট্যগুলি গুরুতরভাবে ওভারলোড হয়েছে)।
আমার মনে আছে, এই হিস্টোগ্রামগুলি কীভাবে স্বাভাবিক করা উচিত সে সম্পর্কে অনেক কাজ হয়েছিল। আমি ভুল হতে পারি, তবে আমি এমন একটি কাগজ মনে করলাম যা দাবি করেছিল যে বাইনারি ফিচার ভেক্টর (যেমন 1 যদি এই ক্লাস্টারের কমপক্ষে 1 টি বৈশিষ্ট্য উপস্থিত থাকে, এবং 0 অন্যথায়) হিস্টোগ্রামের চেয়ে ভাল কাজ করে। আপনাকে বিশদগুলির জন্য সাহিত্য পরীক্ষা করতে হবে, এবং বিশদটি গুরুত্বপূর্ণ।
সম্পাদনা করুন: ম্যাটল্যাবের জন্য কম্পিউটার ভিশন সিস্টেম টুলবক্স এখন বৈশিষ্ট্যগুলির কার্যকারিতার ব্যাগ সরবরাহ করে ।