সমর্থন ভেক্টর শ্রেণিবিন্যাসের জন্য আমি libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) সরঞ্জামটি ব্যবহার করছি । যাইহোক, আমি ইনপুট ডেটা ফর্ম্যাট সম্পর্কে বিভ্রান্ত করছি।
পুনরায় পড়া থেকে:
প্রশিক্ষণ এবং ডেটা ফাইল পরীক্ষার বিন্যাসটি হ'ল:
<label> <index1>:<value1> <index2>:<value2> ... . . .প্রতিটি লাইনে একটি উদাহরণ থাকে এবং এটি একটি '\ n' অক্ষর দ্বারা শেষ হয়। শ্রেণিবিন্যাসের জন্য,
<label>শ্রেণীর লেবেল নির্দেশকারী একটি পূর্ণসংখ্যা (বহু-শ্রেণি সমর্থিত)। রিগ্রেশন<label>জন্য, লক্ষ্য মান যা কোনও আসল সংখ্যা হতে পারে। এক-শ্রেণীর এসভিএমের জন্য, এটি ব্যবহার করা হয়নি তাই কোনও সংখ্যা হতে পারে। এই জুটিটি<index>:<value>একটি বৈশিষ্ট্য (বৈশিষ্ট্য) মান দেয়:<index>এটি পূর্ণসংখ্যা 1 থেকে শুরু হয় এবং<value>এটি একটি আসল সংখ্যা। একমাত্র ব্যতিক্রম হ'ল প্রাক্পম্পিউটেড কার্নেল, যেখানে<index>0 থেকে শুরু হয়; প্রাক্পম্পিউটেড কার্নেলের বিভাগটি দেখুন। সূচকগুলি অবশ্যই ক্রমযুক্ত ক্রমে থাকতে হবে। পরীক্ষার ফাইলে থাকা লেবেলগুলি কেবল নির্ভুলতা বা ত্রুটি গণনা করতে ব্যবহৃত হয়। যদি সেগুলি অজানা থাকে তবে কেবল প্রথম সংখ্যাটি যে কোনও সংখ্যায় পূরণ করুন।
আমার নিম্নলিখিত প্রশ্নগুলি রয়েছে:
- এর ব্যবহার কী
<index>? এটা কি উদ্দেশ্য পরিবেশন করে? - বিভিন্ন উপাত্ত উদাহরণগুলির একই সূচক মানগুলির মধ্যে কোনও চিঠিপত্র রয়েছে?
- এর মধ্যে যদি আমি কোনও সূচক মিস / এড়িয়ে যাই?
আমি জিজ্ঞাসা করছি কারণ ডাটাফাইল * হার্ট_স্কেল * যা libsvm এর প্যাকেজে অন্তর্ভুক্ত রয়েছে, লাইন 12 এ, সূচকটি 2 থেকে শুরু হয় <value>? সূচ 1 এর জন্য কি অজানা / নিখোঁজ হিসাবে নেওয়া হয়েছে? দ্রষ্টব্য: প্যাকেজের সাথে সরবরাহ করা সরঞ্জামগুলি / চেকডেটা.পিআই সরঞ্জামটি বলে যে * হার্ট_স্কেল * ফাইলটি সঠিক।