সমর্থন ভেক্টর শ্রেণিবিন্যাসের জন্য আমি libsvm ( http://www.csie.ntu.edu.tw/~cjlin/libsvm/ ) সরঞ্জামটি ব্যবহার করছি । যাইহোক, আমি ইনপুট ডেটা ফর্ম্যাট সম্পর্কে বিভ্রান্ত করছি।
পুনরায় পড়া থেকে:
প্রশিক্ষণ এবং ডেটা ফাইল পরীক্ষার বিন্যাসটি হ'ল:
<label> <index1>:<value1> <index2>:<value2> ... . . .
প্রতিটি লাইনে একটি উদাহরণ থাকে এবং এটি একটি '\ n' অক্ষর দ্বারা শেষ হয়। শ্রেণিবিন্যাসের জন্য,
<label>
শ্রেণীর লেবেল নির্দেশকারী একটি পূর্ণসংখ্যা (বহু-শ্রেণি সমর্থিত)। রিগ্রেশন<label>
জন্য, লক্ষ্য মান যা কোনও আসল সংখ্যা হতে পারে। এক-শ্রেণীর এসভিএমের জন্য, এটি ব্যবহার করা হয়নি তাই কোনও সংখ্যা হতে পারে। এই জুটিটি<index>:<value>
একটি বৈশিষ্ট্য (বৈশিষ্ট্য) মান দেয়:<index>
এটি পূর্ণসংখ্যা 1 থেকে শুরু হয় এবং<value>
এটি একটি আসল সংখ্যা। একমাত্র ব্যতিক্রম হ'ল প্রাক্পম্পিউটেড কার্নেল, যেখানে<index>
0 থেকে শুরু হয়; প্রাক্পম্পিউটেড কার্নেলের বিভাগটি দেখুন। সূচকগুলি অবশ্যই ক্রমযুক্ত ক্রমে থাকতে হবে। পরীক্ষার ফাইলে থাকা লেবেলগুলি কেবল নির্ভুলতা বা ত্রুটি গণনা করতে ব্যবহৃত হয়। যদি সেগুলি অজানা থাকে তবে কেবল প্রথম সংখ্যাটি যে কোনও সংখ্যায় পূরণ করুন।
আমার নিম্নলিখিত প্রশ্নগুলি রয়েছে:
- এর ব্যবহার কী
<index>
? এটা কি উদ্দেশ্য পরিবেশন করে? - বিভিন্ন উপাত্ত উদাহরণগুলির একই সূচক মানগুলির মধ্যে কোনও চিঠিপত্র রয়েছে?
- এর মধ্যে যদি আমি কোনও সূচক মিস / এড়িয়ে যাই?
আমি জিজ্ঞাসা করছি কারণ ডাটাফাইল * হার্ট_স্কেল * যা libsvm এর প্যাকেজে অন্তর্ভুক্ত রয়েছে, লাইন 12 এ, সূচকটি 2 থেকে শুরু হয় <value>
? সূচ 1 এর জন্য কি অজানা / নিখোঁজ হিসাবে নেওয়া হয়েছে? দ্রষ্টব্য: প্যাকেজের সাথে সরবরাহ করা সরঞ্জামগুলি / চেকডেটা.পিআই সরঞ্জামটি বলে যে * হার্ট_স্কেল * ফাইলটি সঠিক।