সুতরাং, আমি এমএল ক্ষেত্রে একজন নবাগত এবং আমি কিছু শ্রেণিবদ্ধকরণ করার চেষ্টা করি। আমার লক্ষ্য একটি ক্রীড়া ইভেন্টের ফলাফলের পূর্বাভাস দেওয়া। আমি কিছু dataতিহাসিক ডেটা সংগ্রহ করেছি এবং এখন একটি শ্রেণিবদ্ধ প্রশিক্ষণ দেওয়ার চেষ্টা করেছি। আমি প্রায় 1200 টি নমুনা পেয়েছি, এর মধ্যে 0.2 টি আমি পরীক্ষার উদ্দেশ্যে পৃথক করেছিলাম, অন্যদের আমি বিভিন্ন শ্রেণিবদ্ধের সাথে গ্রিড অনুসন্ধানে (ক্রস-বৈধকরণ অন্তর্ভুক্ত) রেখেছি। আমি এই মুহুর্তে রৈখিক, আরবিএফ এবং বহুকর্মীয় কার্নেল এবং এলোমেলো বন দ্বারা এসভিএম চেষ্টা করেছি। দুর্ভাগ্যক্রমে, আমি যথাযথভাবে 0.5 এর চেয়ে বড় (ক্লাসের এলোমেলো পছন্দ হিসাবে একই) পেতে পারি না। এর অর্থ কি আমি এইরকম জটিল ঘটনার ফলাফল নিয়ে ভবিষ্যদ্বাণী করতে পারি না? বা আমি কমপক্ষে 0.7-0.8 নির্ভুলতা পেতে পারি? যদি এটি সম্ভব হয়, তবে আমার আর কিসের দিকে নজর দেওয়া উচিত?
- আরও ডেটা পাবেন? (আমি ডেটাসেটটি 5 বার পর্যন্ত বড় করতে পারি)
- বিভিন্ন শ্রেণিবদ্ধ চেষ্টা করে দেখুন? (লজিস্টিক রিগ্রেশন, কেএনএন, ইত্যাদি)
- আমার বৈশিষ্ট্য সেট পুনর্নির্মাণ? বিশ্লেষণের জন্য কি কোনও এমএল-সরঞ্জাম রয়েছে, কোন বৈশিষ্ট্যগুলি বুদ্ধিমান এবং কোনটি নয়? হতে পারে, আমার ফিচার সেটটি কমিয়ে দেওয়া উচিত (বর্তমানে আমার 12 টি বৈশিষ্ট্য রয়েছে)?