আমি একই ডেটাসেট সহ বিভিন্ন বাইনারি শ্রেণিবদ্ধকরণ অ্যালগরিদমগুলিতে একটি 10-গুণ ক্রস বৈধতা দৌড়েছি এবং মাইক্রো- এবং ম্যাক্রো উভয়ের গড় ফলাফল পেয়েছি। এটি উল্লেখ করা উচিত যে এটি একটি মাল্টি-লেবেল শ্রেণিবিন্যাস সমস্যা ছিল।
আমার ক্ষেত্রে, সত্য নেতিবাচক এবং সত্য ধনাত্মক সমানভাবে ওজন করা হয়। এর অর্থ সঠিকভাবে negativeণাত্মক ভবিষ্যদ্বাণী করা সঠিকভাবে সত্যের ইতিবাচক ভবিষ্যদ্বাণী করার মতোই গুরুত্বপূর্ণ।
মাইক্রো-গড় ব্যবস্থাগুলি ম্যাক্রো গড়ের চেয়ে কম। এখানে একটি নিউরাল নেটওয়ার্ক এবং সমর্থন ভেক্টর মেশিনের ফলাফল রয়েছে:
আমি একই অ্যালগরিদমের সাথে একই ডেটাসেটে শতাংশ-বিভক্ত পরীক্ষাও চালিয়েছি। ফলাফলগুলি ছিল:
আমি ম্যাক্রো-গড়ের ফলাফলের সাথে শতাংশ-বিভক্ত পরীক্ষার তুলনা করতে পছন্দ করব, তবে এটি কি ন্যায্য? আমি বিশ্বাস করি না যে ম্যাক্রো-গড়ের ফলাফলগুলি পক্ষপাতদুষ্ট কারণ সত্য ধনাত্মক এবং সত্য নেতিবাচক সমানভাবে ওজন করা হয়, তবে আবার আমি ভাবছি যে এটি কমলাগুলির সাথে আপেলের তুলনা করার মতো কিনা?
হালনাগাদ
মন্তব্যের ভিত্তিতে আমি দেখাব যে কীভাবে মাইক্রো এবং ম্যাক্রো গড় গণনা করা হয়।
আমার 144 লেবেল রয়েছে (বৈশিষ্ট্য বা বৈশিষ্ট্যগুলির সমান) যা আমি পূর্বাভাস দিতে চাই। যথার্থতা, রিকাল এবং এফ-মেজার প্রতিটি লেবেলের জন্য গণনা করা হয়।
---------------------------------------------------
LABEL1 | LABEL2 | LABEL3 | LABEL4 | .. | LABEL144
---------------------------------------------------
? | ? | ? | ? | .. | ?
---------------------------------------------------
একটি বাইনারি মূল্যায়ন পরিমাপ বি (টিপি, টিএন, এফপি, এফএন) বিবেচনা করে যা সত্য ধনাত্মক (টিপি), সত্য নেতিবাচক (টিএন), মিথ্যা পজিটিভ (এফপি), এবং মিথ্যা নেগেটিভ (এফএন) এর উপর ভিত্তি করে গণনা করা হয়। একটি নির্দিষ্ট পরিমাপের ম্যাক্রো এবং মাইক্রো গড়গুলি নিম্নলিখিত হিসাবে গণনা করা যেতে পারে:
এই সূত্রগুলি ব্যবহার করে আমরা নীচে মাইক্রো এবং ম্যাক্রো গড় গণনা করতে পারি:
সুতরাং, মাইক্রো-গড় ব্যবস্থাগুলি সমস্ত টিপি, এফপি এবং fn (প্রতিটি লেবেলের জন্য) যুক্ত করে, তারপরে একটি নতুন বাইনারি মূল্যায়ন করা হয়। ম্যাক্রো-গড় ব্যবস্থাগুলি সমস্ত পদক্ষেপগুলি (যথার্থতা, পুনর্বিবেচনা বা এফ-মেজার) যুক্ত করে এবং লেবেলের সংখ্যার সাথে ভাগ করে, যা আরও গড়ের মতো।
এখন, প্রশ্নটি কোনটি ব্যবহার করবেন?