আমাকে সম্প্রতি মাল্টিলেবেল র্যাঙ্কিং অ্যালগরিদমগুলি মূল্যায়নের জন্য একটি মেট্রিক বেছে নিতে হয়েছিল এবং এই বিষয়ে পৌঁছেছিলাম, যা সত্যই সহায়ক ছিল। Stpk এর উত্তরে এখানে কিছু সংযোজন দেওয়া হয়েছে, যা একটি পছন্দ করার জন্য সহায়ক ছিল।
- এমএপি একত্রীকরণের ব্যয়ে বহুমুখী সমস্যার সাথে মানিয়ে নেওয়া যেতে পারে
- মানচিত্র যখন নেতিবাচক বর্গ অধিকতর ভারী হয় ট এ নির্ণিত করা প্রয়োজন না, কিন্তু multilabel সংস্করণ অভিযোজিত না করা যেতে পারে
- এমএপি এবং (এন) ডিসিজি উভয়ই র্যাঙ্কযুক্ত প্রাসঙ্গিকতার মানগুলির ওজনের গড় হিসাবে পুনরায় লেখা যেতে পারে
বিস্তারিত
আসুন গড় স্পষ্টতা (এপি) উপর দৃষ্টি নিবদ্ধ করা যাক গড় গড় নির্ভুলতা (এমএপি) বেশ কয়েকটি ক্যোয়ারিতে এপিগুলির গড় average যথাযথতা-পুনর্বিবেচনা বক্ররেখার অধীনে অঞ্চল হিসাবে বাইনারি তথ্যগুলিতে এপি যথাযথভাবে সংজ্ঞায়িত করা হয়েছে, যা প্রতিটি ধনাত্মক আইটেমের যথার্থতার গড় হিসাবে পুনরায় লেখা যেতে পারে। ( এমএপিতে উইকিপিডিয়া নিবন্ধটি দেখুন ) সম্ভাব্য সীমাবদ্ধতা হ'ল একে একে যথার্থের গড় হিসাবে সংজ্ঞায়িত করাআইটেম। দুঃখের বিষয়, আমরা সেই দুর্দান্ত সম্পত্তিটি হারাতে পেরেছি যে তালিকার শেষে অবস্থিত নেতিবাচক উদাহরণগুলি এপির মানের উপর কোনও প্রভাব ফেলেনি। (এটি বিশেষত দুঃখজনক হয় যখন কোনও অনুসন্ধান ইঞ্জিনের মূল্যায়ন করতে পজিটিভ উদাহরণগুলির তুলনায় অনেক বেশি নেতিবাচক উদাহরণ থাকে down কয়েকটি ইতিবাচক উদাহরণ সহ প্রশ্নগুলির পক্ষে কঠিন))
অন্যদিকে, এই আনুমানিকের এমন দুর্দান্ত সম্পত্তি রয়েছে যা এটি মাল্টিলেবেল ক্ষেত্রে ভাল জেনারেট করে। প্রকৃতপক্ষে, বাইনারি ক্ষেত্রে, পজিশন কেতে যথাযথতা যথাযথ উদাহরণের প্রাসঙ্গিকতা 1 এবং পজিশন কে এর আগে গড় প্রাসঙ্গিকতা হিসাবেও ব্যাখ্যা করা যেতে পারে, এবং একটি নেতিবাচক উদাহরণের প্রাসঙ্গিকতা 0 এই সংজ্ঞাটি বেশ প্রাকৃতিকভাবে প্রসারিত প্রাসঙ্গিকতার দুটিরও বেশি স্তরের ক্ষেত্রে। এই ক্ষেত্রে, এপি প্রতিটি অবস্থানের প্রাসঙ্গিক গড়ের গড় হিসাবেও সংজ্ঞায়িত করা যেতে পারে।
এই অভিব্যক্তিটি তার বক্তব্যে stpk দ্বারা উদ্ধৃত ভিডিওর স্পিকার দ্বারা চয়ন করা । তিনি এই ভিডিওতে দেখান যে এপিটিকে প্রাসঙ্গিকতার ওজনযুক্ত গড় হিসাবে ওজন হিসাবে আবারও লেখা যেতে পারেট
Wএ পিট= 1কেলগ( কেট)
কে
Wডি সিজিট= 1লগ( কে + 1 )
এই দুটি এক্সপ্রেশন থেকে, আমরা তা অনুমান করতে পারি - এপি নথিগুলি 1 থেকে 0 পর্যন্ত ওজন করে - ডিসিজি মোট নথির সংখ্যা থেকে স্বতন্ত্রভাবে নথির ওজন করে।
উভয় ক্ষেত্রেই যদি প্রাসঙ্গিক উদাহরণগুলির তুলনায় অনেক বেশি অপ্রাসঙ্গিক উদাহরণ থাকে তবে ধনাত্মক সামগ্রীর মোট ওজন নগণ্য হতে পারে। এপি-র ক্ষেত্রে, নেতিবাচক নমুনাগুলি সাবমল করার জন্য একটি কার্যপ্রণালী হ'ল, তবে কীভাবে সাবমলিংয়ের অনুপাতটি চয়ন করবেন, সেইসাথে এটিকে কোয়েরির উপর নির্ভরশীল করতে হবে বা ইতিবাচক নথির সংখ্যার উপর নির্ভর করে কিনা তা সম্পর্কে আমি নিশ্চিত নই। ডিসিজির জন্য, আমরা এটি কে এ কেটে ফেলতে পারি, তবে একই ধরণের প্রশ্ন ওঠে।
আমি এই বিষয়ে আরও শুনে খুশি হব, যদি এখানে কেউ এই বিষয়ে কাজ করে।