আমার কাছে একটি প্রশিক্ষিত লজিস্টিক রিগ্রেশন মডেল রয়েছে যা আমি পরীক্ষার ডেটা সেটটিতে প্রয়োগ করছি। নির্ভরশীল পরিবর্তনশীল বাইনারি (বুলিয়ান)। পরীক্ষার ডেটা সেটে প্রতিটি নমুনার জন্য, আমি লজিস্টিক রিগ্রেশন মডেলটি প্রয়োগ করে এমন একটি% সম্ভাবনা তৈরি করে যে নির্ভরশীল পরিবর্তনশীলটি সত্য হবে। তারপরে আমি রেকর্ড করি যে একিউটাল মানটি সত্য ছিল বা মিথ্যা। আমি লিনিয়ার রিগ্রেশন মডেল হিসাবে একটি বা অ্যাডজাস্টেড চিত্রটি গণনা করার চেষ্টা করছি ।
এটি আমাকে পরীক্ষার সেটে প্রতিটি নমুনার জন্য একটি রেকর্ড দেয়:
prob_value_is_true acutal_value
.34 0
.45 1
.11 0
.84 0
.... ....
আমি ভাবছি মডেলের যথার্থতা কীভাবে পরীক্ষা করতে হবে। আমার প্রথম প্রয়াসটি ছিল একটি কন্টিনজেন্সি টেবিল ব্যবহার করা এবং "যদি prob_value_is_true
> 0.80, অনুমান করুন যে আসল মানটি সত্য" এবং তারপরে সঠিক থেকে ভুল শ্রেণিবিন্যাসের অনুপাতটি পরিমাপ করা হয়েছিল। তবে আমি এটি পছন্দ করি না, কারণ এটি অনুভূত হয় যে আমি কেবল 0.80 কে একটি সীমানা হিসাবে মূল্যায়ন করছি, পুরো মডেলটির যথার্থতা এবং সমস্ত prob_value_is_true
মূল্যবোধ নয় not
তারপরে আমি কেবলমাত্র প্রতিটি প্রোব_ভ্যালু_আইস_ ট্র্যুট পৃথক মানটি দেখার চেষ্টা করেছি, উদাহরণস্বরূপ, সমস্ত নমুনা দেখে যেখানে prob_value_is_true
= 0.34 এবং যে সমস্ত নমুনাগুলির একিউটাল মান সত্য তা পরিমাপ করে (এক্ষেত্রে নিখুঁত নির্ভুলতা যদি নমুনার% এটি সত্য ছিল = 34%)। আমি প্রতিটি স্বতন্ত্র মূল্যের পার্থক্যের যোগ করে একটি মডেল নির্ভুলতা স্কোর তৈরি করতে পারি prob_value_is_true
। তবে নমুনার আকারগুলি এখানে একটি বিশাল উদ্বেগ, বিশেষত চূড়ান্ততার জন্য (প্রায় 0% বা 100% এর কাছাকাছি), যেমন আকিউটাল মানগুলির গড় যথাযথ নয়, তাই তাদের মডেল যথার্থতা পরিমাপ করতে ব্যবহার করা সঠিক বলে মনে হয় না।
এমনকি পর্যাপ্ত নমুনা আকারগুলি (0-.25, .25-.50, .50-.75, .75-1.0) নিশ্চিত করার জন্য আমি বিশাল ব্যাপ্তি তৈরি করার চেষ্টা করেছি, কিন্তু কীভাবে সত্যিকারের মান% এর "ধার্মিকতা" পরিমাপ করতে পারি? । যেখানে prob_value_is_true
0.25 থেকে 0.50 এর মধ্যে রয়েছে সমস্ত নমুনা বলুন গড়ে acutal_value
0.45। এর পরিসীমা থেকে এটি কি ভাল? খারাপ যেহেতু এটি 37.5% (রেঞ্জের কেন্দ্র) এর কাছাকাছি নয়?
সুতরাং আমি মনে করি যা সহজ প্রশ্ন হওয়া উচিত তার জন্য আমি আটকে আছি এবং আশা করি যে কেউ আমাকে একটি সংস্থান বা পদ্ধতিতে নির্দেশ করতে পারেন যাতে কোনও লজিস্টিক রিগ্রেশন মডেলের জন্য নির্ভুলতার নির্ভুলতা গণনা করা যায়।