কোনও লজিস্টিক মডেল যথেষ্ট ভাল কিনা তা কীভাবে সিদ্ধান্ত নেবেন সে সম্পর্কে আমার আসল বিভ্রান্তি থেকে এই প্রশ্নটি উঠে আসে। আমার কাছে এমন মডেল রয়েছে যা নির্ভরশীল ভেরিয়েবল হিসাবে গঠিত হওয়ার দু'বছর পরে পৃথক-প্রকল্পের জোড়াগুলির রাজ্য ব্যবহার করে। ফলাফল সফল (1) না (0)। জোড় গঠনের সময় আমার কাছে স্বাধীন ভেরিয়েবল পরিমাপ করা হয়। আমার লক্ষ্যটি এমন একটি পরিবর্তনশীল, যা আমি অনুমান করেছি যে জোড়গুলির সাফল্যের প্রভাব ফেলবে কিনা সেই সাফল্যের উপর, অন্যান্য সম্ভাব্য প্রভাবগুলি নিয়ন্ত্রণ করে for মডেলগুলিতে, আগ্রহের পরিবর্তনশীল তাৎপর্যপূর্ণ।
মডেলগুলি glm()
ফাংশনটি ব্যবহার করে অনুমান করা হয়েছিল R
। মডেলগুলির গুণমান নির্ণয় করতে, আমি কয়েকটি জিনিস করেছি: glm()
আপনাকে ডিফল্টরূপে residual deviance
, দি AIC
এবং BIC
দিবে। এছাড়াও, আমি মডেলের ত্রুটি হার গণনা করেছি এবং বিনাশিত অবশিষ্টাংশ প্লট করেছি।
- আমি অনুমান করেছি এমন অন্যান্য মডেলের তুলনায় সম্পূর্ণ মডেলটির একটি ছোট অবশেষে বিচ্যুতি, এআইসি এবং বিআইসি রয়েছে (যা সম্পূর্ণ মডেলটিতে বাসা বাঁধে), যা আমাকে এই মডেলটিকে অন্যদের তুলনায় "আরও ভাল" বলে ভাবতে পরিচালিত করে।
- মডেলের ত্রুটি-হার মোটামুটি কম, আইএমএইচও ( গেলম্যান এবং হিল হিসাবে, 2007, পিপি 99 ):
error.rate <- mean((predicted>0.5 & y==0) | (predicted<0.5 & y==1)
প্রায় 20%।
এ পর্যন্ত সব ঠিকই. কিন্তু যখন আমি বিন্যৃত অবশিষ্টগুলি প্লট করি (আবার জেলম্যান এবং হিলের পরামর্শ অনুসরণ করে), তখন বিনের একটি বড় অংশ 95% সিআই এর বাইরে পড়ে:
এই প্লটটি আমাকে ভাবতে পরিচালিত করে যে মডেল সম্পর্কে পুরোপুরি কিছু ভুল আছে। মডেলটি ফেলে দিতে কি আমাকে নেতৃত্ব দেওয়া উচিত? মডেলটি অসম্পূর্ণ তা কি স্বীকার করে নেব তবে তা রাখি এবং আগ্রহের পরিবর্তনশীলের প্রভাবটি ব্যাখ্যা করি? আমি পরিবর্তিত পরিবর্তনশীল বাদ দিয়ে প্রায় খেলনা করেছি, এবং কিছু বদলানো, বিনাশিত অবশিষ্টাংশের প্লটকে সত্যিকারের উন্নতি না করেই।
সম্পাদনা:
- এই মুহুর্তে, মডেলের একটি ডজন পূর্বাভাসকারী এবং 5 টি ইন্টারঅ্যাকশন প্রভাব রয়েছে।
- জোড়গুলি একে অপরের তুলনায় "অপেক্ষাকৃত" স্বতন্ত্র যে এগুলি সমস্ত অল্প সময়ের মধ্যে গঠিত হয় (তবে কঠোরভাবে বলা হয় না, সমস্ত একই সাথে) এবং সেখানে প্রচুর প্রকল্প (13 কে) এবং প্রচুর ব্যক্তি (19 কে) রয়েছে ), সুতরাং প্রকল্পগুলির ন্যায্য অনুপাত কেবলমাত্র একজনের সাথে যোগ দেয় (প্রায় 20000 জোড়া রয়েছে)।