আমি একটি লজিস্টিক মডেল নিয়ে কাজ করছি এবং ফলাফলগুলি মূল্যায়নে আমার কিছু অসুবিধা হচ্ছে। আমার মডেলটি দ্বিপদী লগিট। আমার ব্যাখ্যামূলক ভেরিয়েবলগুলি হ'ল: 15 স্তরের বিশিষ্ট পরিবর্তনশীল, একটি দ্বিধাত্বক ভেরিয়েবল এবং 2 ধ্রুবক ভেরিয়েবল। আমার এন বড়> 8000।
আমি বিনিয়োগের জন্য সংস্থাগুলির সিদ্ধান্তকে মডেল করার চেষ্টা করছি। নির্ভরশীল পরিবর্তনশীল হ'ল বিনিয়োগ (হ্যাঁ / না), 15 স্তরের ভেরিয়েবলগুলি পরিচালকদের দ্বারা বিনিয়োগ করা বিনিয়োগের জন্য বিভিন্ন বাধা। বাকি ভেরিয়েবলগুলি বিক্রয়, ক্রেডিট এবং ব্যবহৃত সক্ষমতার নিয়ন্ত্রণ।
rms
আর এর মধ্যে প্যাকেজটি ব্যবহার করে নীচে আমার ফলাফলগুলি দেওয়া হল ।
Model Likelihood Discrimination Rank Discrim.
Ratio Test Indexes Indexes
Obs 8035 LR chi2 399.83 R2 0.067 C 0.632
1 5306 d.f. 17 g 0.544 Dxy 0.264
2 2729 Pr(> chi2) <0.0001 gr 1.723 gamma 0.266
max |deriv| 6e-09 gp 0.119 tau-a 0.118
Brier 0.213
Coef S.E. Wald Z Pr(>|Z|)
Intercept -0.9501 0.1141 -8.33 <0.0001
x1=10 -0.4929 0.1000 -4.93 <0.0001
x1=11 -0.5735 0.1057 -5.43 <0.0001
x1=12 -0.0748 0.0806 -0.93 0.3536
x1=13 -0.3894 0.1318 -2.96 0.0031
x1=14 -0.2788 0.0953 -2.92 0.0035
x1=15 -0.7672 0.2302 -3.33 0.0009
x1=2 -0.5360 0.2668 -2.01 0.0446
x1=3 -0.3258 0.1548 -2.10 0.0353
x1=4 -0.4092 0.1319 -3.10 0.0019
x1=5 -0.5152 0.2304 -2.24 0.0254
x1=6 -0.2897 0.1538 -1.88 0.0596
x1=7 -0.6216 0.1768 -3.52 0.0004
x1=8 -0.5861 0.1202 -4.88 <0.0001
x1=9 -0.5522 0.1078 -5.13 <0.0001
d2 0.0000 0.0000 -0.64 0.5206
f1 -0.0088 0.0011 -8.19 <0.0001
k8 0.7348 0.0499 14.74 <0.0001
মূলত আমি দুটি উপায়ে রিগ্রেশনকে মূল্যায়ন করতে চাই, (ক) মডেলটি কতটা উপাত্তের সাথে ফিট করে এবং খ) মডেলটি ফলাফলটির কতটা পূর্বাভাস দেয়। ফিটের (আ) কৃতিত্বের মূল্যায়ন করার জন্য, আমি মনে করি চি-স্কোয়ারের ভিত্তিতে ডিভ্যান্স টেস্টগুলি এই ক্ষেত্রে উপযুক্ত নয় কারণ অনন্য কোভেরেটের সংখ্যা N এর কাছাকাছি হয়, তাই আমরা এক্স 2 বিতরণ ধরে নিতে পারি না। এই ব্যাখ্যাটি কি সঠিক?
আমি epiR
প্যাকেজটি ব্যবহার করে কোভেরিয়েটগুলি দেখতে পাচ্ছি ।
require(epiR)
logit.cp <- epi.cp(logit.df[-1]))
id n x1 d2 f1 k8
1 1 13 2030 56 1
2 1 14 445 51 0
3 1 12 1359 51 1
4 1 1 1163 39 0
5 1 7 547 62 0
6 1 5 3721 62 1
...
7446
আমি আরও পড়েছি যে হোসমার-লেমেশো জিওএফ পরীক্ষাটি পুরানো, কারণ এটি পরীক্ষা চালানোর জন্য ডেটা 10 দ্বারা বিভক্ত করে, যা স্বেচ্ছাসেবী।
পরিবর্তে আমি rms
প্যাকেজে প্রয়োগ করা লে সিসি – ভ্যান হিউলিনজেন – কোপাস – হোসমার পরীক্ষাটি ব্যবহার করি । এই পরীক্ষাটি ঠিক কীভাবে সম্পাদিত হয় তা আমি নিশ্চিত নই, আমি এখনও সে সম্পর্কে কাগজপত্র পড়িনি। যে কোনও ক্ষেত্রে, ফলাফলগুলি হ'ল:
Sum of squared errors Expected value|H0 SD Z P
1711.6449914 1712.2031888 0.5670868 -0.9843245 0.3249560
পি বড়, তাই আমার মডেল ফিট করে না তা বলার মতো পর্যাপ্ত প্রমাণ নেই। গ্রেট! যাহোক....
মডেল (খ) এর ভবিষ্যদ্বাণীপূর্ণ ক্ষমতা যাচাই করার সময়, আমি একটি আরওসি বক্ররেখা আঁকি এবং এটি দেখতে পাই যে এটিসি আছে 0.6320586
। এটা খুব ভাল দেখাচ্ছে না।
সুতরাং, আমার প্রশ্নগুলি সংক্ষেপে:
আমি যে পরীক্ষাগুলি চালাচ্ছি সেগুলি কি আমার মডেলটি পরীক্ষা করতে উপযুক্ত? আমি আর কোন পরীক্ষা বিবেচনা করতে পারে?
আপনি কি আদৌ মডেলটিকে দরকারী মনে করেন, বা তুলনামূলকভাবে দুর্বল আরওসি বিশ্লেষণের ফলাফলের ভিত্তিতে আপনি এটিকে বরখাস্ত করবেন?
x1
একক শ্রেণিবদ্ধ পরিবর্তনশীল হিসাবে নেওয়া উচিত? অর্থাৎ, প্রতিটি ক্ষেত্রেই কি বিনিয়োগের ক্ষেত্রে 1, এবং মাত্র 1, 'বাধা' থাকতে হবে? আমি ভাবব যে কয়েকটি ক্ষেত্রে 2 বা ততোধিক বাধার মুখোমুখি হতে পারে এবং কিছু ক্ষেত্রে এর কোনওটিই নেই।