একটি লজিস্টিক রিগ্রেশন মডেল মূল্যায়ন


13

আমি একটি লজিস্টিক মডেল নিয়ে কাজ করছি এবং ফলাফলগুলি মূল্যায়নে আমার কিছু অসুবিধা হচ্ছে। আমার মডেলটি দ্বিপদী লগিট। আমার ব্যাখ্যামূলক ভেরিয়েবলগুলি হ'ল: 15 স্তরের বিশিষ্ট পরিবর্তনশীল, একটি দ্বিধাত্বক ভেরিয়েবল এবং 2 ধ্রুবক ভেরিয়েবল। আমার এন বড়> 8000।

আমি বিনিয়োগের জন্য সংস্থাগুলির সিদ্ধান্তকে মডেল করার চেষ্টা করছি। নির্ভরশীল পরিবর্তনশীল হ'ল বিনিয়োগ (হ্যাঁ / না), 15 স্তরের ভেরিয়েবলগুলি পরিচালকদের দ্বারা বিনিয়োগ করা বিনিয়োগের জন্য বিভিন্ন বাধা। বাকি ভেরিয়েবলগুলি বিক্রয়, ক্রেডিট এবং ব্যবহৃত সক্ষমতার নিয়ন্ত্রণ।

rmsআর এর মধ্যে প্যাকেজটি ব্যবহার করে নীচে আমার ফলাফলগুলি দেওয়া হল ।

  Model Likelihood     Discrimination    Rank Discrim.    
                         Ratio Test            Indexes          Indexes       
Obs          8035    LR chi2     399.83    R2       0.067    C       0.632    
 1           5306    d.f.            17    g        0.544    Dxy     0.264    
 2           2729    Pr(> chi2) <0.0001    gr       1.723    gamma   0.266    
max |deriv| 6e-09                          gp       0.119    tau-a   0.118    
                                           Brier    0.213                     

          Coef    S.E.   Wald Z Pr(>|Z|)
Intercept -0.9501 0.1141 -8.33  <0.0001 
x1=10     -0.4929 0.1000 -4.93  <0.0001 
x1=11     -0.5735 0.1057 -5.43  <0.0001 
x1=12     -0.0748 0.0806 -0.93  0.3536  
x1=13     -0.3894 0.1318 -2.96  0.0031  
x1=14     -0.2788 0.0953 -2.92  0.0035  
x1=15     -0.7672 0.2302 -3.33  0.0009  
x1=2      -0.5360 0.2668 -2.01  0.0446  
x1=3      -0.3258 0.1548 -2.10  0.0353  
x1=4      -0.4092 0.1319 -3.10  0.0019  
x1=5      -0.5152 0.2304 -2.24  0.0254  
x1=6      -0.2897 0.1538 -1.88  0.0596  
x1=7      -0.6216 0.1768 -3.52  0.0004  
x1=8      -0.5861 0.1202 -4.88  <0.0001 
x1=9      -0.5522 0.1078 -5.13  <0.0001 
d2         0.0000 0.0000 -0.64  0.5206  
f1        -0.0088 0.0011 -8.19  <0.0001 
k8         0.7348 0.0499 14.74  <0.0001 

মূলত আমি দুটি উপায়ে রিগ্রেশনকে মূল্যায়ন করতে চাই, (ক) মডেলটি কতটা উপাত্তের সাথে ফিট করে এবং খ) মডেলটি ফলাফলটির কতটা পূর্বাভাস দেয়। ফিটের (আ) কৃতিত্বের মূল্যায়ন করার জন্য, আমি মনে করি চি-স্কোয়ারের ভিত্তিতে ডিভ্যান্স টেস্টগুলি এই ক্ষেত্রে উপযুক্ত নয় কারণ অনন্য কোভেরেটের সংখ্যা N এর কাছাকাছি হয়, তাই আমরা এক্স 2 বিতরণ ধরে নিতে পারি না। এই ব্যাখ্যাটি কি সঠিক?

আমি epiRপ্যাকেজটি ব্যবহার করে কোভেরিয়েটগুলি দেখতে পাচ্ছি ।

require(epiR)
logit.cp <- epi.cp(logit.df[-1]))

    id n x1   d2 f1 k8
     1 1 13 2030 56  1
     2 1 14  445 51  0
     3 1 12 1359 51  1
     4 1  1 1163 39  0
     5 1  7  547 62  0
     6 1  5 3721 62  1
    ...
    7446

আমি আরও পড়েছি যে হোসমার-লেমেশো জিওএফ পরীক্ষাটি পুরানো, কারণ এটি পরীক্ষা চালানোর জন্য ডেটা 10 দ্বারা বিভক্ত করে, যা স্বেচ্ছাসেবী।

পরিবর্তে আমি rmsপ্যাকেজে প্রয়োগ করা লে সিসি – ভ্যান হিউলিনজেন – কোপাস – হোসমার পরীক্ষাটি ব্যবহার করি । এই পরীক্ষাটি ঠিক কীভাবে সম্পাদিত হয় তা আমি নিশ্চিত নই, আমি এখনও সে সম্পর্কে কাগজপত্র পড়িনি। যে কোনও ক্ষেত্রে, ফলাফলগুলি হ'ল:

Sum of squared errors    Expected value|H0           SD             Z            P
         1711.6449914         1712.2031888    0.5670868    -0.9843245    0.3249560

পি বড়, তাই আমার মডেল ফিট করে না তা বলার মতো পর্যাপ্ত প্রমাণ নেই। গ্রেট! যাহোক....

মডেল (খ) এর ভবিষ্যদ্বাণীপূর্ণ ক্ষমতা যাচাই করার সময়, আমি একটি আরওসি বক্ররেখা আঁকি এবং এটি দেখতে পাই যে এটিসি আছে 0.6320586। এটা খুব ভাল দেখাচ্ছে না।

এখানে চিত্র বর্ণনা লিখুন

সুতরাং, আমার প্রশ্নগুলি সংক্ষেপে:

  1. আমি যে পরীক্ষাগুলি চালাচ্ছি সেগুলি কি আমার মডেলটি পরীক্ষা করতে উপযুক্ত? আমি আর কোন পরীক্ষা বিবেচনা করতে পারে?

  2. আপনি কি আদৌ মডেলটিকে দরকারী মনে করেন, বা তুলনামূলকভাবে দুর্বল আরওসি বিশ্লেষণের ফলাফলের ভিত্তিতে আপনি এটিকে বরখাস্ত করবেন?


আপনি কি নিশ্চিত যে আপনার x1একক শ্রেণিবদ্ধ পরিবর্তনশীল হিসাবে নেওয়া উচিত? অর্থাৎ, প্রতিটি ক্ষেত্রেই কি বিনিয়োগের ক্ষেত্রে 1, এবং মাত্র 1, 'বাধা' থাকতে হবে? আমি ভাবব যে কয়েকটি ক্ষেত্রে 2 বা ততোধিক বাধার মুখোমুখি হতে পারে এবং কিছু ক্ষেত্রে এর কোনওটিই নেই।
গুং - মনিকা পুনরায়

উত্তর:


6

লজিস্টিক রিগ্রেশন মডেলটি পরিদর্শন করার জন্য যে হাজার হাজার পরীক্ষাগুলি প্রয়োগ করতে পারে সেগুলির অনেকগুলি রয়েছে এবং এটির অনেকটাই নির্ভর করে যে কোনওরটির লক্ষ্য ভবিষ্যদ্বাণী, শ্রেণিবিন্যাস, পরিবর্তনশীল নির্বাচন, অনুমান, কার্যকারিতা মডেলিং ইত্যাদি whether হজমার-লেমশো পরীক্ষা, উদাহরণস্বরূপ, মূল্যায়ন মডেল ক্যালিগ্রেশন এবং ঝুঁকিপূর্ণ ডেস্কেল দ্বারা বিভক্ত হয়ে গেলে পূর্বাভাসিত মানগুলি পূর্বাভাসিত ফ্রিকোয়েনির সাথে মেলে কিনা। যদিও, 10 এর পছন্দটি স্বেচ্ছাসেবী, পরীক্ষার অ্যাসিম্পটোটিক ফলাফল রয়েছে এবং সহজেই পরিবর্তন করা যেতে পারে। লজিস্টিক রিগ্রেশন মডেলটি অনুমান করার জন্য ব্যবহৃত একই ডেটাতে গণনা করার সময় এইচএল পরীক্ষা, পাশাপাশি এইউসি-তে (আমার মতে) খুব উদ্বেগজনক ফলাফল রয়েছে। এটা তোলে এসএএস এবং SPSS মত আশ্চর্য প্রোগ্রাম দুর্দান্তভাবে বিভিন্ন বিশ্লেষণ জন্য পরিসংখ্যান ঘন প্রতিবেদনের গঠিত কার্যতলজিস্টিক রিগ্রেশন ফলাফল উপস্থাপনের উপায়। ভবিষ্যদ্বাণীমূলক নির্ভুলতার পরীক্ষাগুলি (যেমন এইচএল এবং এইউসি) কোনও মডেলের ভবিষ্যদ্বাণীপূর্ণ দক্ষতা নির্ধারণের জন্য বিভিন্ন সময়কালে স্বাধীন ডেটা সেটগুলি (বা আরও ভাল) ডেটা সংগ্রহের সাথে আরও ভাল ব্যবহার করা হয়।

আরেকটি বিষয় উল্লেখযোগ্য হ'ল ভবিষ্যদ্বাণী করা এবং অনুমান করা খুব আলাদা জিনিস। পূর্বাভাসটি মূল্যায়নের কোনও উদ্দেশ্যমূলক উপায় নেই, 1 বছরের স্তন ক্যান্সারের ঝুঁকির মতো খুব বিরল এবং জটিল ঘটনার পূর্বাভাস দেওয়ার জন্য 0.65 এর একটি এউসি খুব ভাল। একইভাবে, অনুমানকে নির্বিচারে অভিযুক্ত করা যায় কারণ 0.05 এর falseতিহ্যগত মিথ্যা ধনাত্মক হারটি কেবল প্রায় চারপাশে ছুঁড়ে দেওয়া হয়।

আমি যদি আপনি ছিলাম তবে আপনার সমস্যার বিবরণ ম্যানেজারের প্রভাবগুলিতে মডেলিং করতে আগ্রহী বলে মনে হয়েছিল বিনিয়োগে "বাধা" রয়েছে, তাই মডেল অ্যাডজাস্টেড অ্যাসোসিয়েশন উপস্থাপনের দিকে মনোনিবেশ করুন। মডেল প্রতিকূলতার অনুপাতের জন্য পয়েন্টের অনুমান এবং 95% আত্মবিশ্বাসের অন্তরগুলি উপস্থাপন করুন এবং অন্যদের সাথে তাদের অর্থ, ব্যাখ্যা এবং বৈধতা নিয়ে আলোচনা করতে প্রস্তুত হন। একটি বন চক্রান্ত একটি কার্যকর গ্রাফিকাল সরঞ্জাম। আপনাকে অবশ্যই ডেটাতে এই বাধাগুলির ফ্রিকোয়েন্সিটি অবশ্যই দেখিয়ে দিতে হবে এবং অযৌক্তিক ফলাফলগুলিতে বিভ্রান্তির সম্ভাবনাটি ছোট বা বড় ছিল কিনা তা প্রদর্শনের জন্য অন্যান্য সমন্বয় ভেরিয়েবলগুলির মাধ্যমে তাদের মধ্যস্থতা উপস্থাপন করতে হবে। আমি আরও স্থির হয়ে যাব এবং ম্যানেজারদের মধ্যে সামঞ্জস্যতার জন্য ক্রোনব্যাকের আলফার মতো বিষয়গুলি অন্বেষণ করবো ম্যানেজাররা অনুরূপ সমস্যার প্রতিবেদন করার প্রবণতা নির্ধারণে বাধাগুলি বলেছিল, বা,

আমি মনে করি আপনি সংখ্যা সম্পর্কে খুব বেশি মনোনিবেশ করেছেন এবং প্রশ্নটি হাতে নেই। মডেল ফলাফলগুলি উপস্থাপনের আগে 90% ভাল পরিসংখ্যান উপস্থাপনা ঘটে।


আপনার প্রতিক্রিয়া জন্য আপনাকে আদম ধন্যবাদ! আমি আমার অ্যানালিসিসের বেশিরভাগ ক্ষেত্রে বৈষম্য অনুপাতের ব্যাখ্যা এবং সম্ভাব্য সম্ভাবনার উপর ভিত্তি করে থাকি। তবে যেহেতু আমি এখনও লজিস্টিক রিগ্রেশন নিয়ে খুব বেশি সাবলীল নই, তাই আমি আশঙ্কা করি যে আমার বিশ্লেষণটি খারিজ হয়ে যেতে পারে কারণ আমি কিছু সাধারণ মডেলের ফিট টেস্ট মিস করছি। তবে যেমনটি আপনি বলেছিলেন, আমিও বিশ্বাস করি যে মডেলটির আরও বিকল্প ব্যাখ্যা করা উচিত focus আমি বন প্লট এবং ক্রোনবাচের আলফা পাশাপাশি আপনার পুনঃব্যবস্থাপনা বিবেচনা করব। আবার ধন্যবাদ!
ফেডেরিকো সি

মডেল অনুমানের একমাত্র বৈধ সম্ভাব্য লঙ্ঘন আপনার সমস্যার বিবরণ দিয়ে তথ্য সম্পর্কিত হবে। এই বিষয়টি মনে রেখে, আপনি কোয়াসিবিনোমিয়াল রিগ্রেশন মডেলটির সাথে বিচ্ছুরণের পরীক্ষা করতে পারেন, বা আপনি শিল্পের ধরণের (আপনার উল্লিখিত বিভিন্ন সংস্থার জন্য) উপগোষ্ঠী বিশ্লেষণ করার চেষ্টা করতে পারেন, বা আবার ক্লাস্টার বিশ্লেষণ চেষ্টা করতে পারেন।
অ্যাডামো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.