হোজিওর-লেমশো গুডনেস অফ ফিটের লজিস্টিক রিগ্রেশন এবং ব্যাখ্যার মূল্যায়ন


24

যেমনটি আমরা সবাই জানি, লজিস্টিক রিগ্রেশন মডেলটি মূল্যায়নের 2 টি পদ্ধতি রয়েছে এবং তারা খুব আলাদা জিনিস পরীক্ষা করে দেখছে

  1. ভবিষ্যদ্বাণীমূলক শক্তি:

    একটি পরিসংখ্যান পান যা স্বতন্ত্র ভেরিয়েবলের উপর নির্ভর করে নির্ভরশীল ভেরিয়েবলটি কতটা ভালভাবে পূর্বাভাস দিতে পারে তা পরিমাপ করে। সুপরিচিত সিউডো আর ^ 2 হলেন ম্যাকফ্যাডডেন (1974) এবং কক্স এবং স্নেল (1989)।

  2. সদ্ব্যবহারের পরিসংখ্যান

    পরীক্ষাটি বলছে যে আপনি মডেলটিকে আরও জটিল করে তুলতে আরও ভাল করতে পারবেন কিনা, যা আসলে পরীক্ষা করছে যে কোনও অনৈখিকতা বা মিথস্ক্রিয়া আছে কিনা testing

    আমি আমার মডেলটিতে উভয় পরীক্ষা বাস্তবায়ন করেছি, যা
    ইতিমধ্যে চতুষ্কোণ এবং ইন্টারঅ্যাকশন যুক্ত করেছে:

    >summary(spec_q2)
    
    Call:
    glm(formula = result ~ Top + Right + Left + Bottom + I(Top^2) + 
     I(Left^2) + I(Bottom^2) + Top:Right + Top:Bottom + Right:Left, 
     family = binomial())
    
     Coefficients:
                 Estimate Std. Error z value Pr(>|z|)    
    (Intercept)  0.955431   8.838584   0.108   0.9139    
    Top          0.311891   0.189793   1.643   0.1003    
    Right       -1.015460   0.502736  -2.020   0.0434 *  
    Left        -0.962143   0.431534  -2.230   0.0258 *  
    Bottom       0.198631   0.157242   1.263   0.2065    
    I(Top^2)    -0.003213   0.002114  -1.520   0.1285    
    I(Left^2)   -0.054258   0.008768  -6.188 6.09e-10 ***
    I(Bottom^2)  0.003725   0.001782   2.091   0.0366 *  
    Top:Right    0.012290   0.007540   1.630   0.1031    
    Top:Bottom   0.004536   0.002880   1.575   0.1153    
    Right:Left  -0.044283   0.015983  -2.771   0.0056 ** 
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1
    (Dispersion parameter for binomial family taken to be 1)
    Null deviance: 3350.3  on 2799  degrees of freedom
    Residual deviance: 1984.6  on 2789  degrees of freedom
    AIC: 2006.6
    

এবং পূর্বাভাস শক্তি নীচের হিসাবে রয়েছে, মাফ্যাডেন 0.4004 এবং মডেলের খুব ভাল ফিট উপস্থাপনের জন্য 0.2 ~ 0.4 এর মধ্যে মানটি নেওয়া উচিত (লুভিয়ের এট আল (2000), ডোমেনিক এবং ম্যাকফ্যাডেন (1975)):

 > PseudoR2(spec_q2)
    McFadden     Adj.McFadden        Cox.Snell       Nagelkerke McKelvey.Zavoina           Effron            Count        Adj.Count 
   0.4076315        0.4004680        0.3859918        0.5531859        0.6144487        0.4616466        0.8489286        0.4712500 
         AIC    Corrected.AIC 
2006.6179010     2006.7125925 

এবং উপযুক্ততা পরিসংখ্যান:

 > hoslem.test(result,phat,g=8)

     Hosmer and Lemeshow goodness of fit (GOF) test

  data:  result, phat
  X-squared = 2800, df = 6, p-value < 2.2e-16

আমার বোঝার হিসাবে, জিওএফ প্রকৃতপক্ষে নিম্নলিখিত নাল এবং বিকল্প অনুমানটি পরীক্ষা করছে:

  H0: The models does not need interaction and non-linearity
  H1: The models needs interaction and non-linearity

যেহেতু আমার মডেলগুলি ইতিমধ্যে ইন্টারঅ্যাকশন যুক্ত করেছে, অ-লিনিয়ারিটি ইতিমধ্যে এবং পি-ভ্যালু শো এইচ 0 টি প্রত্যাখ্যান করা উচিত, তাই আমি এই সিদ্ধান্তে পৌঁছেছি যে আমার মডেলটির মিথস্ক্রিয়া দরকার, প্রকৃতপক্ষে অ-রৈখিকতা প্রয়োজন। আশা করি আমার ব্যাখ্যাটি সঠিক এবং অগ্রিম কোনও পরামর্শের জন্য ধন্যবাদ, ধন্যবাদ।



2
এইচএল পরীক্ষার জন্য পি-মানের চেয়ে অন্তর্নিহিত টেবিলটি দেখতে আরও ভাল। এবং আপনার মডেল থেকে অবশিষ্টাংশ প্লট এ। সমস্যাটি কোথায় তা এটি দেখায়।
সম্ভাব্যতাব্লোগিক

উত্তর:


26

সমাধান করার জন্য বেশ কয়েকটি সমস্যা রয়েছে।

  • R2R2R2
  • হোস্টার-লেমেশো পরীক্ষা সামগ্রিক ক্রমাঙ্কন ত্রুটির জন্য, চতুর্ভুজ প্রভাবগুলির মতো ফিটের কোনও বিশেষ অভাবের জন্য নয়। এটি যথাযথভাবে অত্যধিক মান বিবেচনায় নেয় না, বিনের পছন্দ এবং গণনা কোয়ান্টাইলগুলির পদ্ধতির ক্ষেত্রে স্বেচ্ছাচারিতা হয় এবং প্রায়শই এমন ক্ষমতা থাকে যা খুব কম থাকে।
  • এই কারণে হোসমার-লেমশো পরীক্ষার আর সুপারিশ করা হয় না। আর rmsপ্যাকেজ residuals.lrmফাংশনে বাস্তবায়িত হোস্টার এট আল-র ফিটের আরও ভাল একটি ডিএফ ওমনিবাস পরীক্ষা রয়েছে ।
  • আপনার ক্ষেত্রে উপযুক্ততার সদ্ব্যবহারের মূল্যায়ন যৌথভাবে পরীক্ষার মাধ্যমে (একটি "অংশ" পরীক্ষায়) সমস্ত বর্গ এবং ইন্টারঅ্যাকশন শর্তগুলির অবদানের দ্বারা নির্ধারণ করা যেতে পারে।
  • তবে আমি মডেলটিকে আরও বেশি করে ফিট করার জন্য বিশেষত সুপারিশ করার পরামর্শ দিচ্ছি (বিশেষত রিগ্রেশন স্প্লিন্স ব্যবহার করে লিনিয়ারিটি অনুমানের বিষয়ে শিথিল করা) এবং ওভারফিটিংয়ের অনুমান করার জন্য বুটস্ট্র্যাপ ব্যবহার করে এবং নিখুঁততা পরীক্ষা করার জন্য একটি অতিরিক্ত-সংশোধন উচ্চ-রেজোলিউশন মসৃণ ক্যালিব্রেশন কার্ভ পেতে সঠিকতা. এগুলি আর rmsপ্যাকেজ ব্যবহার করে করা হয় ।

শেষ মুহুর্তে, আমি দর্শনের পছন্দ করি যে মডেলগুলি নমনীয় (যেভাবেই নমুনার আকার দ্বারা সীমাবদ্ধ) এবং আমরা "ফিটের অভাব" এর চেয়ে "ফিট" তে বেশি মনোনিবেশ করি।


2
আর2

1-আর2

4

উইকিপিডিয়া থেকে :

মডেল জনগোষ্ঠীর উপগোষ্ঠীতে পর্যবেক্ষণ হওয়া ইভেন্টের হারগুলি প্রত্যাশিত ইভেন্টের হারের সাথে মেলে কিনা তা পরীক্ষা করে নির্ধারিত হয়। হোসমার – লেমেশো পরীক্ষাটি বিশেষত উপগঠনগুলিকে লাগানো ঝুঁকিপূর্ণ মানগুলির ডেসাইল হিসাবে চিহ্নিত করে। যে সকল মডেলগুলির জন্য উপগোষ্ঠীতে প্রত্যাশিত এবং পর্যবেক্ষণ ইভেন্টের হার একই রকম, তাদের ভাল ক্যালিব্রেট বলা হয়।

এর অর্থ: আপনার মডেলটির y স্কোর করার পরে মডেলটি তৈরির পরে, আপনি এটি সত্যিকারের ইভেন্টের হারের মতো 10 ডেসিলের মধ্যে বিতরণ করা হয়েছে কিনা তা পরীক্ষা করে দেখতে চান।

অনুমান হবে তাই

  • এইচ0
  • এইচ1

সুতরাং পি- ভ্যালু .05 এর চেয়ে কম হলে সেগুলি ভাল বিতরণ করা হয় না এবং আপনাকে আপনার মডেলটি পরিমার্জন করতে হবে।

আমি আশা করি এটি আপনার প্রশ্নের কিছু উত্তর দেয়।


3

এটি বরং ফ্র্যাঙ্কহারেলের উত্তর অনুসরণ করে চলেছে, তবে এইচএলএল পরীক্ষার একজন অনুরাগী তার ফলাফল থেকে অনুমান করতে পারে যে আপনার চতুষ্কোণ শর্তাদি এবং কিছু 2 -অর্ডার ইন্টারঅ্যাকশন সত্ত্বেও , মডেলটি এখনও ফিটের উল্লেখযোগ্য অভাব দেখিয়েছে এবং সম্ভবত আরও জটিল মডেল উপযুক্ত হবে। আপনি সুনির্দিষ্ট 1 ম-অর্ডার মডেলের নয়, আপনি নির্দিষ্টভাবে নির্দিষ্ট মডেলটির ফিট পরীক্ষা করছেন।

† এটি একটি সম্পূর্ণ ২ য়-অর্ডার মডেল নয় go তিনটি ইন্টারঅ্যাকশন যেতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.