নাল এবং মডেল বিচ্যুতি ব্যবহার করে জিএলএম মডেলটি পরীক্ষা করুন


11

আমি আর-তে একটি গ্লোম মডেল তৈরি করেছি এবং এটি একটি টেস্টিং এবং প্রশিক্ষণ গ্রুপ ব্যবহার করে পরীক্ষা করেছি তাই আত্মবিশ্বাসী যে এটি ভালভাবে কাজ করে। আর এর ফলাফলগুলি হ'ল:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

সহগের জন্য সমস্ত পি মানগুলি প্রত্যাশার মতো ছোট।

এই প্রশ্নের দিকে লক্ষ্য করা ( জিএলএম আর তে রেসিডুয়াল এবং নাল ডিভায়েন্সের ব্যাখ্যা ), নাল অনুমানটি নীচের সমীকরণটি ব্যবহার করে রাখলে আমার গণনা করা সম্ভব হবে:

p-value = 1 - pchisq(deviance, degrees of freedom)

এইগুলি দেয় এই:

1 - pchisq(256600, 671266)
[1] 1

সুতরাং আমি কি এই নাল অনুমানটি ভেবে সঠিকভাবে বুঝতে পারি যে এখানে সমস্ত সহগের জন্য পি মানগুলি খুব ছোট বা আমি কীভাবে এটি গণনা করব তা ভুল ব্যাখ্যা দিয়েছি?

উত্তর:


18

এখানে একটি ভুল বোঝাবুঝি হচ্ছে। পার্থক্য নাল বক্রতা এবং মডেল এর বক্রতা মধ্যে একটি চি-ছক স্বাধীন ডিগ্রীগুলির সঙ্গে নাল df প্রয়োগ করার সমান বিতরণ করা হয় মাইনাস মডেলের df প্রয়োগ। আপনার মডেলের জন্য, এটি হবে:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

pchisq()lower.tail = FALSE1


2
আপনি বিবৃতি দিয়ে ঠিক কোন অনুমানের পরীক্ষা করছেন 1-pchisq(256600 - 237230, df=(671266 - 671263))?
jII

5
@ জেসেরিআই, আপনি পরীক্ষা করে দেখছেন যে সুযোগ থেকে প্রত্যাশার চেয়ে বেশি বিচ্যুতি পরিবর্তন হয়েছে কিনা। অর্থাৎ, আপনি পুরোপুরি মডেলটি নাল মডেলের চেয়ে ভাল কিনা তা পরীক্ষা করছেন। এটি একটি রৈখিক মডেলের গ্লোবাল এফ পরীক্ষার সাথে সাদৃশ্যপূর্ণ।
গুং - মনিকা পুনরায়

নাল হাইপোথিসিসটি হ'ল 'পুরো মডেল নাল মডেলের চেয়ে ভাল', এবং আপনি নাল অনুমানকে প্রত্যাখ্যান করেছেন, যার অর্থ মডেলটি দরিদ্র?
jII

3
@jesterII, কোন নাল হাইপোথিসিস হল: 'সামগ্রিকভাবে মডেল কোন ভাল নাল মডেলের তুলনায়'। যেহেতু এটি প্রত্যাখ্যান করা হয়েছে, তাই আমরা সিদ্ধান্ত নিয়েছি যে ডেটা নাল মডেলের সাথে সামঞ্জস্যপূর্ণ নয়। এনবি, এর অর্থ এই নয় যে আমাদের মডেলটি 'ভাল' বা 'সঠিক'।
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.