R তে গ্ল্যাম - কোন প্যাভালু পুরো মডেলের ফিটের ধার্মিকতার প্রতিনিধিত্ব করে?


10

আমি আর (জেনারাইজড লিনিয়ার মডেল) এ গ্ল্যামস চালাচ্ছি। আমি ভেবেছিলাম আমি প্যাভেলগুলি জানতাম - যতক্ষণ না আমি দেখেছি যে কোনও গ্ল্যামের জন্য সংক্ষিপ্তসারটি কল করা আপনাকে পুরো হিসাবে মডেলটির ওভাররাইডিং মানসিক প্রতিনিধি দেয় না - কমপক্ষে যেখানে লিনিয়ার মডেলগুলি করেন না।

আমি ভাবছি যে এটি সহগের টেবিলের শীর্ষে, ইন্টারসেপ্টের মান হিসাবে দেওয়া হয়? সুতরাং নীচের উদাহরণে, উইন্ড.স্পিড..কনটস এবং ক্যানোপি_ডেনসিটি মডেলের জন্য গুরুত্বপূর্ণ হতে পারে, তবে আমরা কীভাবে জানব যে মডেলটি নিজেই তাৎপর্যযুক্ত কিনা? আমি কীভাবে জানব যে এই মানগুলিতে বিশ্বাস রাখতে হবে? আমি কি অবাক হওয়ার অধিকার নেই যে (ইন্টারসেপ্ট) এর জন্য জন (> | z |) মডেলটির তাত্পর্য উপস্থাপন করে? এই মডেল কি গুরুত্বপূর্ণ ভাবেন ??? ধন্যবাদ!

আমার নোট হওয়া উচিত যে এফ-পরীক্ষা চালানো কোনও অগ্রগতি দেবে না কারণ আমি একটি ত্রুটি বার্তা পেয়ে বলেছি যে দ্বিপদী পরিবারে এফ-পরীক্ষা চালানো অনুচিত।

Call:
glm(formula = Empetrum_bin ~ Wind.speed..knots. + canopy_density, 
    family = binomial, data = CAIRNGORM)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.2327  -0.7167  -0.4302  -0.1855   2.3194  

Coefficients:
                   Estimate Std. Error z value Pr(>|z|)  
(Intercept)          1.8226     1.2030   1.515   0.1298  
Wind.speed..knots.  -0.5791     0.2628  -2.203   0.0276 *
canopy_density      -2.5733     1.1346  -2.268   0.0233 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 59.598  on 58  degrees of freedom
Residual deviance: 50.611  on 56  degrees of freedom
  (1 observation deleted due to missingness)
AIC: 56.611

1
যদি আমি দ্বিপদী রিগ্রেশনটিতে সঠিকভাবে স্মরণ করি তবে আপনাকে বিচ্যুতি পরীক্ষা করা উচিত, যেমন একটি লগ সম্ভাবনা পরীক্ষা - যা লিনিয়ার রিগ্রেশন-এ ব্যবহৃত এফ-পরীক্ষার অনুরূপ। এটি -2 * (নাল এলএল - স্যাচুরেটেড এলএল) যা চি-স্কোয়ার বিতরণে ফিট করে fits যদিও আমি আপনার সারাংশ আউটপুটে কোনও মডেল লগের সম্ভাবনা দেখতে পাচ্ছি না। এটি কি মডেল অবজেক্টে কিন্তু সংক্ষিপ্ত আউটপুটে নয়?
স্যামপাসমোর

উত্তর:


10

আপনি হয় (59.598-50.611) একটি চি-স্কোয়ার বনাম (58-56) ডিএফ এর একটি অ্যাসিম্পোটিক চি-স্কোয়ার পরীক্ষা করতে পারেন, বা anova()আপনার গ্ল্যাম অবজেক্টে ব্যবহার করতে পারেন (এটি সরাসরি পরীক্ষা করে না, তবে কমপক্ষে গণনা করে ( 59.598-50.611) এবং (58-56) আপনার জন্য)।

এটি কার্যকরভাবে বিচ্যুতি বিশ্লেষণ

এখানে আপনি যে ধরণের গণনা করতে পারেন তা এখানে রয়েছে (একটি ভিন্ন ডেটা সেটে, যা আর এর সাথে আসে):

spray1=glm(count~spray,family=poisson,data=InsectSprays)  # full model
spray0=glm(count~1,family=poisson,data=InsectSprays)      # null model
with(anova(spray0,spray1),pchisq(Deviance,Df,lower.tail=FALSE)[2]) 

যা বিচ্যুতির ভিত্তিতে একটি অ্যাসিম্পটোটিক চি স্কোয়ার স্ট্যাটিস্টিকের জন্য পি-মান দেয় ।

অথবা আপনি এটি করতে devianceএবং df.residualকার্যগুলি ব্যবহার করতে পারেন :

 pchisq(deviance(spray0)-deviance(spray1),
     df.residual(spray0)-df.residual(spray1),
    lower.tail=FALSE)

-

অনেক লোক পূর্ণ এবং নাল-মডেল এআইসির (অথবা কিছু ক্ষেত্রে, আগ্রহের কোনও মডেল এবং স্যাচুরেটেড মডেলের মধ্যে একটি তুলনা) এর মধ্যে তুলনাটি ব্যবহার করার জন্য মডেলটি সেই দিক থেকে শূন্যের চেয়ে ভাল ছিল কিনা তা কাজে লাগাবে would

-

আমি কি অবাক হওয়ার অধিকার নেই যে (ইন্টারসেপ্ট) এর জন্য জন (> | z |) মডেলটির তাত্পর্য উপস্থাপন করে?

এটা হয় না। প্রকৃতপক্ষে, ইন্টারসেপ্ট পি-মান সাধারণত সরাসরি আগ্রহের হয় না।

আপনি যদি ছড়িয়ে পড়া প্যারামিটার সহ কোনও মডেল বিবেচনা করছেন, আমি কিছু লোককে অ্যাসিম্পটোটিক চি-স্কোয়ারের পরিবর্তে এফ-পরীক্ষা করার জন্য তর্ক করতে দেখেছি; এটি পৃথক সহগের উপর অ্যাজের পরিবর্তে একটি টি-টেস্ট ব্যবহারকারীদের সাথে সম্পর্কিত। এটি ছোট নমুনায় একটি যুক্তিসঙ্গত অনুমান হতে পারে না। আমি এমন কোনও উপার্জন বা সিমুলেশন দেখিনি যা এফটি সুপারিশ করবে যে সাধারণভাবে জিএলএমগুলির ক্ষেত্রে উপযুক্ত অনুমিতিকরণ (অর্থাত্ অ্যাসিম্পটোটিক ফলাফলের চেয়ে ভাল)। একটি ভাল থাকতে পারে, কিন্তু আমি এটি দেখিনি।


2
এছাড়াও আপনি চালাতে পারে Anova(fit, type = 2)থেকে carগ্রন্থাগার
Algorithmatic

3

আপনি মডেলটি 'ফিট' অবজেক্টে রয়েছেন বলে ধরে নেওয়া যায় আপনি আপনার দ্বিপদী মডেলটিতে লগ-লাইকুইনটি পরীক্ষা করতে এই কোডটি ব্যবহার করতে পারবেন যেমন আপনি উল্লেখ করেছেন যে কোনও এফ-পরীক্ষা উপযুক্ত নয়, তবে এই মডেলটি আরও ভালভাবে পূর্বাভাস দিলে এই পরীক্ষাটি পরীক্ষা করবে এলোমেলো চেয়ে।

LLR = -2 * (fit$null.deviance - fit$deviance)

এটি লগ-সম্ভাবনা অনুপাত পরীক্ষার সূত্র।

pchisq(LLR, 2, lower.tail = FALSE)

এবং এটি আপনাকে পি-মান দেবে। ধারণা আমি 100% আত্মবিশ্বাসী না যে সঠিক df। আমি নিশ্চিত যে এটি প্যারামিটারের সংখ্যার মধ্যে পার্থক্য, যার মধ্যে আপনার 2 টি আপনার স্যাচুরেটেড মডেল এবং নল মডেলটিতে কোনওটি নেই, এরফ ডিএফ = 3 - 1 = 2 তবে এটি অনুসরণ করার মতো কিছু হতে পারে।


1

এফχ2

বিকল্পভাবে, আপনি এআইসি, বা বিআইসির মতো সম্পর্কিত ব্যবস্থাগুলি দেখতে পারেন।

আর2

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.