কীভাবে গ্ল্যাম (আর) এ ফিট হওয়ার উপকারের গণনা করবেন


21

চলমান গ্ল্যাম ফাংশন থেকে আমার নিম্নলিখিত ফলাফল রয়েছে।

আমি নিম্নলিখিত মানগুলি কীভাবে ব্যাখ্যা করতে পারি:

  • নাল বিচ্যুতি
  • বাকী বিচ্যুতি
  • এআইসি

ফিটের ধার্মিকতার সাথে তাদের কি কিছু করার আছে? আমি এই ফলাফলগুলি থেকে আর-স্কোয়ার বা অন্য কোনও পরিমাপের মতো ফিট কিছু পরিমাপের গণনার গণনা করতে পারি?

Call:
glm(formula = tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 + 
    as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7)

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-0.52628  -0.24781  -0.02916   0.25581   0.48509  

Coefficients:
                     Estimate Std. Error  t value Pr(>|t|)    
(Intercept         -1.305e-01  1.391e-01   -0.938   0.3482    
tmpData$X1         -9.999e-01  1.059e-03 -944.580   <2e-16 ***
tmpData$X2         -1.001e+00  1.104e-03 -906.787   <2e-16 ***
tmpData$X3         -5.500e-03  3.220e-03   -1.708   0.0877 .  
tmpData$X4         -1.825e-05  2.716e-05   -0.672   0.5017    
tmpData$X5          1.000e+00  5.904e-03  169.423   <2e-16 ***
tmpData$X6          1.002e+00  1.452e-03  690.211   <2e-16 ***
tmpData$X7          6.128e-04  3.035e-04    2.019   0.0436 *  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

(Dispersion parameter for gaussian family taken to be 0.08496843)

    Null deviance: 109217.71  on 3006  degrees of freedom
Residual deviance:    254.82  on 2999  degrees of freedom
  (4970 observations deleted due to missingness)
AIC: 1129.8

Number of Fisher Scoring iterations: 2

আমি বুঝতে পারি যে এটি এসও থেকে স্থানান্তরিত হয়েছিল, যেখানে কেউ সাধারণত এই পরিসংখ্যানের পদগুলিতে তথ্য খোঁজেন না। আপনার এখানে একটি দুর্দান্ত সংস্থান আছে! উদাহরণস্বরূপ, এআইসির মতো আপনার কয়েকটি শর্তের অনুসন্ধান থেকে আপনি কী শিখতে পারেন তা দেখুন । এটি করার জন্য অল্প সময় ব্যয় করা হয় আপনার প্রশ্নের পুরোপুরি উত্তর দিতে হবে বা কমপক্ষে আপনাকে আরও একটি নির্দিষ্ট প্রশ্ন জিজ্ঞাসা করার জন্য গাইড করতে হবে।
হোবার

গাউসিয়ান গ্ল্যামের সাথে সম্পর্কিত নয়, তবে আপনার যদি বাইনারি ডেটাতে বার্নৌলি গ্লাম লাগানো থাকে তবে আপনি মডেল ফিটকে মূল্যায়নের জন্য অবশিষ্ট অবলম্বন ব্যবহার করতে পারবেন না, কারণ এটি ডেভিলেন্স সূত্রে ডেটা বাতিল করে দেয়। এখন, আপনি এই ক্ষেত্রে দুটি মডেলের তুলনা করতে অবশিষ্ট অবলম্বনের পার্থক্যটি ব্যবহার করতে পারেন , তবে নিজেই অবশিষ্টাংশের বিচ্যুতি নয়।
ফিশারডিজিনফরমেশন

উত্তর:


15

glmR2glmR2R2

RGLM2=1(idi,model2)2/N(idi,null2)2/N        .=.        1SSE/n[model]SST/n[total]=ROLS2

এলএইচএসে এই জাতীয় পরিমাপের ব্যাখ্যা কীভাবে হয় তা নিয়ে কিছুটা বিতর্ক রয়েছে তবে কেবল তখনই যখন মডেলগুলি সরল গাউসিয়ান / ওএলএস পরিস্থিতি থেকে বিদায় নেয়। তবে জিএলএমগুলিতে যেখানে লিঙ্ক ফাংশনটি এখানে যেমন ছিল "পরিচয়" নাও হতে পারে এবং "স্কোয়ার ত্রুটি" এর একই স্পষ্ট ব্যাখ্যা নাও থাকতে পারে, তাই আকাইকে তথ্য মানদণ্ডটিও রিপোর্ট করা হয়েছে কারণ এটি আরও সাধারণ বলে মনে হয়। আছে GLM GOF স্যুইপস্টেক বিভিন্ন অন্যান্য প্রতিযোগী কোন স্পষ্ট বিজয়ী সঙ্গে।

R2


7
উপরের আউটপুটটিতে "নগেলকার্কে সিউডো" "আর 2" "ঠিক কোথায়?
টম

1
আমি টমের প্রশ্নের প্রতিধ্বনি দিচ্ছি। আউটপুটে কোথায় নগেলকার্কে-সিউডো- "আর 2" আছে, বা আমি এটি কীভাবে খুঁজে পাব? আমি মান সম্পর্কে আরও তথ্যের সন্ধান করছি না, বরং আমি আর এর আউটপুটে এটি কোথায় পাব। প্রশ্নের উদাহরণ আউটপুটে এমন কিছুই নেই যা আমার কাছে [0-1] পরিসরে ফিট মানের সদ্ব্যবহারের মতো দেখায়, তাই আমি বিভ্রান্ত হয়ে পড়েছি।
কেভিন -

দেখুন stats.stackexchange.com/questions/8511/... এবং stackoverflow.com/questions/6242818/... ... আমি হয় glm বস্তু বা সারসংক্ষেপ আউটপুটে কোন আর ^ 2 দেখতে না। আমি সম্ভবত আরএমএস সারাংশ ফাংশনগুলি থেকে স্বাভাবিক আউটপুট সম্পর্কে ভাবছিলাম কারণ এটি আমার প্রিয় মডেলিংয়ের পরিবেশ।
ডিউইন

9

নাল ডিভায়েন্স এবং রেসিডুয়াল ডিভ্যান্স ব্যবহার করুন, বিশেষত:

1 - (Residual Deviance/Null Deviance)

আপনি যদি এটির বিষয়ে চিন্তা করেন তবে আপনি আপনার মডেলের বিচ্যুতির অনুপাতটি নালার সাথে পরিমাপ করার চেষ্টা করছেন; কেবলমাত্র বিরতি (নাল বিচ্যুতি) এর চেয়ে আপনার মডেল কতটা ভাল (অবশিষ্ট অবলম্বন) better যদি সেই অনুপাত ক্ষুদ্র হয়, আপনি নালীর বেশিরভাগ বিচ্যুতিটি 'ব্যাখ্যা' করছেন; 1 বিয়োগ যা আপনাকে আপনার আর-স্কোয়ার করে।

আপনার উদাহরণে আপনি .998 পাবেন get

যদি আপনি গ্ল্যামের পরিবর্তে লিনিয়ার মডেল (এলএম) কল করেন তবে এটি আপনাকে সংক্ষিপ্তসারগুলিতে স্পষ্টভাবে একটি আর-স্কোয়ার দেবে এবং আপনি দেখতে পাবেন এটি একই নম্বর number


5

আপনি যদি বাইনারি লজিস্টিক মডেলটি চালাচ্ছেন তবে আপনি আপনার গ্ল্যাম () মডেলটিতে হোসমার লেমশো গুডনেস অফ ফিট পরীক্ষা চালাতে পারেন। রিসোর্সস্লেশন লাইব্রেরি ব্যবহার করে।

library(ResourceSelection)

model <- glm(tmpData$Y ~ tmpData$X1 + tmpData$X2 + tmpData$X3 + 
           as.numeric(tmpData$X4) + tmpData$X5 + tmpData$X6 + tmpData$X7, family = binomial)

summary(model)
hoslem.test(model$y, model$fitted)

যদিও মনে রাখবেন যে এই শুধুমাত্র (বাইনারি নির্ভরশীল পরিবর্তনশীল মডেলের জন্য কাজ করে যেমন যদি ওপি সেট করেছে family = "binomialওপি উদাহরণ রৈখিক রিগ্রেশনের
ম্যাথু

@ ম্যাথেজ এটি সত্য, আমি দুঃখিত যে আমি এটি মিস করেছি। আমি বাইনারি লজিস্টিক রিগ্রেশন এত ইদানীং আমার মস্তিষ্কের মাত্র গিয়েছিলাম ব্যবহার করছিhoslem.test()
dylanjm

বোধগম্য :) আমি আপনার পোস্টে একটি সম্পাদনার পরামর্শ দিয়েছি তবে আর কোডটি আপডেট করতেও ভুলে গিয়েছি। আপনি কেবল এটির স্বচ্ছতার জন্য পরিবর্তন করতে চাইতে পারেন।
ম্যাথু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.