svyglm বনাম গ্লাম ওজন ব্যবহার


18

আমি জানতে চাই কিভাবে ওজন চিকিত্সার মধ্যে পার্থক্য svyglmএবংglm

আমি twangআর-তে প্যাকেজটি প্রপেনসিটি স্কোর তৈরি করতে ব্যবহার করছি যা নীচে ওজন হিসাবে ব্যবহার করা হয় (এই কোডটি twangডকুমেন্টেশন থেকে আসে ):

library(twang)
library(survey)
set.seed(1)

data(lalonde)

ps.lalonde <- ps(treat ~ age + educ + black + hispan + nodegree + married + re74 + re75,
 data = lalonde)

lalonde$w <- get.weights(ps.lalonde, stop.method="es.mean")
design.ps <- svydesign(ids=~1, weights=~w, data=lalonde)

glm1 <- svyglm(re78 ~ treat, design=design.ps)

summary(glm1)

...
Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      374.4  17.853   <2e-16 ***
treat         -432.4      753.0  -0.574    0.566    

এর সাথে তুলনা করুন:

glm11 <- glm(re78 ~ treat, weights=w , data=lalonde)
summary(glm11)

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   6685.2      362.5  18.441   <2e-16 ***
treat         -432.4      586.1  -0.738    0.461  

সুতরাং প্যারামিটারের অনুমানগুলি একই তবে চিকিত্সার জন্য স্ট্যান্ডার্ড ত্রুটিগুলি একেবারেই আলাদা।

ওজন চিকিত্সার মধ্যে পার্থক্য নেই svyglmএবং glm?

উত্তর:


11

বিভিন্ন ধরণের ওজন প্রচুর পরিমাণে হয় এবং এগুলি একধরণের বিভ্রান্তিকর হয়। আপনি বিভিন্ন ফাংশন বা সফ্টওয়্যার ব্যবহার করছেন যা আপনি যে ধরণের ওজন ব্যবহার করছেন বলে আপনি মনে করেন সেগুলি ব্যবহার করার সময় আপনাকে খুব সতর্কতা অবলম্বন করতে হবে।

Svyglm ফাংশন জরিপ ওজন ব্যবহার করে - এই ওজন প্রতিটি ক্ষেত্রে তাদের প্রতিনিধি করে তোলে (একে অপরের প্রতি, twang পরে) গুরুত্ব। আমি নিশ্চিত না যে ওজন গ্ল্যামে কী করে () - আমি মনে করি তারা এই ব্যবস্থার যথার্থতার প্রতিনিধিত্ব করে। (আপনি যদি দ্বিপদী পরিবার ব্যবহার করেন তবে তাদের আলাদা অর্থ রয়েছে)।

জরিপ ওজন (সার্ভেগ্ল্যামে) ওজনগুলি যা আপনি চান সেটি সঠিক মানক ত্রুটিগুলি দেয়।

(ফ্রিকোয়েন্সি ওজন, বিশ্লেষণমূলক ওজন এবং গুরুত্ব ওজনও রয়েছে)।


(+1) আপনাকে ধন্যবাদ। আপনি কী জরিপ ওজনের জন্য অ্যাক্সেসযোগ্য রেফারেন্স জানেন, ডকগুলি ছাড়া অন্য surveyglm)?
জো কিং

1
আমি লামলির বইটি পছন্দ করি: amazon.com/Complex- সার্ভেয়েস
জেরেমি মাইলস

1
রেফারেন্সের জন্য ধন্যবাদ।, অ্যাক্সেসযোগ্য দ্বারা আমি অনলাইনে উপলভ্য কিছু বুঝিয়েছি, দুঃখিত। আমার কাছে ভাল লাইব্রেরিগুলিতে সহজ অ্যাক্সেস নেই ....
জো কিং

হুমম ... আমি কোনও কিছু জুড়ে আসার কথা মনে করি না, তবে আমি যা দেখতে পাব তা আমি দেখতে পাচ্ছি।
জেরেমি মাইলস

9

surveyনমুনা ওজন দ্বারা প্রবর্তন নির্ভুলতা ক্ষয় বিবেচনা সঙ্গে স্ট্যান্ডার্ড ত্রুটিগুলি গণনা। glmসর্বনিম্ন স্কোয়ার অনুমানের ত্রুটিগুলিতে দেওয়া ওজনগুলি কেবলমাত্রভাবে সামঞ্জস্য করে, তাই স্ট্যান্ডার্ড ত্রুটিগুলি সঠিক হয় না। লামলে (2010) থেকে একটি নির্বাচন এখানে দেওয়া হয়েছে:

একটি মডেল-ভিত্তিক বিশ্লেষণে সঠিক স্ট্যান্ডার্ড ত্রুটিগুলি পেতে মডেলটির এলোমেলো অংশটি সঠিকভাবে নির্দিষ্ট করা প্রয়োজন তবে আমাদের সমস্ত স্ট্যান্ডার্ড ত্রুটির অনুমান নকশা-ভিত্তিক এবং তাই মডেল নির্বিশেষে বৈধ। এটি লক্ষণীয় যে "স্যান্ডউইচ", বা "মডেল-দৃust়", বা "হিটারোস্কেস্টাস্টিটিস-সামঞ্জস্যপূর্ণ" স্ট্যান্ডার্ড ত্রুটিগুলি কখনও কখনও মডেল-ভিত্তিক রিগ্রেশন বিশ্লেষণে ব্যবহৃত ডিজাইন-ভিত্তিক স্ট্যান্ডার্ড ত্রুটির সাথে আমরা প্রায় ব্যবহার করব; মূল পার্থক্য হস্তান্তরকরণ হ্যান্ডলিং মধ্যে।

সুতরাং আপনার নকশায় স্তর ছাড়াই আপনি সম্ভবত দেখতে পাবেন যে ব্যবহারের sandwichফলে আপনি অভিন্ন বা কাছাকাছি-অভিন্ন অ্যাসেসমেন্ট পাবেন।

library(sandwich)
coefs <- vcovHC(glm11, type="HC0")
lmtest::coeftest(glm11,coefs)

আমার পরীক্ষায়, তারা "HC0" বা "HC1" ব্যবহার করার সময় ঠিক গণনা করেনি, তবে খুব ঘনিষ্ঠ ছিল। svyglmটি-মানের পরিবর্তে এখন একটি জেড-ভ্যালুও জানাচ্ছে।


2
যদি ভবিষ্যতের পাঠকের পক্ষে সহায়ক হয়: coeftestআর প্যাকেজ থেকে lmtest
সুইহার্ট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.