সংক্ষেপে বিচ্ছুরণ


13

আমি একটি glm.nb দ্বারা পরিচালিত

glm1<-glm.nb(x~factor(group))

গ্রুপটি একটি শ্রেণিবদ্ধ এবং এক্স একটি মেট্রিকাল ভেরিয়েবলের সাথে being আমি যখন ফলাফলগুলির সংক্ষিপ্তসারটি পাওয়ার চেষ্টা করি তখন আমি ব্যবহার করি summary()বা না হয় তার উপর নির্ভর করে কিছুটা আলাদা ফলাফল পাই summary.glmsummary(glm1)আমাকে দেয়

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

যদিও সংক্ষেপ.glm (glm1) আমাকে দেয়

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

আমি ছড়িয়ে পড়া প্যারামিটারটির অর্থ বুঝতে পারি, তবে লাইনের নয়

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

হ্যান্ডবুকটিতে বলা হয়েছে, এটি অনুমানিত বিচ্ছুরণ হবে, তবে এটি একটি খারাপ অনুমান বলে মনে হচ্ছে, যেহেতু 0.95 0.7109 এর কাছাকাছি নয়, বা অনুমিত বিচ্ছুরণের অনুমিতিগুলির চেয়ে আলাদা কিছু? আমার ধারণা, আমাকে summary.nb(x, dispersion=)কিছুতে ছড়িয়ে দিতে হবে, তবে আমি নিশ্চিত নই, যদি আমাকে ছড়িয়ে দিতে হয় 1 (যা একই ফলাফল দেবে summary()বা আমার যদি ছড়িয়ে পড়ার প্যারামিটারের একটি অনুমান লিখতে হবে, এই ক্ষেত্রে summary.nb(glm1, dispersion=0.7109)বা অন্য কিছু বাড়ে? বা আমি কেবল ব্যবহার করে ভাল আছি summary(glm1)?


3
ক্লাস নেগবিনের জন্য যথাযথ এস 3 পদ্ধতিতে প্রেরণ হিসাবে সারাংশ () ব্যবহার করুন। বিচ্ছুরণ অবশ্যই 1 হতে হবে, যা অনুমান করা হয় তা থেইটা, যা বিভ্রান্তি এড়ানোর জন্য শেপ প্যারামিটার হিসাবে আরও ভাল বলে। এছাড়াও দেখুন stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…
মোমো

উত্তর:


13

প্রথমত, আপনার summary.glmক্লাসের কোনও বিষয় ব্যবহার করা উচিত নয় "negbin"। আপনি যদি ফাংশন কোডটির দিকে তাকান তবে summary.glmঠিক উপরের দিকে আপনি এর গণনাটি দেখতে পাবেন dispersion। মনে রাখবেন যে summary.glm কেবলমাত্র এমন মডেলগুলিই জানে যেগুলি glmএটি উপযুক্ত করতে পারে এবং তাই এটি চিকিত্সার জন্য দ্বিপদী এবং পোইসন পরিবারগুলিকে একত্র করে, যেখানে ছড়িয়ে পড়া প্যারামিটার 1 সমতুল্য বলে ধরে নেওয়া হয়, এইগুলি ছাড়া অন্য মডেলগুলির জন্য গণনা করা হয়েছে মডেল বস্তু, কিন্তু মনে রাখবেন এটি একটি ধৃষ্টতা উপর ভিত্তি করে তৈরি যে এই একটি পরিবার যে জন্য উপযুক্ত না দ্বিপদ বা পইসন। মডেল জন্য দ্বারা লাগানো হয় । সুতরাং আপনি যখন ব্যবহারϕϕϕfamilyglm.nb"Negative Binomial(theta)"summary.glmমডেল দ্বারা লাগানো glm.nb, কোড ইন

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

জন্য পরীক্ষার "poisson"বা "binomial"ব্যর্থ হয় এবং তারপর নির্ণয় যেখানে প্রকৃত সত্য এই পরিবারের জন্য ডিফল্ট (সংজ্ঞা অনুযায়ী 1 সমান হতে অধিকৃত হয় ।ϕsummary.negbin

এই সঙ্গে কোন সমস্যা নেই নেই, এটা সঠিক পদ্ধতি কল এবং জন্য একটি পৃথক মান সরবরাহ মাত্র সহজ মাধ্যমে যুক্তি ।ϕdispersion

দ্বিতীয়ত, আপনি আউটপুট ভুল বুঝে। কখন দেখছ

Negative Binomial(0.7109)

আমি উপরের দিকে ইঙ্গিত হিসাবে, বন্ধনীতে উদ্ধৃত সংখ্যাটি , নেতিবাচক দ্বিপদী বিতরণের পরামিতি। এই মানটি ফিটিংয়ের সময় অনুমান করা হয়। এটি , ছড়িয়ে দেওয়ার প্যারামিটার এবং সুতরাং দুটি সংখ্যা অগত্যা সমান হওয়া উচিত নয়; তারা মাত্র দুটি সংখ্যা। φθ^ϕ

যেহেতু গণিত ছড়িয়ে পড়া (উপরে বর্ণিত কোডটি অনুসরণ করে) একজনের (~ ০.৯৯) এর খুব কাছাকাছি, errors মানক ত্রুটির জন্য ব্যবহৃত অনুমানটি খুব খারাপ নয় । আপনি অবশ্যই করতে পারেন, ঠিক আছেϕ = 1ϕϕ=1summary.negbin

summary(glm1, dispersion = 0.9509)

এবং negbinপদ্ধতিটি আপনাকে দেয় এমন অতিরিক্ত আউটপুট পান plus মান চেয়ে গুণিত গণনা ।φ


5
+1 সুন্দর ব্যাখ্যা। আমার দুটি ছোট মন্তব্য আছে: দ্বি-দ্বি, পইসন এবং পরিচিত আকারের প্যারামিটার সহ নেতিবাচক দ্বিখণ্ডিতের ছড়িয়ে পড়া প্যারামিটারটি তাত্ত্বিক পরিবারের সংজ্ঞা অনুসারে 1 (এটি কোনও অনুমান নয়)। আপনি যখন বলেন যে আলাদাভাবে বিচ্ছুরণের অনুমান করা যায় এবং সংক্ষিপ্ত পদ্ধতিতে সরবরাহ করা যায় তখন অবশ্যই সতর্কতা অবলম্বন করা উচিত কারণ এক আধিক্য অঞ্চলে অভিযান করা উচিত যার বিশেষত সম্ভাবনার প্রভাব রয়েছে।
মোমো

@ মোমো ভাল বলেছেন। আপনি যা বলেছিলেন তা সম্পর্কিত এবং সংশ্লিষ্ট ফাংশনগুলির জন্য সহায়তা পৃষ্ঠার বিশদগুলির মধ্যে আমি ছিঁড়ে গিয়েছিলাম।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

2

ভেনেবলস এবং রিপ্লে (2002) থেকে, এস সঙ্গে আধুনিক প্রয়োগ পরিসংখ্যান : 'থেটা' আকৃতির দিয়ে গামা বিতরণ সংজ্ঞায়িত করেছেθ1θ11θওয়াইμμ

(Y)=Γ(θ+ +Y)Γ(θ)Y!μYθθ(μ+ +θ)θ+ +Y

প্রত্যাশা

ওয়াই=μ

& বৈকল্পিক

varওয়াই=μ+ +μ2θ

@ মোমো যেমন উল্লেখ করেছে, বিচ্ছুরণ প্যারামিটারটি সম্পূর্ণরূপে অন্য একটি জিনিস, যা আপনি আধা-সম্ভাবনা অনুমানের ক্ষেত্রে ভিন্ন হতে চান। নেতিবাচক দ্বিপদী মডেল এবং (সত্য) পয়সন মডেলটির জন্য এটি যথাযথভাবে একটির মান হিসাবে স্থির।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.