গামা বিতরণের সাথে জিএলএম এর জন্য আর ব্যবহার করে


14

গামা বিতরণ ব্যবহার করে কোনও জিএলএম ফিট করার জন্য আর এর সিনট্যাক্সটি বোঝার জন্য আমার বর্তমানে সমস্যা হচ্ছে।

আমার কাছে ডেটার একটি সেট রয়েছে, যেখানে প্রতিটি সারিতে 3 সহ-ভেরিয়েট ( ), একটি প্রতিক্রিয়া ভেরিয়েবল ( ) এবং একটি আকারের প্যারামিটার ( ) থাকে। আমি 3 covariates একটি রৈখিক ফাংশন হিসাবে গামা বিতরণের স্কেল মডেল করতে চাই, কিন্তু আমি বুঝতে পারছি না বিতরণের আকৃতি সেট কিভাবে ডেটার প্রতিটি সারির জন্য।X1,X2,X3YKK

এমন একটি পরিস্থিতি যা আমি সাদৃশ্যপূর্ণ মনে করি তা হল দ্বিপদী বিতরণের জন্য, জিএলএমের প্রয়োজনীয় প্রতিটি পরীক্ষার জন্য পরীক্ষার সংখ্যা ( ) পরিচিত isN

উত্তর:


12

সাধারণ গামা জিএলএম ধারনাটি ধারণ করে যে আকারের প্যারামিটারটি স্থির থাকে, একইভাবে স্বাভাবিক রৈখিক মডেল ধ্রুবক বৈকল্পিকতা ধরে নেয়।

GLM প্যারামিটারে, in সাধারণত ধ্রুবক থাকে।বর্ণ ( Y i ) = ϕ V ( μ i )ϕVar(Yi)=ϕV(μi)

আরও সাধারণভাবে, আপনার , তবে এটি কোনও লাভ করে না।a(ϕ)

নির্দিষ্ট আকারের প্যারামিটারের এই প্রভাবটি অন্তর্ভুক্ত করার জন্য সম্ভবত একটি ভারিত গামা জিএলএম ব্যবহার করা সম্ভব হতে পারে তবে আমি এখনও এই সম্ভাবনাটি তদন্ত করি নি (এটি যদি কাজ করে তবে সম্ভবত এটি করা সহজতম উপায়, তবে আমি মোটেও না নিশ্চিত যে এটি)।

যদি আপনার একটি ডাবল জিএলএম থাকে তবে আপনি সেই প্যারামিটারটি কোভারিয়েটগুলির ফাংশন হিসাবে অনুমান করতে পারেন ... এবং যদি ডাবল গ্ল্যাম সফ্টওয়্যার আপনাকে বৈকল্পিক শব্দটিতে কোনও অফসেট নির্দিষ্ট করতে দেয় আপনি এটি করতে পারেন। দেখে মনে হচ্ছে dglmপ্যাকেজটিতে ফাংশন dglmআপনাকে একটি অফসেট নির্দিষ্ট করতে দেয়। আমি জানি না যদিও এটি আপনাকে (যেমন) বলার মতো কোনও বৈকল্পিক মডেল নির্দিষ্ট করতে দেয় কিনা ~ offset(<something>) + 0

আরেকটি বিকল্প হ'ল সরাসরি সম্ভাবনা বাড়ানো ize


> y <- rgamma(100,10,.1)

> summary(glm(y~1,family=Gamma))

Call:
glm(formula = y ~ 1, family = Gamma)

Deviance Residuals: 
     Min        1Q    Median        3Q       Max  
-0.93768  -0.25371  -0.05188   0.16078   0.81347  

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 0.0103660  0.0003486   29.74   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for Gamma family taken to be 0.1130783) 

    Null deviance: 11.223  on 99  degrees of freedom
Residual deviance: 11.223  on 99  degrees of freedom
AIC: 973.56

Number of Fisher Scoring iterations: 5

লাইন যেখানে এটি বলে:

   (Dispersion parameter for Gamma family taken to be 0.1130783)

আপনি চান এক

সেই গ্যামার শেপ প্যারামিটারের সাথে সম্পর্কিত।ϕ^


1
ধন্যবাদ। আর-তে, কী তা নির্দিষ্ট করার কোনও উপায় আছে ? এই লিঙ্কটি থেকে , দেখে মনে হচ্ছে যে ফলাফলগুলি মুদ্রণ না করা পর্যন্ত আমাকে কোনও প্রদত্ত নিয়ে সিদ্ধান্ত নিতে হবে না । আমি কি এই কথাটি সঠিক করে বলছি যে যদি একটি স্থির , তবে এটি , গুণাগুণ ভেক্টরের ফলাফলকে প্রভাবিত করে না ? যদি তা হয়, তবে আমি ম্যানুয়ালি (আর ব্যবহার না করে) ডেটা ফিট করার সেরা সম্পর্কে কীভাবে সিদ্ধান্ত নেব ? কে কে β কেϕ=KKKβK
জন ক্লজ

যদি গামা জন্য একটি নির্দিষ্ট আকৃতি প্যারামিটার তা অনুমান প্রভাবিত করে না না সহগ ভেক্টর পারেন, তাই। আপনি জিএলএম আউটপুট থেকে একটি অনুমান গণনা করতে পারেন , তবে এটি সর্বাধিক সম্ভাবনা নয়। আমি যদি আকারের প্যারামিটারটি সনাক্ত করতে চাইতাম, আমি প্যাকেজে প্রাসঙ্গিক ফাংশনগুলি ব্যবহার করব । কেন আর ব্যবহার করা এড়ানো গুরুত্বপূর্ণ, এবং কেন আপনি কম্পিউটার ব্যবহার না করে নিজেই এটি করার চেষ্টা করবেন? μMASS
গ্লেন_বি -রিনস্টেট মনিকা

আমি ভুল বানান। ম্যানুয়ালি দ্বারা, আমি বোঝাতে চেয়েছিলাম যে আমি একটি শালীন সহজ অ্যালগরিদম চেয়েছিলাম আমি নিজেকে আর এর বাইরে প্রয়োগ করতে পারি Also এছাড়াও, যখন আমি পরীক্ষা করার চেষ্টা করি glm(V4 ~ V3 + V2 + V1, family=Gamma), যেখানে ভবিষ্যদ্বাণী সহ- এবং এর প্রতিক্রিয়া, এটি ভুলভাবে নির্ধারণ করে , সহগ ভেক্টর। আমি জানি এটি সঠিকভাবে এটি নির্ধারণ করে কারণ আমি স্কেল এবং 5 এর ধ্রুবক আকৃতি নির্ধারণ করতে পরিচিত সহগের সাথে নমুনা ডেটা উত্পন্ন করেছিভি 4V1,V2,V3V4β
জোন ক্লজ

1
আচ্ছা আপনি আর এর বাইরে যে কোনও কিছু প্রয়োগ করতে পারেন যা প্রয়োগ করতে পারে; আপনি সম্ভাবনা সর্বাধিকতর করতে পারেন, উদাহরণস্বরূপ, বা আপনি অফ ব্যবহার করতে পারেন । আপনি এখানে "অনুচিত" বলতে কী বোঝাতে চেয়েছেন তা আরও বিশদে ব্যাখ্যা করতে পারেন? ϕ^
গ্লেন_বি -রিনস্টেট মনিকা

1
আমার নিজের কোডটি পরীক্ষা করার উদ্দেশ্যে, আমি 10,000 টি টিপলস সহ একটি ডেটা সেট তৈরি করেছি। এটি উত্পন্ন করার জন্য, আমি , উত্পন্ন নমুনা fixed নির্ধারণ করেছি , গণনা করা (বিপরীত লিঙ্ক ফাংশন সহ স্কেল প্যারামিটার ), এবং বিতরণ থেকে একটি এলোমেলো পরিবর্তনশীল তৈরি করে । আমি যখন ডেটা সেটটিতে আর চালিত করি, তখন এর পূর্বাভাসযুক্ত কোথাও কাছাকাছি নেই । যখন আমি অন্যান্য বিতরণের জন্য এটি করেছি, তখন আর এর পূর্বাভাস প্রায় সঠিকভাবে ছিল। βVθ=(βTV)1YGamma(5,θ)β^β
জন ক্লজ

12

আমি পরে বালামারী (2013) দ্বারা বর্ণিত ম্যাস প্যাকেজের গামা.শ্যাপ ফাংশনটি ব্যবহার করেছি তারপরে আকারটি প্যারামিটারটি অনুমান করার জন্য এবং তারপরে জিএলএমে সহগের অনুমান এবং পূর্বাভাসগুলি সামঞ্জস্য করতে। আমি আপনাকে বক্তৃতাটি যেমন পড়ার পরামর্শ দিয়েছিলাম, এটি আমার মতে, জিএলএমগুলিতে গামা বিতরণের ব্যবহার সম্পর্কে খুব স্পষ্ট এবং আকর্ষণীয়।

glmGamma <- glm(response ~ x1, family = Gamma(link = "identity")
library(MASS)
myshape <- gamma.shape(glmGamma)
gampred <- predict(glmGamma , type = "response", se = T, dispersion = 1/myshape$alpha) 
    summary(glmGamma, dispersion = 1/myshape$alpha)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.