পোইসন রিগ্রেশন থেকে ডেটা নমুনা তৈরি করুন


14

আমি ভাবছিলাম যে আপনি কীভাবে আর-তে কোনও পায়সন রিগ্রেশন সমীকরণ থেকে ডেটা তৈরি করবেন? আমি সমস্যার মধ্যে কীভাবে যেতে হবে তা নিয়ে একধরণের বিভ্রান্তি রয়েছি।

সুতরাং যদি আমি ধরে নিই যে আমাদের কাছে দুটি অনুমানকারী রয়েছে এবং যা বিতরণ করা হয়েছে । এবং ইন্টারসেপ্ট 0 এবং উভয় সহগ দুটি সমান হয়। তারপরে আমার অনুমানটি সহজ:X1X2N(0,1)

log(Y)=0+1X1+1X2

তবে একবার আমি লগ (Y) গণনা করেছি - এর ভিত্তিতে আমি কীভাবে পোয়েসন গণনাগুলি তৈরি করতে পারি? পোইসন বিতরণের জন্য হারের পরামিতি কী?

কেউ যদি একটি সংক্ষিপ্ত আর স্ক্রিপ্ট লিখতে পারেন যা পোয়েসন রিগ্রেশন নমুনা জেনারেট করে যে দুর্দান্ত হবে!

উত্তর:


25

পোইসন রিগ্রেশন মডেল জন্য একটি পয়েসন বিতরণ ধরে এবং লিংক ফাংশনটি ব্যবহার করে । সুতরাং, একক ব্যাখ্যামূলক চলক , ধরে নেওয়া হয় যে (যাতে ) এবং । সেই মডেল অনুসারে ডেটা তৈরি করা সহজেই অনুসরণ করে। এখানে একটি উদাহরণ যা আপনি নিজের দৃশ্যের সাথে মানিয়ে নিতে পারেন।YlogxYP(μ)E(Y)=V(Y)=μlog(μ)=β0+β1x

>   #sample size
> n <- 10
>   #regression coefficients
> beta0 <- 1
> beta1 <- 0.2
>   #generate covariate values
> x <- runif(n=n, min=0, max=1.5)
>   #compute mu's
> mu <- exp(beta0 + beta1 * x)
>   #generate Y-values
> y <- rpois(n=n, lambda=mu)
>   #data set
> data <- data.frame(y=y, x=x)
> data
   y         x
1  4 1.2575652
2  3 0.9213477
3  3 0.8093336
4  4 0.6234518
5  4 0.8801471
6  8 1.2961688
7  2 0.1676094
8  2 1.1278965
9  1 1.1642033
10 4 0.2830910

3

আপনি যদি মডেলটিকে পুরোপুরি ফিট করে এমন কোনও ডেটা সেট তৈরি করতে চান তবে আপনি এ জাতীয় কিছু করতে পারেন R:

# y <- exp(B0 + B1 * x1 + B2 * x2)

set.seed(1234)

B0 <-  1.2                # intercept
B1 <-  1.5                # slope for x1
B2 <- -0.5                # slope for x2

y <- rpois(100, 6.5)

x2 <- seq(-0.5, 0.5,,length(y))
x1 <- (log(y) - B0 - B2 * x2) / B1

my.model <- glm(y ~ x1 + x2, family = poisson(link = log))
summary(my.model)

যা ফেরত:

Call:
glm(formula = y ~ x1 + x2, family = poisson(link = log))

Deviance Residuals: 
       Min          1Q      Median          3Q         Max  
-2.581e-08  -1.490e-08   0.000e+00   0.000e+00   4.215e-08  

Coefficients:
            Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.20000    0.08386  14.309  < 2e-16 ***
x1           1.50000    0.16839   8.908  < 2e-16 ***
x2          -0.50000    0.14957  -3.343 0.000829 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for poisson family taken to be 1)

    Null deviance: 8.8619e+01  on 99  degrees of freedom
Residual deviance: 1.1102e-14  on 97  degrees of freedom
AIC: 362.47

Number of Fisher Scoring iterations: 3
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.