লজিস্টিক রিগ্রেশন এবং ভগ্নাংশ প্রতিক্রিয়া রিগ্রেশন মধ্যে পার্থক্য কি?


13

যতদূর আমি জানি, লজিস্টিক মডেল এবং ভগ্নাংশের প্রতিক্রিয়া মডেল (ফর্ম) এর মধ্যে পার্থক্য হ'ল নির্ভরশীল পরিবর্তনশীল (ওয়াই) যার মধ্যে ফ্র্যাম [0,1] হয় তবে লজিস্টিকটি {0, 1} হয়} আরও, এফআরএম এর পরামিতিগুলি নির্ধারণের জন্য কোটির মতো সম্ভাবনার অনুমানকারী ব্যবহার করে।

সাধারণত, আমরা এর glmমাধ্যমে লজিস্টিক মডেলগুলি পেতে ব্যবহার করতে পারি glm(y ~ x1+x2, data = dat, family = binomial(logit))

এফ আর এম জন্য, আমরা পরিবর্তন family = binomial(logit)করতে family = quasibinomial(logit)

আমি লক্ষ্য করেছি যে আমরা family = binomial(logit)এফআরএমের প্যারামিটারটি ব্যবহার করতে পারি কারণ এটি একই আনুমানিক মান দেয়। নিম্নলিখিত উদাহরণ দেখুন

library(foreign)
mydata <- read.dta("k401.dta")


glm.bin <- glm(prate ~ mrate + age + sole + totemp, data = mydata
,family = binomial('logit'))
summary(glm.bin)

প্রত্যাবর্তন,

Call:
glm(formula = prate ~ mrate + age + sole + totemp, family = binomial("logit"), 
    data = mydata)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-3.1214  -0.1979   0.2059   0.4486   0.9146  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)  1.074e+00  8.869e-02  12.110  < 2e-16 ***
mrate        5.734e-01  9.011e-02   6.364 1.97e-10 ***
age          3.089e-02  5.832e-03   5.297 1.17e-07 ***
sole         3.636e-01  9.491e-02   3.831 0.000128 ***
totemp      -5.780e-06  2.207e-06  -2.619 0.008814 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 1166.6  on 4733  degrees of freedom
Residual deviance: 1023.7  on 4729  degrees of freedom
AIC: 1997.6

Number of Fisher Scoring iterations: 6

এবং এর জন্য family = quasibinomial('logit'),

glm.quasi <- glm(prate ~ mrate + age + sole + totemp, data = mydata
,family = quasibinomial('logit'))
summary(glm.quasi)

প্রত্যাবর্তন,

Call:
glm(formula = prate ~ mrate + age + sole + totemp, family = quasibinomial("logit"), 
    data = mydata)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-3.1214  -0.1979   0.2059   0.4486   0.9146  

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  1.074e+00  4.788e-02  22.435  < 2e-16 ***
mrate        5.734e-01  4.864e-02  11.789  < 2e-16 ***
age          3.089e-02  3.148e-03   9.814  < 2e-16 ***
sole         3.636e-01  5.123e-02   7.097 1.46e-12 ***
totemp      -5.780e-06  1.191e-06  -4.852 1.26e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.2913876)

    Null deviance: 1166.6  on 4733  degrees of freedom
Residual deviance: 1023.7  on 4729  degrees of freedom
AIC: NA

Number of Fisher Scoring iterations: 6

উভয় থেকে অনুমিত বিটা familyএকই, তবে পার্থক্যটি এসই মান values যাইহোক, সঠিক এসই প্রাপ্ত করতে, আমাদের library(sandwich)এই পোস্টে হিসাবে ব্যবহার করতে হবে ।

এখন, আমার প্রশ্নগুলি:

  1. এই দুটি কোডের মধ্যে পার্থক্য কী?
  2. কি দৃm় এসই পেতে চলেছে?

যদি আমার বোঝাপড়াটি সঠিক না হয় তবে দয়া করে কিছু পরামর্শ দিন।

উত্তর:


11

যদি আপনার প্রশ্নটি হয়: এই দুটি কোডের মধ্যে পার্থক্য কী?

এক নজরে ?glmবলেছে See family for details of family functions, এবং এক ?familyনজরে নিম্নলিখিত বর্ণনাকে প্রকাশ করে:

কোয়াসিবিনোমিয়াল এবং কাসিপোইসন পরিবারগুলি দ্বিপাক্ষিক এবং পোয়েসন পরিবারগুলির থেকে পৃথক শুধুমাত্র যে ক্ষেত্রে ছড়িয়ে পড়া প্যারামিটারটি একটিতে স্থির হয় না, তাই তারা অতিরিক্ত-ছত্রাকের মডেল করতে পারে।

আপনি নিজের আউটপুটে এটি দেখতে পান। এবং এটি উভয় মডেল / কোডের মধ্যে পার্থক্য।

যদি আপনার প্রশ্নটি হয়: লজিস্টিক রিগ্রেশন এবং ভগ্নাংশ প্রতিক্রিয়া রিগ্রেশন এর মধ্যে পার্থক্য কী?

আপনি যেমন সঠিকভাবে সনাক্ত করেছেন, মডেলটি একটি লজিস্টিক একটি, যদি আপনার নির্ভরশীল ভেরিয়েবলগুলি 0 বা 1 হয় তবে প্যাপ্ক এবং ওল্ড্রিজ দেখিয়েছেন যে আপনি পরামিতিগুলির অনুমানের জন্য এই ফর্মটির একটি জিএলএম ব্যবহার করতে পারেন, তবে আপনাকে প্রয়োজন শক্তিশালী স্ট্যান্ডার্ড ত্রুটিগুলি গণনা করুন। লজিস্টিক রিগ্রেশনের জন্য এটি প্রয়োজন হয় না এবং প্রকৃতপক্ষে, কিছু লোকেরা মনে করেন আপনার প্রবিট / লগইট মডেলগুলিতে দৃust় স্ট্যান্ডার্ড ত্রুটিগুলি গণনা করা উচিত নয়। যদিও এটি ভিন্ন বিতর্ক।

তাত্ত্বিক ভিত্তিটি গৌরিওক্স, মনফোর্ট এবং ট্রগননের একটি বিখ্যাত কাগজ থেকে এসেছেএকনোমেট্রিকায় ১৯৮৪ সালে They সুতরাং, কিছুটা অর্থে, আমরা এখানে লজিস্টিক বিতরণটি ব্যবহার করছি যদিও এটি ঠিক সঠিক নয়, তবে প্যারামিটারগুলি আমরা যে পরামিতিগুলি অর্জন করতে চাই তার জন্য এখনও সুসংগত। সুতরাং, যদি আপনার প্রশ্নটি পর্যবেক্ষণ থেকে উদ্ভূত হয় যে আমরা নির্ভরযোগ্য এবং ভগ্নাংশের প্রতিক্রিয়া উভয়ই মডেল নির্ধারণের জন্য খুব একই সম্ভাবনা ফাংশনটি ব্যবহার করছি, ব্যতীত আমরা নির্ভরশীল ভেরিয়েবলের প্রকৃতিটি বিনিময় করি, তবে এটি অন্তর্দৃষ্টি।


কিভাবে আমরা এফএম এর কর্মক্ষমতা পরিমাপ করতে পারি? আমরা কি এমএসই লিনিয়ার রিগ্রেশন এর মতো ব্যবহার করতে পারি?
নবাগত

1
এটি একটি খুব পৃথক প্রশ্ন। এটি একটি নতুন হিসাবে পোস্ট করুন।
coffeinjunky
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.