একাধিক রিগ্রেশনে ভবিষ্যদ্বাণীকের তাত্পর্য: আংশিক


21

আমি ভাবছি যে লিনিয়ার মডেলটিতে আংশিক আর2 এবং সহগগুলির মধ্যে সঠিক সম্পর্কটি কী এবং কারণগুলির গুরুত্ব এবং প্রভাব চিত্রিত করার জন্য আমার কেবল একটি বা উভয় ব্যবহার করা উচিত।

আমি যতদূর জানি, summaryসহগের অনুমানের সাথে, এবং anovaপ্রতিটি ফ্যাক্টরের জন্য স্কোয়ারের যোগফলের সাথে - বর্গাকার যোগফলের যোগফলের যোগফলের দ্বারা বিভক্ত একটি ফ্যাক্টরের বর্গের যোগফলের অনুপাত আংশিক আর2 ( নিম্নলিখিত কোডটি রয়েছে R)।

library(car)
mod<-lm(education~income+young+urban,data=Anscombe)
    summary(mod)

Call:
lm(formula = education ~ income + young + urban, data = Anscombe)

Residuals:
    Min      1Q  Median      3Q     Max 
-60.240 -15.738  -1.156  15.883  51.380 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.868e+02  6.492e+01  -4.418 5.82e-05 ***
income       8.065e-02  9.299e-03   8.674 2.56e-11 ***
young        8.173e-01  1.598e-01   5.115 5.69e-06 ***
urban       -1.058e-01  3.428e-02  -3.086  0.00339 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 26.69 on 47 degrees of freedom
Multiple R-squared:  0.6896,    Adjusted R-squared:  0.6698 
F-statistic: 34.81 on 3 and 47 DF,  p-value: 5.337e-12

anova(mod)
Analysis of Variance Table

Response: education
          Df Sum Sq Mean Sq F value    Pr(>F)    
income     1  48087   48087 67.4869 1.219e-10 ***
young      1  19537   19537 27.4192 3.767e-06 ***
urban      1   6787    6787  9.5255  0.003393 ** 
Residuals 47  33489     713                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

'তরুণ' (0.8) এবং 'শহুরে' (-0.1, পূর্বের প্রায় 1/8, উপেক্ষা করে '-') এর সহগের আকারের বর্ণিত বর্ণটি ('তরুণ' ~ 19500 এবং 'শহুরে' মেলে না ~ 6790, অর্থাৎ প্রায় 1/3)।

সুতরাং আমি ভেবেছিলাম আমার ডেটা স্কেল করা দরকার কারণ আমি ধরে নিয়েছিলাম যে কোনও ফ্যাক্টরের পরিসর যদি অন্য ফ্যাক্টরের সীমার চেয়ে আরও বিস্তৃত হয় তবে তাদের সহগের তুলনা করা শক্ত হবে:

Anscombe.sc<-data.frame(scale(Anscombe))
mod<-lm(education~income+young+urban,data=Anscombe.sc)
summary(mod)

Call:
lm(formula = education ~ income + young + urban, data = Anscombe.sc)

Residuals:
     Min       1Q   Median       3Q      Max 
-1.29675 -0.33879 -0.02489  0.34191  1.10602 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  2.084e-16  8.046e-02   0.000  1.00000    
income       9.723e-01  1.121e-01   8.674 2.56e-11 ***
young        4.216e-01  8.242e-02   5.115 5.69e-06 ***
urban       -3.447e-01  1.117e-01  -3.086  0.00339 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 0.5746 on 47 degrees of freedom
Multiple R-squared:  0.6896,    Adjusted R-squared:  0.6698 
F-statistic: 34.81 on 3 and 47 DF,  p-value: 5.337e-12

anova(mod)
Analysis of Variance Table

Response: education
          Df  Sum Sq Mean Sq F value    Pr(>F)    
income     1 22.2830 22.2830 67.4869 1.219e-10 ***
young      1  9.0533  9.0533 27.4192 3.767e-06 ***
urban      1  3.1451  3.1451  9.5255  0.003393 ** 
Residuals 47 15.5186  0.3302                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1    

তবে এটি আসলে কোনও পার্থক্য করে না, আংশিক এবং সহগের আকার (এটি এখন মানক সহগ ) এখনও মেলে না:আর2

22.3/(22.3+9.1+3.1+15.5)
# income: partial R2 0.446, Coeff 0.97
9.1/(22.3+9.1+3.1+15.5)
# young:  partial R2 0.182, Coeff 0.42
3.1/(22.3+9.1+3.1+15.5)
# urban:  partial R2 0.062, Coeff -0.34

তাহলে কি এটা বলা উচিত যে 'যুবক' 'আরবান' এর চেয়ে তিনগুণ তারতম্য ব্যাখ্যা করে কারণ 'যুবকদের' জন্য আংশিক 'নগর ' এর চেয়ে তিনগুণ বেশি? আর2'যুবক' এর সহগ কেন 'শহুরে' (চিহ্নটিকে উপেক্ষা করে) এর চেয়ে তিন গুণ নয়?

আমি মনে করি এই প্রশ্নের উত্তরটি পরে আমার প্রাথমিক প্রশ্নের উত্তরও আমাকে বলবে: আমি কি কারণগুলির অপেক্ষাকৃত গুরুত্ব চিত্রিত করতে আংশিক বা সহগ ব্যবহার করব? (প্রভাবের দিকটিকে উপেক্ষা করা - সাইন - আপাতত))আর2

সম্পাদনা:

আংশিক এটা-স্কোয়ারটি আমি আংশিক বলেছিলাম তার অন্য নাম হিসাবে উপস্থিত হয় । এটাস্ক {হেপলটস} একটি কার্যকর ফাংশন যা অনুরূপ ফলাফল দেয়:আর2

etasq(mod)
          Partial eta^2
income        0.6154918
young         0.3576083
urban         0.1685162
Residuals            NA

আপনি ঠিক কী করার চেষ্টা করছেন বা প্রদর্শন করছেন? আনুমানিক প্রভাব? তাৎপর্যপূর্ণ?
আইএমএ

হ্যাঁ, আমি টি- এবং এফ-পরীক্ষার সাথে পরিচিত। আমি আনুমানিক প্রভাব দেখাতে চাই, যার জন্য আফাইক টি এবং এফ-পরীক্ষা উপযুক্ত নয়।
রবার্ট

1
আমার প্রশ্নটি: প্রতিটি উপাদানটির ফলাফলের উপর কতটা প্রভাব রয়েছে তা দেখানোর জন্য আমি কি আংশিক আর বা সহগের ব্যবহার করব? আমি উভয়কে একই দিকে নির্দেশ করতে অনুমান করছিলাম। আপনি বলছেন যে এটি সত্য নয় কারণ ডেটাতে বহুবিধ লাইন রয়েছে। ঠিক আছে, সুতরাং যখন আমি কোনও বিবরণ দিতে চাই যেমন ফ্যাক্টর 'তরুণ' ফলাফলকে প্রভাবিত করে তার চেয়ে x গুণ বেশি / যেটি 'আরবান' ফ্যাক্টরের চেয়ে x গুণ বেশি গুরুত্বপূর্ণ, আমি কি আংশিক আর বা সহগের দিকে নজর দেব?
রবার্ট

1
আমি @ আইএমএ এর সাথে একমত নই আংশিক আর স্কোয়ার সরাসরি আংশিক সম্পর্কের সাথে যুক্ত, যা আইভ এবং ডিভির মধ্যে বিস্মৃত-সমন্বিত সম্পর্ক অধ্যয়ন করার একটি দুর্দান্ত উপায়।
মাইকেল এম

1
আমি আপনার প্রশ্নটি এটিকে সম্পাদন করে এটিকে আবার প্রথম পৃষ্ঠায় হাজির করার জন্য। আমি একটি ভাল উত্তর খুব আগ্রহী হবে; যদি কিছু না হাজির হয় তবে আমি কোনও অনুদানও দিতে পারি। যাইহোক, সমস্ত ভবিষ্যদ্বাণীকে মানীকরণের পরে রিগ্রেশন সহগকে "স্ট্যান্ডার্ডাইজড কোয়েফিয়েন্টস" বলা হয়। এটি পরিস্কার করার জন্য আমি এই পদটি আপনার প্রশ্নের মধ্যে রেখেছি।
অ্যামিবা বলছেন মনিকাকে

উত্তর:


10

সংক্ষেপে , আমি আংশিক এবং মানক সহগ উভয়ই একই বিশ্লেষণে ব্যবহার করব না, কারণ তারা স্বতন্ত্র নয়। আমি যুক্তি দিয়ে বলব যে মানকযুক্ত সহগগুলি ব্যবহার করে সম্পর্কের তুলনা করা সম্ভবত আরও স্বজ্ঞাত কারণ তারা মডেল সংজ্ঞার সাথে (যেমন ওয়াই = β এক্স ) সহজেই সম্পর্কিত । আংশিক আর 2 , ঘুরে, মূলত predictor এবং নির্ভরশীল পরিবর্তনশীল (DV) মধ্যে অনন্য ভাগ ভ্যারিয়েন্স অনুপাত (তাই প্রথম predictor জন্য এটি আংশিক পারস্পরিক সম্পর্কের বর্গ হয় এক্স 1 Y এক্স 2এক্স এনআর2ওয়াই=βএক্সআর2Rএক্স1Yএক্স2এক্সএন)। তদ্ব্যতীত, খুব ছোট ত্রুটির সাথে মানানসই সমস্ত সহগমের আংশিক ঝোঁক 1 থাকে, তাই তারা ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্ব চিহ্নিত করতে কার্যকর হয় না।আর2


প্রভাব আকার সংজ্ঞা

  • প্রমিত সহগ, - কোফিসিয়েন্টস বিটা আদর্শায়িত ভেরিয়েবল উপর একটি মডেল আনুমানিক হিসাব থেকে প্রাপ্ত (গড় = 0, স্ট্যানডার্ড ডেভিয়েশন = 1)।βগুলিটিβ
  • আংশিক - অনিশ্চিত প্রকরণের অনুপাতটি ভবিষ্যদ্বাণীকে সীমাবদ্ধ মডেলটিতে যোগ করে ব্যাখ্যা করা হয়েছে (পূর্বাভাসক ছাড়াই পুরো মডেল)। একই রকম:আর2

    • ভবিষ্যদ্বাণীকারী এবং নির্ভরশীল ভেরিয়েবলের মধ্যে আংশিক সম্পর্কের স্কোয়ার, মডেলের অন্যান্য সমস্ত ভবিষ্যদ্বাণীকারীদের জন্য নিয়ন্ত্রণকারী। আরপিএকটিRটিআমিএকটি2=Rএক্সআমিYএক্সএক্সআমি2
    • আংশিক - প্রেডিক্টর থেকে চিহ্নিত তৃতীয় স্কোয়ারের যোগফল এবং ত্রুটি এসএস এফেক্ট / ( এসএস এফেক্ট + এসএস ত্রুটি ) এর তৃতীয় ধরণের বর্গের পরিমাণের অনুপাত η2এস এসপ্রভাব/(এস এসপ্রভাব+ +এস এসএরর)
  • -সীমাবদ্ধ এবং পূর্ণ মডেলেরমধ্যে আর 2 এর পার্থক্য। সমান:Δআর2R2

    • স্কোয়ারড semipartial পারস্পরিক সম্পর্ক rxi(y.Xxi)2
    • স্কোয়ার এসএস ইফেক্ট / এসএস মোটের তৃতীয় সংখ্যার জন্য η 2 - আপনি কীপ্রশ্নেআংশিক আর 2 হিসাবে গণনা করছেন।η2SSeffect/SStotalR2

এগুলির সবগুলি নিবিড়ভাবে সম্পর্কিত তবে তারা কীভাবে ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্ককে পরিচালনা করে তা পৃথক করে। এই পার্থক্যটি আরও কিছুটা বোঝার জন্য আসুন আমরা ধরে নিই যে আমাদের 3 মানক (মানে = 0, এসডি = 1) ভেরিয়েবলগুলি যার পারস্পরিক সম্পর্কগুলি r x y , r x z , r y z । আমরা নিতে হবে এক্স নির্ভরশীল পরিবর্তনশীল এবং Y এবং z- রx,y,zrxy,rxz,ryzxyzভবিষ্যদ্বাণীকারী হিসাবে। আমরা পারস্পরিক আকারের গুণাগুণগুলির সকলকে পারস্পরিক সম্পর্কগুলির ক্ষেত্রে প্রকাশ করব যাতে আমরা স্পষ্টভাবে দেখতে পারি যে প্রত্যেকে কীভাবে সম্পর্ক সম্পর্কিত কাঠামো পরিচালনা করে। প্রথমে আমরা রিগ্রেশন মডেল ওএলএস ব্যবহারের অনুমানের সহগের তালিকাবদ্ধ করব। সহগের জন্য সূত্র: β y = r x y - r y z r z xx=βyY+βzZভবিষ্যদ্বাণীকারীদের জন্যআর2 এরআংশিক বর্গমূলসমান হবে:

βy=rxyryzrzx1ryz2βz=rxzryzryx1ryz2,
Rpartial2

Rxy.z2=rxyryzrzx(1rxz2)(1ryz2)Rxz.y2=rxzryzryx(1rxy2)(1ryz2)

ΔR2

Rxyz2Rxz2=ry(x.z)=rxyryzrzx(1ryz2)Rxzy2Rxy2=rz(x.y)=rxzryzryx(1ryz2)

βΔR2Rpartial2βstd

anovaR2lm

আপনি যদি আর Anovaএর carপ্যাকেজ থেকে আপনার কলটিতে একটি ধরণের স্কয়ারের যোগফল ব্যবহার করেন, তবেFটিএফ(1,এন)=টি2(এন)anova(mod)Anova(mod, type = 2)options(contrasts = c("contr.sum","contr.poly"))Anova(mod,type=3)আর2etasq()পিআর2


ধার


β=(এক্সএক্স)এক্সY , তাই না?
অ্যামিবা

1
আপনি ঠিক বলেছেন, আমি যা বোঝাতে চেয়েছিলাম তা হল তৃতীয় এসএস টাইপ এবং সহগের জন্য টি পরীক্ষাগুলি মূলত একই এফ টেস্ট এবং পি মান দেয়।
ক্রিস নোভাক

2
@ অ্যামিবা কিছু গণনা করার পরে আমি আপনার পরামর্শগুলি অন্তর্ভুক্ত করতে আমার উত্তর সম্পাদনা করেছি, দুটি প্রভাব আকারের মধ্যে পার্থক্যটি কিছুটা স্পষ্ট করতে এবং ওপির উত্তরকে আরও ভালভাবে সম্বোধন করতে পারি।
ক্রিস নোভাক

1
ΔR2R2R2R2
ক্রিস নোভাক

1
Δআর2আরপি2Δআর2আরপি2আর21
অ্যামিবা

8

যেমনটি ইতিমধ্যে আরও কয়েকটি উত্তর এবং মন্তব্যে ব্যাখ্যা করা হয়েছে, এই প্রশ্নটি অন্তত তিনটি বিভ্রান্তির উপর ভিত্তি করে ছিল:

  1. anova()টিAnova()car

  2. আর2βগুলিটি

  3. আর2এস এসপ্রভাব/(এস এসপ্রভাব+ +এস এসএরর)এস এসপ্রভাব/এস এসমোটআর2এস এসপ্রভাব

এই বিভ্রান্তিগুলি স্পষ্ট হওয়ার পরে, প্রশ্নটি অনুমান করা হয় যে ভবিষ্যদ্বাণীকারী প্রভাবের আকার বা গুরুত্বের সবচেয়ে উপযুক্ত ব্যবস্থাগুলি কী।


আর-তে একটি প্যাকেজ রয়েছে relaimpoযা আপেক্ষিক গুরুত্বের বিভিন্ন পদক্ষেপ সরবরাহ করে।

library(car)
library(relaimpo)
mod <- lm(education~income+young+urban, data=Anscombe)
metrics <- calc.relimp(mod, type = c("lmg", "first", "last", "betasq", "pratt", "genizi", "car"))

Anscombeআপনার প্রশ্নের মতো একই ডেটাसेट ব্যবহার করে , এটি নিম্নলিখিত মেট্রিকগুলি প্রদান করে:

Relative importance metrics: 

              lmg      last      first    betasq       pratt     genizi        car
income 0.47702843 0.4968187 0.44565951 0.9453764  0.64908857 0.47690056 0.55375085
young  0.14069003 0.1727782 0.09702319 0.1777135  0.13131006 0.13751552 0.13572338
urban  0.07191039 0.0629027 0.06933945 0.1188235 -0.09076978 0.07521276 0.00015460

এর মধ্যে কিছু মেট্রিক ইতিমধ্যে আলোচনা করা হয়েছে:

  • betasqস্কোয়্যার স্ট্যান্ডার্ডাইজড কোয়েফিয়েন্টস, আপনার সাথে একই মানগুলি প্রাপ্ত lm()
  • firstএস এসপ্রভাব/এস এসমোটএস এসপ্রভাব টাইপ হয় আই এস এস যখন এই ভবিষ্যদ্বাণীকারী মডেলটিতে প্রথম হয়। 'আয়' (0.446) এর মান anova()আউটপুট ভিত্তিক আপনার গণনার সাথে মেলে । অন্যান্য মান মেলে না।
  • lastআর2এস এসপ্রভাব/এস এসমোটএস এসপ্রভাবআর2anova()

আর2

এখানে আরও চারটি মেট্রিক রয়েছে relaimpo- এবং প্যাকেজটি relaimpoম্যানুয়ালি ইনস্টল করা থাকলে আরও একটি (পঞ্চম) পাওয়া যায় : CRAN সংস্করণটি তার লেখকের সাথে সম্ভাব্য দ্বন্দ্বের কারণে এই মেট্রিককে বাদ দেয় না, যেমনটি মনে হচ্ছে পাগল, তার পদ্ধতিতে মার্কিন পেটেন্ট রয়েছে । আমি আর অনলাইন চালাচ্ছি এবং এতে অ্যাক্সেস নেই, সুতরাং যদি কেউ ম্যানুয়ালি ইনস্টল করতে পারে relaimpoতবে সম্পূর্ণতার জন্য উপরের আমার আউটপুটটিতে এই অতিরিক্ত মেট্রিক যুক্ত করুন।

দুটি মেট্রিক হ'ল prattএটি নেতিবাচক (খারাপ) হতে পারে এবং geniziএটি বেশ অস্পষ্ট।

দুটি আকর্ষণীয় পন্থা lmgএবং car

এস এসপ্রভাব/এস এসমোটএস এসপ্রভাব

দ্বিতীয়টি চালু করা হয়েছে (জুবার ও স্ট্রাইমার, ২০১১) এবং এতে অনেক আবেদনকারী তাত্ত্বিক বৈশিষ্ট্য রয়েছে; ভবিষ্যদ্বাণীকারীদের প্রথমে মানসম্মত করার পরে জেডিসিএ / মহালানোবিস রূপান্তর (যেমন পুনর্নির্মাণের ত্রুটি হ্রাস করার সময় সাদা করা হয়েছে) এর পরে এটি বর্গক্ষেত্রের মানযুক্ত গুণফল রয়েছে।

2:1lmg878:1car

বিবলিওগ্রাফি:

  1. উলরিক গ্র্যাম্পিংয়ের ওয়েবসাইটে আপেক্ষিক গুরুত্বের বিষয়ে উল্লেখ - তিনি এর লেখক relaimpo

  2. গ্র্যাম্পিং, ইউ। (2006) আর এ লিনিয়ার রিগ্রেশন এর জন্য আপেক্ষিক গুরুত্ব: প্যাকেজ রিলেম্পো । পরিসংখ্যান সফটওয়্যার জার্নাল 17, সংখ্যা 1।

  3. গ্র্যাম্পিং, ইউ। (2007) বৈচিত্র্য পচনের উপর ভিত্তি করে লিনিয়ার রিগ্রেশন সম্পর্কিত আপেক্ষিক গুরুত্বের অনুমানকারী । আমেরিকান পরিসংখ্যানবিদ 61, 139-147।

  4. জুবের, ভি। এবং স্ট্রাইমার, কে। (2010)। সিআর স্কোর ব্যবহার করে উচ্চ-মাত্রিক রিগ্রেশন এবং পরিবর্তনশীল নির্বাচন । জেনেটিক্স এবং মলিকুলার বায়োলজিতে পরিসংখ্যানমূলক অ্যাপ্লিকেশনগুলি 10.1 (2011): 1-27।

  5. গ্র্যাম্পিং, মার্কিন যুক্তরাষ্ট্র (2015)। রিগ্রেশন মডেলগুলিতে পরিবর্তনশীল গুরুত্ব । উইলে আন্তঃবিষয়ক পর্যালোচনা: গণনা পরিসংখ্যান, 7 (2), 137-152। (বেতন দেওয়ালের পিছনে)


বিভিন্ন গুরুত্ব সহগের উপর অতিরিক্ত মূল্যবান তথ্য সহ খুব সুন্দর সংক্ষিপ্তসার। বিটিডাব্লু, আপনি কি এই আর ইঞ্জিনটি অনলাইনে ব্যবহার করছেন? pbil.univ-lyon1.fr/Rweb বা অন্য একটি?
ttnphns

1
আমি r-food.org ব্যবহার করি , তবে আমি আর কখনও কিছু চেষ্টা করে দেখিনি এবং এটির তুলনা জানি না। যদিও এটি দেখতে বেশ চতুর।
অ্যামিবা বলেছেন মনিকাকে রিইনস্টেট করুন

প্রভাবের আকারগুলিতে খুব পরিষ্কার সংক্ষিপ্তসার এবং অতিরিক্ত তথ্য (+1)
ক্রিস নোভাক

4

তুমি লিখেছিলে:

আমার প্রশ্নটি হ'ল: প্রতিটি ফলের ফলাফলের উপর কতটা প্রভাব রয়েছে তা দেখানোর জন্য আমি কি আংশিক R² বা সহগ ব্যবহার করব?

এখানে দুটি জিনিস বিভ্রান্ত না করা গুরুত্বপূর্ণ। প্রথমত, মডেল স্পেসিফিকেশন প্রশ্ন আছে। Lm অ্যালগরিদম ধরে নেয় যে ওএলএস-অনুমানগুলি পূরণ হয়েছে। অন্যান্য জিনিসের মধ্যে এর অর্থ এই যে নিরপেক্ষ অনুমানের জন্য, মডেল থেকে কোনও লক্ষণীয় ভেরিয়েবল অনুপস্থিত হতে পারে (বাদে যখন এটি অন্য সমস্ত রেজিস্ট্রারের সাথে সম্পর্কযুক্ত নয়, বিরল)।
সুতরাং একটি মডেল সন্ধানের ক্ষেত্রে, আর adj বা অ্যাডজাস্টেড আরের উপর অতিরিক্ত প্রভাব হ'ল আগ্রহের বিষয়। অ্যাডজাস্টেড আর² উন্নত হওয়া বন্ধ না করা পর্যন্ত কেউ রেজিস্ট্রার যুক্ত করা উপযুক্ত বলে মনে করতে পারে, উদাহরণস্বরূপ। ধাপে ধাপে রিগ্রেশন পদ্ধতিতে আকর্ষণীয় সমস্যা রয়েছে যেমন এর মতো, তবে এটি বিষয় নয়। যে কোনও ক্ষেত্রে আমি ধরে নিই যে আপনি নিজের মডেলটি বেছে নেওয়ার কোনও কারণ ছিল।

তবুও: আর এর উপর এই অতিরিক্ত প্রভাবটি স্বাধীন ভেরিয়েবলের উপর রেজিস্ট্রারের প্রকৃত বা সামগ্রিক প্রভাবের সমান নয়, স্পষ্টতই বহুবিধরাশিজনিত কারণে: আপনি যদি রেজিস্টার কেড়ে নেন তবে এর প্রভাবের অংশটি এখন অন্য রেজিস্ট্রারদের জন্য দায়ী করা হবে যা এটির সাথে সম্পর্কযুক্ত সুতরাং এখন আসল প্রভাবটি সঠিকভাবে প্রদর্শিত হয়নি।

এবং আরও একটি সমস্যা রয়েছে: অনুমানগুলি কেবলমাত্র সমস্ত অন্যান্য রেজিস্ট্রারগণের সাথে সম্পূর্ণ মডেলের জন্য বৈধ। হয় এই মডেলটি এখনও সঠিক নয় এবং সুতরাং প্রভাব সম্পর্কে আলোচনা অর্থহীন - বা এটি সঠিক এবং তারপরে আপনি কোনও রেজিস্টারকে মুছে ফেলতে পারবেন না এবং এখনও সাফল্যের সাথে ওএলএস পদ্ধতি ব্যবহার করতে পারেন।

সুতরাং: আপনার মডেল এবং ওএলএস ব্যবহার উপযুক্ত? যদি এটি হয় তবে অনুমানগুলি আপনার প্রশ্নের জবাব দেয় - এগুলি রিগ্রেশন / নির্ভরশীল ভেরিয়েবলের উপর ভেরিয়েবলের প্রভাব সম্পর্কে আপনার আক্ষরিক সেরা অনুমান।
যদি তা না হয় তবে আপনার প্রথম কাজটি একটি সঠিক মডেল সন্ধান করা। এর জন্য আংশিক আর² ব্যবহারের উপায় হতে পারে। মডেল স্পেসিফিকেশন বা স্টেওয়াইজ রিগ্রেশন সম্পর্কিত অনুসন্ধান এই ফোরামে অনেক আকর্ষণীয় পন্থা তৈরি করবে। কী কাজ করে তা আপনার ডেটার উপর নির্ভর করবে।


1
আপনার উত্তর চার ধন্যবাদ! আমি নিশ্চিত না যে আপনার বক্তব্যটি "আরএর উপর এই অতিরিক্ত প্রভাবটি স্বাধীন ভেরিয়েবলের উপর রেজিস্ট্রারের প্রকৃত বা সামগ্রিক প্রভাবের সমান নয়" নিরপেক্ষ। প্যাকেজ রিলেম্প্পো cran.r-project.org/web/packages/relaimpo/relaimpo.pdf উদাহরণস্বরূপ "লিনিয়ার মডেলগুলিতে আপেক্ষিক গুরুত্ব নির্ধারণের জন্য" আংশিক R uses ব্যবহার করে।
রবার্ট

1
আপনি কি মনে করেন যে আপনি নিজের দৃষ্টিভঙ্গির জন্য একটি রেফারেন্স সরবরাহ করতে পেরেছেন যে কেবলমাত্র মডেল নির্বাচনের জন্য র ব্যবহার করা উচিত?
রবার্ট

1
@ আরবার্ট: রেইসন ডি'ইটি হ'ল relaimpoআইএমএ যে কারণ দেয়, তার জন্য আংশিক আর ^ 2 এর বিকল্প সরবরাহ করা!
Scortchi - পুনর্বহাল মনিকা

1
@ স্কোর্টচি: বাহ, relaimpoপ্যাকেজটির ম্যানুয়ালটি দেখে আমি বুঝতে পেরেছি যে লিনিয়ার রিগ্রেশন-এ ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্বের পরিমাণ নির্ধারণের জন্য বিভিন্ন পদ্ধতির পুরো বিশ্ব রয়েছে । আমি বর্তমানে সেখানে লিঙ্কিত কিছু কাগজপত্রগুলি দেখছি ( এই 2010 প্রিপ্রিন্টটি এখনও পর্যন্ত বেশ ভাল দেখাচ্ছে), এবং এটি একটি গোলমাল! আমি বুঝতে পারি নি যে এই সমস্যাটি এত জটিল, যখন আমি আমার অনুগ্রহের প্রস্তাব দিয়েছিলাম। এটি সিভিতে সঠিকভাবে আলোচনা হয়েছে বলে মনে হয় না। এটি কি অস্পষ্ট বিষয়? যদি তাই হয় তবে কেন?
অ্যামিবা

2
@ অ্যামিবা: একটি অফ-দ্য কাফের উত্তরটি হ'ল "ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্ব" বেশিরভাগ উদ্দেশ্যেই গুরুত্বপূর্ণ নয়। যদি আপনার এমন কোনও মডেল থাকে যা আপনি সন্তুষ্ট হন তবে আপনি এটির জন্য দিনে একটি সিগারেট ধূমপান করার মতো জিনিস বলতে ব্যবহার করতে পারেন হার্ট অ্যাটাক হওয়ার ঝুঁকির দিক থেকে পাঁচটি হ্যামবার্গার খাওয়ার সমতুল্য - গুরুত্বটি কীসের সংক্ষিপ্ত ব্যাখ্যা থেকে আসে আপনি মডেলিং করছেন; যদি আপনি মডেলগুলির সাথে তুলনা করেন আপনি পুরো মডেলগুলির সাথে তুলনা করেন - পূর্বাভাসকারীদের সাথে ব্যয়বহুল - পরিমাপের জুটি না রেখে এবং বলুন - এবং কীভাবে ভবিষ্যদ্বাণীমূলক শক্তি মোটামুটি বিভাজন হতে পারে তা নিয়ে চিন্তা করার দরকার নেই।
Scortchi - পুনর্বহাল মনিকা

3

লিনিয়ার রিগ্রেশন সহগ এবং আপনি পড়তে পারেন এমন আংশিক সম্পর্ক সম্পর্কিত পার্থক্য সম্পর্কে এই উদাহরণস্বরূপ,।

তবে এই প্রশ্নে যে বিভ্রান্তি প্রকাশ হয়েছে তা অন্য এক প্রকৃতির বলে মনে হচ্ছে। এটি প্রদর্শিত হয় যে এটি বা সেই পরিসংখ্যান প্যাকেজ (বিষয়, বারবার আমাদের সাইটে আলোচিত) দ্বারা ব্যবহৃত স্কোয়ার অফ স্কোয়ারগুলির ডিফল্ট ধরণের সম্পর্কে। লিনিয়ার রিগ্রেশন আনোভা টাইপ তৃতীয় এসএস রিকনিংয়ে যা ডাকে তা ব্যবহার করে। অনেক আনোভা প্রোগ্রামে এটি ডিফল্ট বিকল্পও। মধ্যেR ফাংশনanova , আমার মনে হচ্ছে, (আমি, ব্যবহারকারী আর নই তাই আমি এটা অনুমান করা) ডিফল্ট হিসাব প্রকার আমি এস এস (একটি "অনুক্রমিক এস এস" যা অর্ডার ভবিষ্যতবক্তা মডেল উল্লিখিত উপর নির্ভরশীল) হয়। সুতরাং, আপনি যে তাত্পর্যটি পর্যবেক্ষণ করেছেন এবং যা আপনার মানগুলি ("স্কেলড") মানক করার সময় অদৃশ্য হয়নি তা হ'ল কারণ আপনি ডিওল্ট টাইপ আই বিকল্পটি দিয়ে অ্যানোভা নির্দিষ্ট করেছেন।

নীচে আপনার ডেটা সহ এসপিএসে প্রাপ্ত ফলাফল রয়েছে:

এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন এখানে চিত্র বর্ণনা লিখুন

আপনি এই প্রিন্ট-আউটগুলিতে বেছে নিতে পারেন যে প্যারামিটারগুলি (রিগ্রেশনাল কো-ফলসিয়েন্টস) একই রকম নির্বিশেষে এসএস গণনা। আপনি আরও খেয়াল করতে পারেন যে আংশিক এটা স্কোয়ার্ড [যা এসএসএফেক্ট / (এসএসএফেক্ট + এসসারিয়র) এবং = আমাদের ক্ষেত্রে আংশিক আর-স্কোয়ার্ড কারণ ভবিষ্যদ্বাণীকারীরা সংখ্যার কোভারিয়েট] কেবল এসএস টাইপ করলেই প্রভাবগুলির সারণিতে এবং সহগের সম্পূর্ণরূপে একই থাকে III হয়। যখন এসএস টাইপ করুন আমি তখন 3 পূর্বাভাসকারীদের মধ্যে শুধুমাত্র "শহুরে" একই মান (.169) ধরে রাখে; এটি কারণ ভবিষ্যদ্বাণীকারীদের ইনপুট ক্রম এটি শেষ। টাইপ III এসএস এর ক্ষেত্রে ইনপুট ক্রমের ক্ষেত্রে যেমন রিগ্রেশন হয় তেমন কিছু আসে না। যাইহোক, পার্থক্যটি পি-মানগুলিতেও আবদ্ধ। যদিও আপনি এটি আমার টেবিলগুলিতে দেখতে পাচ্ছেন না কারণ "সিগ" কলামে কেবলমাত্র 3 দশমিক সংখ্যা রয়েছে,

আপনি আনোভা / লিনিয়ার মডেলটিতে বিভিন্ন "এসএস টাইপ" সম্পর্কে আরও পড়তে চাইতে পারেন। ধারণামূলকভাবে, তৃতীয় টাইপ করুন বা "রিগ্রেশন" টাইপ এসএস মৌলিক এবং আদিম। অন্যান্য ধরণের এসএস (I, II, IV, আরও বেশি বিদ্যমান) এর প্রভাবগুলি আরও ব্যাপকভাবে অনুমান করার জন্য বিশেষ ডিভাইসগুলি রয়েছে, রিগ্রেশন প্যারামিটারগুলির তুলনায় স্বল্প পরিমাণে পারস্পরিক সম্পর্কের পূর্বাভাসকারীদের ক্ষেত্রে অনুমতি দেয়।

সাধারণত, প্রভাবগুলির আকার এবং তাদের পি-মানগুলি পরামিতিগুলি এবং তাদের পি-মানগুলির চেয়ে রিপোর্ট করা আরও গুরুত্বপূর্ণ, যদি না অধ্যয়নের লক্ষ্য ভবিষ্যতের জন্য মডেল তৈরি করা হয়। প্যারামিটারগুলি আপনাকে পূর্বাভাস দেওয়ার অনুমতি দেয় তবে "প্রভাব" বা "প্রভাব" "লিনিয়ার পূর্বাভাসের শক্তি" এর চেয়ে আরও বিস্তৃত ধারণা হতে পারে। প্রভাব বা গুরুত্বের প্রতিবেদন করার জন্য আংশিক এটা স্কোয়ার ছাড়াও অন্যান্য সহগগুলি সম্ভব। একটি হ'ল ছুটি-এক-আউট সহগ: একটি ভবিষ্যদ্বাণীকের গুরুত্ব হ'ল মডেল থেকে সরানো পূর্বাভাসীর সাথে স্কোয়ারের অবশিষ্টাংশ যোগফলকে স্বাভাবিক করা যাতে সমস্ত ভবিষ্যদ্বাণীকারীদের জন্য গুরুত্বের মান 1 হয়।


+1, আলোচনায় যোগ দেওয়ার জন্য ধন্যবাদ। আমার একটি টার্মিনোলজিকাল প্রশ্ন আছে। "আংশিক আর স্কোয়ার্ড" এসএসেফেক্ট / (এসএসএফেক্ট + এসএসরর) হিসাবে সংজ্ঞায়িত করা হয়। এসএসেফেক্ট / এসএসটোটালের নাম কী? আমি যতদূর বুঝতে পেরেছি (আমি ভুল হলে আমাকে সংশোধন করি), আমরা যদি III এসএস পচন প্রকারটি ব্যবহার করি তবে এই এসএসএফেক্ট / এসএসটোটাল প্রতিক্রিয়া এবং এই ভবিষ্যদ্বাণীকের (অন্যান্য সমস্ত ভবিষ্যদ্বাণীকারীদের জন্য নিয়ন্ত্রণকারী) মধ্যে স্কোয়ার আংশিক পারস্পরিক সম্পর্কের সমান হবে। এই পরিমাণের একটি নাম আছে? আংশিক আর 2 আংশিক এটা স্কোয়ারের সাথে সমান, তবে কেন এটা স্কোয়ারের অ্যানালগের কোনও নাম নেই? এতে আমি বিভ্রান্ত হয়ে পড়েছি।
অ্যামিবা বলেছেন

ওফস, আমার মনে হয় আমি উপরে কিছু বাজে কথা লিখেছি: স্কোয়ারড আংশিক পারস্পরিক সম্পর্কটি এসএসেফেক্ট / (এসএসএফেক্ট + এসএসেরর), ঠিক ঠিক আংশিক আর 2, সঠিক? তবুও, এসএসেফেক্ট / এসএসটোটালকে কীভাবে কল করবেন (এই প্রশ্নটি ওপি তাঁর মূল প্রশ্নে গণনা করার চেষ্টা করেছিল!) এখনও অবধি রয়ে গেছে। আমরা কি একে এটা স্কোয়ার বলতে পারি? অথবা "পার্টিশনযুক্ত আর 2" (তৃতীয় এসএস টাইপের ক্ষেত্রে অবশ্যই এই "পার্টিশনগুলি" মোট আর 2 এর সমষ্টি হবে না)?
অ্যামিবা বলছেন মিনিকা

1
হ্যাঁ, এসফেক্ট / এসএসটোটাল কেবল এটা স্কোয়ারড। এটি নির্দিষ্ট মডেলের প্রেডিক্টরের স্কোয়ার (প্রান্তিক এটা স্কোয়ার্ড = এটা স্কোয়ারের সাথে বিভ্রান্ত না করা যখন প্রেডিক্টর মডেলটিতে কেবলমাত্র একজনই থাকে = শূন্য-ক্রম পিয়ারসন আর ^ 2, আমাদের ধারাবাহিক ভবিষ্যদ্বাণীকারীদের ক্ষেত্রে)।
ttnphns

1
ঠিক তাই. পার্ট রিলেশনশিপটি হ'ল (এর একটি নির্দিষ্ট উদাহরণ) ta আমি মনে করি যে অতএব মডেল অংশ এটা এটিকে বলা ভাল । আমি "অংশ" বা "আধা পার্টিশন" এবং এই শব্দটির মুখোমুখি হচ্ছি এমন কোনও পাঠ্য এখনও মনে নেই। যদি আপনি এটি সন্ধান করেন তবে দয়া করে আমাকে জানান।
ttnphns

1
হ্যাঁ; কেন, আমি একইভাবে মনে করি। তবে আর, আংশিক আর, আধা পার্টিয়াল আর হ'ল নির্দিষ্ট কেস সম্পর্কিত e তবে উভয়ের মধ্যে গুরুত্বপূর্ণ পরিভাষাগত পার্থক্যটি সেই প্রসঙ্গে উত্থাপিত হয় যখন, সামগ্রিক শ্রেণিবদ্ধ (ডামি) "ননলাইনার" প্রভাবটি আমরা ভবিষ্যদ্বাণীকের রৈখিক (বা বহুপদী) প্রভাবকে সংযোজিত করি যেন সংখ্যাযুক্ত কোডযুক্ত। এখানে আমরা 3 টি প্রভাব প্রদর্শন করব: সম্মিলিত এটাস্ক = লিনিয়ার Rsq + বিচ্যুতি-থেকে-রৈখিকতা।
ttnphns
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.