একাধিক রিগ্রেশনে ভবিষ্যদ্বাণীকের তাত্পর্য: আংশিক

21

আমি ভাবছি যে লিনিয়ার মডেলটিতে আংশিক $R^2$ এবং সহগগুলির মধ্যে সঠিক সম্পর্কটি কী এবং কারণগুলির গুরুত্ব এবং প্রভাব চিত্রিত করার জন্য আমার কেবল একটি বা উভয় ব্যবহার করা উচিত।

আমি যতদূর জানি, summaryসহগের অনুমানের সাথে, এবং anovaপ্রতিটি ফ্যাক্টরের জন্য স্কোয়ারের যোগফলের সাথে - বর্গাকার যোগফলের যোগফলের যোগফলের দ্বারা বিভক্ত একটি ফ্যাক্টরের বর্গের যোগফলের অনুপাত আংশিক $R^2$ ( নিম্নলিখিত কোডটি রয়েছে R)।

library(car)
mod<-lm(education~income+young+urban,data=Anscombe)
    summary(mod)

Call:
lm(formula = education ~ income + young + urban, data = Anscombe)

Residuals:
    Min      1Q  Median      3Q     Max 
-60.240 -15.738  -1.156  15.883  51.380 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.868e+02  6.492e+01  -4.418 5.82e-05 ***
income       8.065e-02  9.299e-03   8.674 2.56e-11 ***
young        8.173e-01  1.598e-01   5.115 5.69e-06 ***
urban       -1.058e-01  3.428e-02  -3.086  0.00339 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 26.69 on 47 degrees of freedom
Multiple R-squared:  0.6896,    Adjusted R-squared:  0.6698 
F-statistic: 34.81 on 3 and 47 DF,  p-value: 5.337e-12

anova(mod)
Analysis of Variance Table

Response: education
          Df Sum Sq Mean Sq F value    Pr(>F)    
income     1  48087   48087 67.4869 1.219e-10 ***
young      1  19537   19537 27.4192 3.767e-06 ***
urban      1   6787    6787  9.5255  0.003393 ** 
Residuals 47  33489     713                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

'তরুণ' (0.8) এবং 'শহুরে' (-0.1, পূর্বের প্রায় 1/8, উপেক্ষা করে '-') এর সহগের আকারের বর্ণিত বর্ণটি ('তরুণ' ~ 19500 এবং 'শহুরে' মেলে না ~ 6790, অর্থাৎ প্রায় 1/3)।

সুতরাং আমি ভেবেছিলাম আমার ডেটা স্কেল করা দরকার কারণ আমি ধরে নিয়েছিলাম যে কোনও ফ্যাক্টরের পরিসর যদি অন্য ফ্যাক্টরের সীমার চেয়ে আরও বিস্তৃত হয় তবে তাদের সহগের তুলনা করা শক্ত হবে:

Anscombe.sc<-data.frame(scale(Anscombe))
mod<-lm(education~income+young+urban,data=Anscombe.sc)
summary(mod)

Call:
lm(formula = education ~ income + young + urban, data = Anscombe.sc)

Residuals:
     Min       1Q   Median       3Q      Max 
-1.29675 -0.33879 -0.02489  0.34191  1.10602 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept)  2.084e-16  8.046e-02   0.000  1.00000    
income       9.723e-01  1.121e-01   8.674 2.56e-11 ***
young        4.216e-01  8.242e-02   5.115 5.69e-06 ***
urban       -3.447e-01  1.117e-01  -3.086  0.00339 ** 
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.5746 on 47 degrees of freedom
Multiple R-squared:  0.6896,    Adjusted R-squared:  0.6698 
F-statistic: 34.81 on 3 and 47 DF,  p-value: 5.337e-12

anova(mod)
Analysis of Variance Table

Response: education
          Df  Sum Sq Mean Sq F value    Pr(>F)    
income     1 22.2830 22.2830 67.4869 1.219e-10 ***
young      1  9.0533  9.0533 27.4192 3.767e-06 ***
urban      1  3.1451  3.1451  9.5255  0.003393 ** 
Residuals 47 15.5186  0.3302                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

তবে এটি আসলে কোনও পার্থক্য করে না, আংশিক এবং সহগের আকার (এটি এখন মানক সহগ ) এখনও মেলে না: $R^2$

22.3/(22.3+9.1+3.1+15.5)
# income: partial R2 0.446, Coeff 0.97
9.1/(22.3+9.1+3.1+15.5)
# young:  partial R2 0.182, Coeff 0.42
3.1/(22.3+9.1+3.1+15.5)
# urban:  partial R2 0.062, Coeff -0.34

তাহলে কি এটা বলা উচিত যে 'যুবক' 'আরবান' এর চেয়ে তিনগুণ তারতম্য ব্যাখ্যা করে কারণ 'যুবকদের' জন্য আংশিক 'নগর ' এর চেয়ে তিনগুণ বেশি? $R^2$ 'যুবক' এর সহগ কেন 'শহুরে' (চিহ্নটিকে উপেক্ষা করে) এর চেয়ে তিন গুণ নয়?

আমি মনে করি এই প্রশ্নের উত্তরটি পরে আমার প্রাথমিক প্রশ্নের উত্তরও আমাকে বলবে: আমি কি কারণগুলির অপেক্ষাকৃত গুরুত্ব চিত্রিত করতে আংশিক বা সহগ ব্যবহার করব? (প্রভাবের দিকটিকে উপেক্ষা করা - সাইন - আপাতত)) $R^2$

সম্পাদনা:

আংশিক এটা-স্কোয়ারটি আমি আংশিক বলেছিলাম তার অন্য নাম হিসাবে উপস্থিত হয় । এটাস্ক {হেপলটস} একটি কার্যকর ফাংশন যা অনুরূপ ফলাফল দেয়: $R^2$

etasq(mod)
          Partial eta^2
income        0.6154918
young         0.3576083
urban         0.1685162
Residuals            NA

— রবার্ট
সূত্র

আপনি ঠিক কী করার চেষ্টা করছেন বা প্রদর্শন করছেন? আনুমানিক প্রভাব? তাৎপর্যপূর্ণ?

— আইএমএ

হ্যাঁ, আমি টি- এবং এফ-পরীক্ষার সাথে পরিচিত। আমি আনুমানিক প্রভাব দেখাতে চাই, যার জন্য আফাইক টি এবং এফ-পরীক্ষা উপযুক্ত নয়।

— রবার্ট

1

আমার প্রশ্নটি: প্রতিটি উপাদানটির ফলাফলের উপর কতটা প্রভাব রয়েছে তা দেখানোর জন্য আমি কি আংশিক আর বা সহগের ব্যবহার করব? আমি উভয়কে একই দিকে নির্দেশ করতে অনুমান করছিলাম। আপনি বলছেন যে এটি সত্য নয় কারণ ডেটাতে বহুবিধ লাইন রয়েছে। ঠিক আছে, সুতরাং যখন আমি কোনও বিবরণ দিতে চাই যেমন ফ্যাক্টর 'তরুণ' ফলাফলকে প্রভাবিত করে তার চেয়ে x গুণ বেশি / যেটি 'আরবান' ফ্যাক্টরের চেয়ে x গুণ বেশি গুরুত্বপূর্ণ, আমি কি আংশিক আর বা সহগের দিকে নজর দেব?

— রবার্ট

1

আমি @ আইএমএ এর সাথে একমত নই আংশিক আর স্কোয়ার সরাসরি আংশিক সম্পর্কের সাথে যুক্ত, যা আইভ এবং ডিভির মধ্যে বিস্মৃত-সমন্বিত সম্পর্ক অধ্যয়ন করার একটি দুর্দান্ত উপায়।

— মাইকেল এম

1

আমি আপনার প্রশ্নটি এটিকে সম্পাদন করে এটিকে আবার প্রথম পৃষ্ঠায় হাজির করার জন্য। আমি একটি ভাল উত্তর খুব আগ্রহী হবে; যদি কিছু না হাজির হয় তবে আমি কোনও অনুদানও দিতে পারি। যাইহোক, সমস্ত ভবিষ্যদ্বাণীকে মানীকরণের পরে রিগ্রেশন সহগকে "স্ট্যান্ডার্ডাইজড কোয়েফিয়েন্টস" বলা হয়। এটি পরিস্কার করার জন্য আমি এই পদটি আপনার প্রশ্নের মধ্যে রেখেছি।

— অ্যামিবা বলছেন মনিকাকে

10

সংক্ষেপে , আমি আংশিক এবং মানক সহগ উভয়ই একই বিশ্লেষণে ব্যবহার করব না, কারণ তারা স্বতন্ত্র নয়। আমি যুক্তি দিয়ে বলব যে মানকযুক্ত সহগগুলি ব্যবহার করে সম্পর্কের তুলনা করা সম্ভবত আরও স্বজ্ঞাত কারণ তারা মডেল সংজ্ঞার সাথে (যেমন ) সহজেই সম্পর্কিত । আংশিক , ঘুরে, মূলত predictor এবং নির্ভরশীল পরিবর্তনশীল (DV) মধ্যে অনন্য ভাগ ভ্যারিয়েন্স অনুপাত (তাই প্রথম predictor জন্য এটি আংশিক পারস্পরিক সম্পর্কের বর্গ হয় $R^2$ $Y = \beta X$ $R^2$ $r_{x_1y.x_2...x_n}$ )। তদ্ব্যতীত, খুব ছোট ত্রুটির সাথে মানানসই সমস্ত সহগমের আংশিক ঝোঁক 1 থাকে, তাই তারা ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্ব চিহ্নিত করতে কার্যকর হয় না। $R^2$

প্রভাব আকার সংজ্ঞা

প্রমিত সহগ, - কোফিসিয়েন্টস আদর্শায়িত ভেরিয়েবল উপর একটি মডেল আনুমানিক হিসাব থেকে প্রাপ্ত (গড় = 0, স্ট্যানডার্ড ডেভিয়েশন = 1)। $\beta_{std}$ $\beta$
আংশিক - অনিশ্চিত প্রকরণের অনুপাতটি ভবিষ্যদ্বাণীকে সীমাবদ্ধ মডেলটিতে যোগ করে ব্যাখ্যা করা হয়েছে (পূর্বাভাসক ছাড়াই পুরো মডেল)। একই রকম: $R^2$
- ভবিষ্যদ্বাণীকারী এবং নির্ভরশীল ভেরিয়েবলের মধ্যে আংশিক সম্পর্কের স্কোয়ার, মডেলের অন্যান্য সমস্ত ভবিষ্যদ্বাণীকারীদের জন্য নিয়ন্ত্রণকারী। । $R_{partial}^2 = r_{x_iy.X\setminus x_i}^2$
- আংশিক - প্রেডিক্টর থেকে চিহ্নিত তৃতীয় স্কোয়ারের যোগফল এবং ত্রুটি তৃতীয় ধরণের বর্গের পরিমাণের অনুপাত $\eta^2$ $\text{SS}_\text{effect}/(\text{SS}_\text{effect}+\text{SS}_\text{error})$
-সীমাবদ্ধ এবং পূর্ণ মডেলেরমধ্যে পার্থক্য। সমান: $\Delta R^2$ $R^2$
- স্কোয়ারড semipartial পারস্পরিক সম্পর্ক $r_{x_i(y.X\setminus x_i)}^2$
- স্কোয়ার তৃতীয় সংখ্যার জন্য - আপনি কীপ্রশ্নেআংশিক হিসাবে গণনা করছেন। $\eta^2$ $\text{SS}_\text{effect}/\text{SS}_\text{total}$ $R^2$

এগুলির সবগুলি নিবিড়ভাবে সম্পর্কিত তবে তারা কীভাবে ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্ককে পরিচালনা করে তা পৃথক করে। এই পার্থক্যটি আরও কিছুটা বোঝার জন্য আসুন আমরা ধরে নিই যে আমাদের 3 মানক (মানে = 0, এসডি = 1) ভেরিয়েবলগুলি যার পারস্পরিক সম্পর্কগুলি । আমরা নিতে হবে নির্ভরশীল পরিবর্তনশীল এবং এবং $x,y,z$ $r_{xy}, r_{xz}, r_{yz}$ $x$ $y$ $z$ ভবিষ্যদ্বাণীকারী হিসাবে। আমরা পারস্পরিক আকারের গুণাগুণগুলির সকলকে পারস্পরিক সম্পর্কগুলির ক্ষেত্রে প্রকাশ করব যাতে আমরা স্পষ্টভাবে দেখতে পারি যে প্রত্যেকে কীভাবে সম্পর্ক সম্পর্কিত কাঠামো পরিচালনা করে। প্রথমে আমরা রিগ্রেশন মডেল ওএলএস ব্যবহারের অনুমানের সহগের তালিকাবদ্ধ করব। সহগের জন্য সূত্র: $x=\beta_{y}Y+\beta_{z}Z$ ভবিষ্যদ্বাণীকারীদের জন্য বর্গমূলসমান হবে:

\begin{aligned} β_{y} = \frac{r_{x y} - r_{y z} r_{z x}}{1 - r_{y z}^{2}} \\ β_{z} = \frac{r_{x z} - r_{y z} r_{y x}}{1 - r_{y z}^{2}}, \end{aligned}

$\begin{align}\beta_{y} = \frac{r_{xy}-r_{yz}r_{zx}}{1-r_{yz}^2}\\ \beta_{z}= \frac{r_{xz}-r_{yz}r_{yx}}{1-r_{yz}^2}, \end{align}$

R_{partial}^{2}

$R_\text{partial}^2$

\sqrt{R_{x y . z}^{2}} = \frac{r_{x y} - r_{y z} r_{z x}}{\sqrt{(1 - r_{x z}^{2}) (1 - r_{y z}^{2})}} \sqrt{R_{x z . y}^{2}} = \frac{r_{x z} - r_{y z} r_{y x}}{\sqrt{(1 - r_{x y}^{2}) (1 - r_{y z}^{2})}}

$\sqrt{R^2_{xy.z}} = \frac{r_{xy}-r_{yz}r_{zx}}{\sqrt{(1-r_{xz}^2)(1-r_{yz}^2)}}\\ \sqrt{R^2_{xz.y}} = \frac{r_{xz}-r_{yz}r_{yx}}{\sqrt{(1-r_{xy}^2)(1-r_{yz}^2)}}$

$\sqrt{\Delta R^2}$

\sqrt{R_{x y z}^{2} - R_{x z}^{2}} = r_{y (x . z)} = \frac{r_{x y} - r_{y z} r_{z x}}{\sqrt{(1 - r_{y z}^{2})}} \sqrt{R_{x z y}^{2} - R_{x y}^{2}} = r_{z (x . y)} = \frac{r_{x z} - r_{y z} r_{y x}}{\sqrt{(1 - r_{y z}^{2})}}

$\sqrt{R^2_{xyz}-R^2_{xz}}= r_{y(x.z)} = \frac{r_{xy}-r_{yz}r_{zx}}{\sqrt{(1-r_{yz}^2)}}\\ \sqrt{R^2_{xzy}-R^2_{xy}}= r_{z(x.y)}= \frac{r_{xz}-r_{yz}r_{yx}}{\sqrt{(1-r_{yz}^2)}}$

$\beta$ $\sqrt{\Delta R^2}$ $\sqrt{ R_\text{partial}^2}$ $\beta_{std}$

anova $R^2$ lm

আপনি যদি আর Anovaএর carপ্যাকেজ থেকে আপনার কলটিতে একটি ধরণের স্কয়ারের যোগফল ব্যবহার করেন, তবে $F$ $t$ $F(1,n) = t^2(n)$ anova(mod)Anova(mod, type = 2)options(contrasts = c("contr.sum","contr.poly"))Anova(mod,type=3) $R^2$ etasq() $p$ $R^2$

ধার

আংশিক সম্পর্কের সূত্রটি এখানে ttnphns জবাবে দেওয়া হয়েছে: একাধিক রিগ্রেশন বা আংশিক পারস্পরিক সম্পর্ক সহগ? এবং দুজনের মধ্যে সম্পর্ক
আধা আংশিক সম্পর্কের সূত্রটি আমি এখানে পেয়েছি: https://www3.nd.edu/~rwilliam/stats1/x92.pdf
$R^2$

— ক্রিস নোভাক
সূত্র

β = (X^{⊤} X) X^{⊤} y

$\beta = (X^\top X)X^\top y$ , তাই না?

— অ্যামিবা

1

আপনি ঠিক বলেছেন, আমি যা বোঝাতে চেয়েছিলাম তা হল তৃতীয় এসএস টাইপ এবং সহগের জন্য টি পরীক্ষাগুলি মূলত একই এফ টেস্ট এবং পি মান দেয়।

— ক্রিস নোভাক

2

@ অ্যামিবা কিছু গণনা করার পরে আমি আপনার পরামর্শগুলি অন্তর্ভুক্ত করতে আমার উত্তর সম্পাদনা করেছি, দুটি প্রভাব আকারের মধ্যে পার্থক্যটি কিছুটা স্পষ্ট করতে এবং ওপির উত্তরকে আরও ভালভাবে সম্বোধন করতে পারি।

— ক্রিস নোভাক

1

Δ R^{2}

$\Delta R^2$

R^{2}

$R^2$

R^{2}

$R^2$

R^{2}

$R^2$

— ক্রিস নোভাক

1

Δ R^{2}

$\Delta R^2$

R_{p}^{2}

$R^2_p$

Δ R^{2}

$\Delta R^2$

R_{p}^{2}

$R^2_p$

R^{2}

$R^2$

1

$1$

— অ্যামিবা

8

যেমনটি ইতিমধ্যে আরও কয়েকটি উত্তর এবং মন্তব্যে ব্যাখ্যা করা হয়েছে, এই প্রশ্নটি অন্তত তিনটি বিভ্রান্তির উপর ভিত্তি করে ছিল:

anova() $t$ Anova()car
$R^2$ $\beta_\mathrm{std}$
$R^2$ $\text{SS}_\text{effect}/(\text{SS}_\text{effect}+\text{SS}_\text{error})$ $\text{SS}_\text{effect}/\text{SS}_\text{total}$ $R^2$ $\text{SS}_\text{effect}$

এই বিভ্রান্তিগুলি স্পষ্ট হওয়ার পরে, প্রশ্নটি অনুমান করা হয় যে ভবিষ্যদ্বাণীকারী প্রভাবের আকার বা গুরুত্বের সবচেয়ে উপযুক্ত ব্যবস্থাগুলি কী।

আর-তে একটি প্যাকেজ রয়েছে relaimpoযা আপেক্ষিক গুরুত্বের বিভিন্ন পদক্ষেপ সরবরাহ করে।

library(car)
library(relaimpo)
mod <- lm(education~income+young+urban, data=Anscombe)
metrics <- calc.relimp(mod, type = c("lmg", "first", "last", "betasq", "pratt", "genizi", "car"))

Anscombeআপনার প্রশ্নের মতো একই ডেটাसेट ব্যবহার করে , এটি নিম্নলিখিত মেট্রিকগুলি প্রদান করে:

Relative importance metrics: 

              lmg      last      first    betasq       pratt     genizi        car
income 0.47702843 0.4968187 0.44565951 0.9453764  0.64908857 0.47690056 0.55375085
young  0.14069003 0.1727782 0.09702319 0.1777135  0.13131006 0.13751552 0.13572338
urban  0.07191039 0.0629027 0.06933945 0.1188235 -0.09076978 0.07521276 0.00015460

এর মধ্যে কিছু মেট্রিক ইতিমধ্যে আলোচনা করা হয়েছে:

betasqস্কোয়্যার স্ট্যান্ডার্ডাইজড কোয়েফিয়েন্টস, আপনার সাথে একই মানগুলি প্রাপ্ত lm()।
first $\text{SS}_\text{effect}/\text{SS}_\text{total}$ $\text{SS}_\text{effect}$ টাইপ হয় আই এস এস যখন এই ভবিষ্যদ্বাণীকারী মডেলটিতে প্রথম হয়। 'আয়' (0.446) এর মান anova()আউটপুট ভিত্তিক আপনার গণনার সাথে মেলে । অন্যান্য মান মেলে না।
last $R^2$ $\text{SS}_\text{effect}/\text{SS}_\text{total}$ $\text{SS}_\text{effect}$ $R^2$ anova()

$R^2$

এখানে আরও চারটি মেট্রিক রয়েছে relaimpo- এবং প্যাকেজটি relaimpoম্যানুয়ালি ইনস্টল করা থাকলে আরও একটি (পঞ্চম) পাওয়া যায় : CRAN সংস্করণটি তার লেখকের সাথে সম্ভাব্য দ্বন্দ্বের কারণে এই মেট্রিককে বাদ দেয় না, যেমনটি মনে হচ্ছে পাগল, তার পদ্ধতিতে মার্কিন পেটেন্ট রয়েছে । আমি আর অনলাইন চালাচ্ছি এবং এতে অ্যাক্সেস নেই, সুতরাং যদি কেউ ম্যানুয়ালি ইনস্টল করতে পারে relaimpoতবে সম্পূর্ণতার জন্য উপরের আমার আউটপুটটিতে এই অতিরিক্ত মেট্রিক যুক্ত করুন।

দুটি মেট্রিক হ'ল prattএটি নেতিবাচক (খারাপ) হতে পারে এবং geniziএটি বেশ অস্পষ্ট।

দুটি আকর্ষণীয় পন্থা lmgএবং car।

$\text{SS}_\text{effect}/\text{SS}_\text{total}$ $\text{SS}_\text{effect}$

দ্বিতীয়টি চালু করা হয়েছে (জুবার ও স্ট্রাইমার, ২০১১) এবং এতে অনেক আবেদনকারী তাত্ত্বিক বৈশিষ্ট্য রয়েছে; ভবিষ্যদ্বাণীকারীদের প্রথমে মানসম্মত করার পরে জেডিসিএ / মহালানোবিস রূপান্তর (যেমন পুনর্নির্মাণের ত্রুটি হ্রাস করার সময় সাদা করা হয়েছে) এর পরে এটি বর্গক্ষেত্রের মানযুক্ত গুণফল রয়েছে।

$2:1$ lmg $878:1$ car

বিবলিওগ্রাফি:

উলরিক গ্র্যাম্পিংয়ের ওয়েবসাইটে আপেক্ষিক গুরুত্বের বিষয়ে উল্লেখ - তিনি এর লেখক relaimpo।
গ্র্যাম্পিং, ইউ। (2006) আর এ লিনিয়ার রিগ্রেশন এর জন্য আপেক্ষিক গুরুত্ব: প্যাকেজ রিলেম্পো । পরিসংখ্যান সফটওয়্যার জার্নাল 17, সংখ্যা 1।
গ্র্যাম্পিং, ইউ। (2007) বৈচিত্র্য পচনের উপর ভিত্তি করে লিনিয়ার রিগ্রেশন সম্পর্কিত আপেক্ষিক গুরুত্বের অনুমানকারী । আমেরিকান পরিসংখ্যানবিদ 61, 139-147।
জুবের, ভি। এবং স্ট্রাইমার, কে। (2010)। সিআর স্কোর ব্যবহার করে উচ্চ-মাত্রিক রিগ্রেশন এবং পরিবর্তনশীল নির্বাচন । জেনেটিক্স এবং মলিকুলার বায়োলজিতে পরিসংখ্যানমূলক অ্যাপ্লিকেশনগুলি 10.1 (2011): 1-27।
গ্র্যাম্পিং, মার্কিন যুক্তরাষ্ট্র (2015)। রিগ্রেশন মডেলগুলিতে পরিবর্তনশীল গুরুত্ব । উইলে আন্তঃবিষয়ক পর্যালোচনা: গণনা পরিসংখ্যান, 7 (2), 137-152। (বেতন দেওয়ালের পিছনে)

— অ্যামিবা বলছেন মনিকাকে রিইনস্টেট করুন
সূত্র

বিভিন্ন গুরুত্ব সহগের উপর অতিরিক্ত মূল্যবান তথ্য সহ খুব সুন্দর সংক্ষিপ্তসার। বিটিডাব্লু, আপনি কি এই আর ইঞ্জিনটি অনলাইনে ব্যবহার করছেন? pbil.univ-lyon1.fr/Rweb বা অন্য একটি?

— ttnphns

1

আমি r-food.org ব্যবহার করি , তবে আমি আর কখনও কিছু চেষ্টা করে দেখিনি এবং এটির তুলনা জানি না। যদিও এটি দেখতে বেশ চতুর।

— অ্যামিবা বলেছেন মনিকাকে রিইনস্টেট করুন

প্রভাবের আকারগুলিতে খুব পরিষ্কার সংক্ষিপ্তসার এবং অতিরিক্ত তথ্য (+1)

— ক্রিস নোভাক

4

তুমি লিখেছিলে:

আমার প্রশ্নটি হ'ল: প্রতিটি ফলের ফলাফলের উপর কতটা প্রভাব রয়েছে তা দেখানোর জন্য আমি কি আংশিক R² বা সহগ ব্যবহার করব?

এখানে দুটি জিনিস বিভ্রান্ত না করা গুরুত্বপূর্ণ। প্রথমত, মডেল স্পেসিফিকেশন প্রশ্ন আছে। Lm অ্যালগরিদম ধরে নেয় যে ওএলএস-অনুমানগুলি পূরণ হয়েছে। অন্যান্য জিনিসের মধ্যে এর অর্থ এই যে নিরপেক্ষ অনুমানের জন্য, মডেল থেকে কোনও লক্ষণীয় ভেরিয়েবল অনুপস্থিত হতে পারে (বাদে যখন এটি অন্য সমস্ত রেজিস্ট্রারের সাথে সম্পর্কযুক্ত নয়, বিরল)।
সুতরাং একটি মডেল সন্ধানের ক্ষেত্রে, আর adj বা অ্যাডজাস্টেড আরের উপর অতিরিক্ত প্রভাব হ'ল আগ্রহের বিষয়। অ্যাডজাস্টেড আর² উন্নত হওয়া বন্ধ না করা পর্যন্ত কেউ রেজিস্ট্রার যুক্ত করা উপযুক্ত বলে মনে করতে পারে, উদাহরণস্বরূপ। ধাপে ধাপে রিগ্রেশন পদ্ধতিতে আকর্ষণীয় সমস্যা রয়েছে যেমন এর মতো, তবে এটি বিষয় নয়। যে কোনও ক্ষেত্রে আমি ধরে নিই যে আপনি নিজের মডেলটি বেছে নেওয়ার কোনও কারণ ছিল।

তবুও: আর এর উপর এই অতিরিক্ত প্রভাবটি স্বাধীন ভেরিয়েবলের উপর রেজিস্ট্রারের প্রকৃত বা সামগ্রিক প্রভাবের সমান নয়, স্পষ্টতই বহুবিধরাশিজনিত কারণে: আপনি যদি রেজিস্টার কেড়ে নেন তবে এর প্রভাবের অংশটি এখন অন্য রেজিস্ট্রারদের জন্য দায়ী করা হবে যা এটির সাথে সম্পর্কযুক্ত সুতরাং এখন আসল প্রভাবটি সঠিকভাবে প্রদর্শিত হয়নি।

এবং আরও একটি সমস্যা রয়েছে: অনুমানগুলি কেবলমাত্র সমস্ত অন্যান্য রেজিস্ট্রারগণের সাথে সম্পূর্ণ মডেলের জন্য বৈধ। হয় এই মডেলটি এখনও সঠিক নয় এবং সুতরাং প্রভাব সম্পর্কে আলোচনা অর্থহীন - বা এটি সঠিক এবং তারপরে আপনি কোনও রেজিস্টারকে মুছে ফেলতে পারবেন না এবং এখনও সাফল্যের সাথে ওএলএস পদ্ধতি ব্যবহার করতে পারেন।

সুতরাং: আপনার মডেল এবং ওএলএস ব্যবহার উপযুক্ত? যদি এটি হয় তবে অনুমানগুলি আপনার প্রশ্নের জবাব দেয় - এগুলি রিগ্রেশন / নির্ভরশীল ভেরিয়েবলের উপর ভেরিয়েবলের প্রভাব সম্পর্কে আপনার আক্ষরিক সেরা অনুমান।
যদি তা না হয় তবে আপনার প্রথম কাজটি একটি সঠিক মডেল সন্ধান করা। এর জন্য আংশিক আর² ব্যবহারের উপায় হতে পারে। মডেল স্পেসিফিকেশন বা স্টেওয়াইজ রিগ্রেশন সম্পর্কিত অনুসন্ধান এই ফোরামে অনেক আকর্ষণীয় পন্থা তৈরি করবে। কী কাজ করে তা আপনার ডেটার উপর নির্ভর করবে।

— ইমা
সূত্র

1

আপনার উত্তর চার ধন্যবাদ! আমি নিশ্চিত না যে আপনার বক্তব্যটি "আরএর উপর এই অতিরিক্ত প্রভাবটি স্বাধীন ভেরিয়েবলের উপর রেজিস্ট্রারের প্রকৃত বা সামগ্রিক প্রভাবের সমান নয়" নিরপেক্ষ। প্যাকেজ রিলেম্প্পো cran.r-project.org/web/packages/relaimpo/relaimpo.pdf উদাহরণস্বরূপ "লিনিয়ার মডেলগুলিতে আপেক্ষিক গুরুত্ব নির্ধারণের জন্য" আংশিক R uses ব্যবহার করে।

— রবার্ট

1

আপনি কি মনে করেন যে আপনি নিজের দৃষ্টিভঙ্গির জন্য একটি রেফারেন্স সরবরাহ করতে পেরেছেন যে কেবলমাত্র মডেল নির্বাচনের জন্য র ব্যবহার করা উচিত?

— রবার্ট

1

@ আরবার্ট: রেইসন ডি'ইটি হ'ল relaimpoআইএমএ যে কারণ দেয়, তার জন্য আংশিক আর ^ 2 এর বিকল্প সরবরাহ করা!

— Scortchi - পুনর্বহাল মনিকা

1

@ স্কোর্টচি: বাহ, relaimpoপ্যাকেজটির ম্যানুয়ালটি দেখে আমি বুঝতে পেরেছি যে লিনিয়ার রিগ্রেশন-এ ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্বের পরিমাণ নির্ধারণের জন্য বিভিন্ন পদ্ধতির পুরো বিশ্ব রয়েছে । আমি বর্তমানে সেখানে লিঙ্কিত কিছু কাগজপত্রগুলি দেখছি ( এই 2010 প্রিপ্রিন্টটি এখনও পর্যন্ত বেশ ভাল দেখাচ্ছে), এবং এটি একটি গোলমাল! আমি বুঝতে পারি নি যে এই সমস্যাটি এত জটিল, যখন আমি আমার অনুগ্রহের প্রস্তাব দিয়েছিলাম। এটি সিভিতে সঠিকভাবে আলোচনা হয়েছে বলে মনে হয় না। এটি কি অস্পষ্ট বিষয়? যদি তাই হয় তবে কেন?

— অ্যামিবা

2

@ অ্যামিবা: একটি অফ-দ্য কাফের উত্তরটি হ'ল "ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্ব" বেশিরভাগ উদ্দেশ্যেই গুরুত্বপূর্ণ নয়। যদি আপনার এমন কোনও মডেল থাকে যা আপনি সন্তুষ্ট হন তবে আপনি এটির জন্য দিনে একটি সিগারেট ধূমপান করার মতো জিনিস বলতে ব্যবহার করতে পারেন হার্ট অ্যাটাক হওয়ার ঝুঁকির দিক থেকে পাঁচটি হ্যামবার্গার খাওয়ার সমতুল্য - গুরুত্বটি কীসের সংক্ষিপ্ত ব্যাখ্যা থেকে আসে আপনি মডেলিং করছেন; যদি আপনি মডেলগুলির সাথে তুলনা করেন আপনি পুরো মডেলগুলির সাথে তুলনা করেন - পূর্বাভাসকারীদের সাথে ব্যয়বহুল - পরিমাপের জুটি না রেখে এবং বলুন - এবং কীভাবে ভবিষ্যদ্বাণীমূলক শক্তি মোটামুটি বিভাজন হতে পারে তা নিয়ে চিন্তা করার দরকার নেই।

— Scortchi - পুনর্বহাল মনিকা

3

লিনিয়ার রিগ্রেশন সহগ এবং আপনি পড়তে পারেন এমন আংশিক সম্পর্ক সম্পর্কিত পার্থক্য সম্পর্কে এই উদাহরণস্বরূপ,।

তবে এই প্রশ্নে যে বিভ্রান্তি প্রকাশ হয়েছে তা অন্য এক প্রকৃতির বলে মনে হচ্ছে। এটি প্রদর্শিত হয় যে এটি বা সেই পরিসংখ্যান প্যাকেজ (বিষয়, বারবার আমাদের সাইটে আলোচিত) দ্বারা ব্যবহৃত স্কোয়ার অফ স্কোয়ারগুলির ডিফল্ট ধরণের সম্পর্কে। লিনিয়ার রিগ্রেশন আনোভা টাইপ তৃতীয় এসএস রিকনিংয়ে যা ডাকে তা ব্যবহার করে। অনেক আনোভা প্রোগ্রামে এটি ডিফল্ট বিকল্পও। মধ্যেR ফাংশনanova , আমার মনে হচ্ছে, (আমি, ব্যবহারকারী আর নই তাই আমি এটা অনুমান করা) ডিফল্ট হিসাব প্রকার আমি এস এস (একটি "অনুক্রমিক এস এস" যা অর্ডার ভবিষ্যতবক্তা মডেল উল্লিখিত উপর নির্ভরশীল) হয়। সুতরাং, আপনি যে তাত্পর্যটি পর্যবেক্ষণ করেছেন এবং যা আপনার মানগুলি ("স্কেলড") মানক করার সময় অদৃশ্য হয়নি তা হ'ল কারণ আপনি ডিওল্ট টাইপ আই বিকল্পটি দিয়ে অ্যানোভা নির্দিষ্ট করেছেন।

নীচে আপনার ডেটা সহ এসপিএসে প্রাপ্ত ফলাফল রয়েছে:

এখানে চিত্র বর্ণনা লিখুন

আপনি এই প্রিন্ট-আউটগুলিতে বেছে নিতে পারেন যে প্যারামিটারগুলি (রিগ্রেশনাল কো-ফলসিয়েন্টস) একই রকম নির্বিশেষে এসএস গণনা। আপনি আরও খেয়াল করতে পারেন যে আংশিক এটা স্কোয়ার্ড [যা এসএসএফেক্ট / (এসএসএফেক্ট + এসসারিয়র) এবং = আমাদের ক্ষেত্রে আংশিক আর-স্কোয়ার্ড কারণ ভবিষ্যদ্বাণীকারীরা সংখ্যার কোভারিয়েট] কেবল এসএস টাইপ করলেই প্রভাবগুলির সারণিতে এবং সহগের সম্পূর্ণরূপে একই থাকে III হয়। যখন এসএস টাইপ করুন আমি তখন 3 পূর্বাভাসকারীদের মধ্যে শুধুমাত্র "শহুরে" একই মান (.169) ধরে রাখে; এটি কারণ ভবিষ্যদ্বাণীকারীদের ইনপুট ক্রম এটি শেষ। টাইপ III এসএস এর ক্ষেত্রে ইনপুট ক্রমের ক্ষেত্রে যেমন রিগ্রেশন হয় তেমন কিছু আসে না। যাইহোক, পার্থক্যটি পি-মানগুলিতেও আবদ্ধ। যদিও আপনি এটি আমার টেবিলগুলিতে দেখতে পাচ্ছেন না কারণ "সিগ" কলামে কেবলমাত্র 3 দশমিক সংখ্যা রয়েছে,

আপনি আনোভা / লিনিয়ার মডেলটিতে বিভিন্ন "এসএস টাইপ" সম্পর্কে আরও পড়তে চাইতে পারেন। ধারণামূলকভাবে, তৃতীয় টাইপ করুন বা "রিগ্রেশন" টাইপ এসএস মৌলিক এবং আদিম। অন্যান্য ধরণের এসএস (I, II, IV, আরও বেশি বিদ্যমান) এর প্রভাবগুলি আরও ব্যাপকভাবে অনুমান করার জন্য বিশেষ ডিভাইসগুলি রয়েছে, রিগ্রেশন প্যারামিটারগুলির তুলনায় স্বল্প পরিমাণে পারস্পরিক সম্পর্কের পূর্বাভাসকারীদের ক্ষেত্রে অনুমতি দেয়।

সাধারণত, প্রভাবগুলির আকার এবং তাদের পি-মানগুলি পরামিতিগুলি এবং তাদের পি-মানগুলির চেয়ে রিপোর্ট করা আরও গুরুত্বপূর্ণ, যদি না অধ্যয়নের লক্ষ্য ভবিষ্যতের জন্য মডেল তৈরি করা হয়। প্যারামিটারগুলি আপনাকে পূর্বাভাস দেওয়ার অনুমতি দেয় তবে "প্রভাব" বা "প্রভাব" "লিনিয়ার পূর্বাভাসের শক্তি" এর চেয়ে আরও বিস্তৃত ধারণা হতে পারে। প্রভাব বা গুরুত্বের প্রতিবেদন করার জন্য আংশিক এটা স্কোয়ার ছাড়াও অন্যান্য সহগগুলি সম্ভব। একটি হ'ল ছুটি-এক-আউট সহগ: একটি ভবিষ্যদ্বাণীকের গুরুত্ব হ'ল মডেল থেকে সরানো পূর্বাভাসীর সাথে স্কোয়ারের অবশিষ্টাংশ যোগফলকে স্বাভাবিক করা যাতে সমস্ত ভবিষ্যদ্বাণীকারীদের জন্য গুরুত্বের মান 1 হয়।

— ttnphns
সূত্র

+1, আলোচনায় যোগ দেওয়ার জন্য ধন্যবাদ। আমার একটি টার্মিনোলজিকাল প্রশ্ন আছে। "আংশিক আর স্কোয়ার্ড" এসএসেফেক্ট / (এসএসএফেক্ট + এসএসরর) হিসাবে সংজ্ঞায়িত করা হয়। এসএসেফেক্ট / এসএসটোটালের নাম কী? আমি যতদূর বুঝতে পেরেছি (আমি ভুল হলে আমাকে সংশোধন করি), আমরা যদি III এসএস পচন প্রকারটি ব্যবহার করি তবে এই এসএসএফেক্ট / এসএসটোটাল প্রতিক্রিয়া এবং এই ভবিষ্যদ্বাণীকের (অন্যান্য সমস্ত ভবিষ্যদ্বাণীকারীদের জন্য নিয়ন্ত্রণকারী) মধ্যে স্কোয়ার আংশিক পারস্পরিক সম্পর্কের সমান হবে। এই পরিমাণের একটি নাম আছে? আংশিক আর 2 আংশিক এটা স্কোয়ারের সাথে সমান, তবে কেন এটা স্কোয়ারের অ্যানালগের কোনও নাম নেই? এতে আমি বিভ্রান্ত হয়ে পড়েছি।

— অ্যামিবা বলেছেন

ওফস, আমার মনে হয় আমি উপরে কিছু বাজে কথা লিখেছি: স্কোয়ারড আংশিক পারস্পরিক সম্পর্কটি এসএসেফেক্ট / (এসএসএফেক্ট + এসএসেরর), ঠিক ঠিক আংশিক আর 2, সঠিক? তবুও, এসএসেফেক্ট / এসএসটোটালকে কীভাবে কল করবেন (এই প্রশ্নটি ওপি তাঁর মূল প্রশ্নে গণনা করার চেষ্টা করেছিল!) এখনও অবধি রয়ে গেছে। আমরা কি একে এটা স্কোয়ার বলতে পারি? অথবা "পার্টিশনযুক্ত আর 2" (তৃতীয় এসএস টাইপের ক্ষেত্রে অবশ্যই এই "পার্টিশনগুলি" মোট আর 2 এর সমষ্টি হবে না)?

— অ্যামিবা বলছেন মিনিকা

1

হ্যাঁ, এসফেক্ট / এসএসটোটাল কেবল এটা স্কোয়ারড। এটি নির্দিষ্ট মডেলের প্রেডিক্টরের স্কোয়ার (প্রান্তিক এটা স্কোয়ার্ড = এটা স্কোয়ারের সাথে বিভ্রান্ত না করা যখন প্রেডিক্টর মডেলটিতে কেবলমাত্র একজনই থাকে = শূন্য-ক্রম পিয়ারসন আর ^ 2, আমাদের ধারাবাহিক ভবিষ্যদ্বাণীকারীদের ক্ষেত্রে)।

— ttnphns

1

ঠিক তাই. পার্ট রিলেশনশিপটি হ'ল (এর একটি নির্দিষ্ট উদাহরণ) ta আমি মনে করি যে অতএব মডেল অংশ এটা এটিকে বলা ভাল । আমি "অংশ" বা "আধা পার্টিশন" এবং এই শব্দটির মুখোমুখি হচ্ছি এমন কোনও পাঠ্য এখনও মনে নেই। যদি আপনি এটি সন্ধান করেন তবে দয়া করে আমাকে জানান।

— ttnphns

1

হ্যাঁ; কেন, আমি একইভাবে মনে করি। তবে আর, আংশিক আর, আধা পার্টিয়াল আর হ'ল নির্দিষ্ট কেস সম্পর্কিত e তবে উভয়ের মধ্যে গুরুত্বপূর্ণ পরিভাষাগত পার্থক্যটি সেই প্রসঙ্গে উত্থাপিত হয় যখন, সামগ্রিক শ্রেণিবদ্ধ (ডামি) "ননলাইনার" প্রভাবটি আমরা ভবিষ্যদ্বাণীকের রৈখিক (বা বহুপদী) প্রভাবকে সংযোজিত করি যেন সংখ্যাযুক্ত কোডযুক্ত। এখানে আমরা 3 টি প্রভাব প্রদর্শন করব: সম্মিলিত এটাস্ক = লিনিয়ার Rsq + বিচ্যুতি-থেকে-রৈখিকতা।

— ttnphns