আর ব্যবহার করে একাধিক রিগ্রেশনে প্রতিটি ভবিষ্যদ্বাণী দ্বারা ব্যাখ্যা করা বৈকল্পিক গণনা করুন


14

আমি একাধিক রিগ্রেশন চালিয়েছি যার মধ্যে সামগ্রিকভাবে মডেলটি তাৎপর্যপূর্ণ এবং প্রায় 13% বৈকল্পিকতা ব্যাখ্যা করে। তবে, প্রতিটি তাত্পর্যপূর্ণ ভবিষ্যদ্বাণীকের দ্বারা ব্যাখ্যা করা তারতম্যের পরিমাণটি আমার সন্ধান করতে হবে। আমি আর এর সাহায্যে এটি কীভাবে করতে পারি?

এখানে কিছু নমুনা ডেটা এবং কোড রয়েছে:

D = data.frame(
    dv = c( 0.75, 1.00, 1.00, 0.75, 0.50, 0.75, 1.00, 1.00, 0.75, 0.50 ),
    iv1 = c( 0.75, 1.00, 1.00, 0.75, 0.75, 1.00, 0.50, 0.50, 0.75, 0.25 ),
    iv2 = c( 0.882, 0.867, 0.900, 0.333, 0.875, 0.500, 0.882, 0.875, 0.778, 0.867 ),
    iv3 = c( 1.000, 0.067, 1.000, 0.933, 0.875, 0.500, 0.588, 0.875, 1.000, 0.467 ),
    iv4 = c( 0.889, 1.000, 0.905, 0.938, 0.833, 0.882, 0.444, 0.588, 0.895, 0.812 ),
    iv5 = c( 18, 16, 21, 16, 18, 17, 18, 17, 19, 16 ) )
fit = lm( dv ~ iv1 + iv2 + iv3 + iv4 + iv5, data=D )
summary( fit )

এখানে আমার আসল ডেটা দিয়ে আউটপুট দেওয়া হচ্ছে:

Call: lm(formula = posttestScore ~ pretestScore + probCategorySame + 
    probDataRelated + practiceAccuracy + practiceNumTrials, data = D)

Residuals:
    Min      1Q  Median      3Q     Max 
-0.6881 -0.1185  0.0516  0.1359  0.3690 

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)
 (Intercept)        0.77364    0.10603    7.30  8.5e-13 ***
 iv1                0.29267    0.03091    9.47  < 2e-16 ***
 iv2                0.06354    0.02456    2.59   0.0099 **
 iv3                0.00553    0.02637    0.21   0.8340
 iv4               -0.02642    0.06505   -0.41   0.6847
 iv5               -0.00941    0.00501   -1.88   0.0607 .  
--- Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

Residual standard error: 0.18 on 665 degrees of freedom
 Multiple R-squared:  0.13,      Adjusted R-squared:  0.123
 F-statistic: 19.8 on 5 and 665 DF,  p-value: <2e-16

এই প্রশ্নের উত্তর এখানে দেওয়া হয়েছে , তবে স্বীকৃত উত্তরটি কেবল অসংলগ্ন ভবিষ্যদ্বাণীকে সম্বোধন করে, এবং একটি অতিরিক্ত প্রতিক্রিয়া রয়েছে যা সম্পর্কিত সম্পর্কিত ভবিষ্যদ্বাণীকে সম্বোধন করে, এটি কেবল একটি সাধারণ ইঙ্গিত সরবরাহ করে, নির্দিষ্ট সমাধান নয়। আমি যদি আমার ভবিষ্যদ্বাণীকারীদের সাথে সম্পর্কিত হয় তবে আমি কী করতে চাই তা জানতে চাই।


2
আপনি কি এখানে জেরোমি অ্যাংলিমের উত্তরটি দেখেছেন ?
স্ট্যাটাস

হ্যাঁ, এটিই ছিল অতিরিক্ত প্রতিক্রিয়া যা আমি উল্লেখ করছি। আমি আরও নির্দিষ্ট এবং ধাপে ধাপে কিছু আশা করছিলাম something আমি পিপিসিআর ডাউনলোড করেছিলাম তবে এসসিপোর আউটপুট দিয়ে কী করব তা নিশ্চিত ছিলাম না। এছাড়াও, আমি ভাবছি যে কোর আর এ করার কোনও উপায় আছে কিনা? এটি একটি সাধারণ যথেষ্ট টাস্কের মতো বলে মনে হচ্ছে এটির জন্য বিশেষ প্যাকেজটির প্রয়োজন হবে না।
বাক্সেওয়ে

সম্পর্কের পূর্বাভাসকারীদের সম্পর্কে আপনার প্রশ্নের সংক্ষিপ্ত উত্তর হ'ল খুব কমপক্ষে আরও অনুমান এবং অনুমান ছাড়াই তাদের পৃথক গুরুত্ব পরিমাপ করা যায় না। এটি এইভাবে বিবেচনা করুন: এটি যদি সোজা হয় তবে কেন এটি সহজে এবং সহজেই পাওয়া যায় না, কারণ অনেক গবেষক মনে করেন তারা এটি চান?
নিক কক্স

আমি relaimpoপ্যাকেজটি এবং এর সাথে থাকা কাগজগুলি সন্ধান করার পরামর্শ দেব : jstatsoft.org/index.php/jss/article/view/v017i01/v17i01.pdf আমি প্রায়শই "এলএমজি" পদ্ধতি ব্যবহার করি।
ফিল

উত্তর:


16

প্রদত্ত অর্ডারের উপর নির্ভরশীল শতাংশ শতাংশ নির্ভর করে।

আপনি যদি একটি নির্দিষ্ট অর্ডার নির্দিষ্ট করে থাকেন তবে আপনি এইটিকে তুচ্ছভাবে R তে গণনা করতে পারেন (উদাহরণস্বরূপ updateএবং anovaফাংশনগুলির মাধ্যমে , নীচে দেখুন), তবে প্রবেশের একটি ভিন্ন ক্রম থেকে সম্ভাব্য খুব আলাদা উত্তর পাওয়া যাবে।

[একটি সম্ভাবনা সবগুলি অর্ডার বা কোনও কিছু জুড়ে গড়ে উঠতে পারে, তবে এটি অকার্যকর হয়ে উঠতে পারে এবং বিশেষত কোনও দরকারী প্রশ্নের উত্তর দিচ্ছে না]]

-

স্ট্যাটাসটি একটি একক মডেল হিসাবে উল্লেখ করেছে যে আপনি যদি একবারে এক পরিবর্তনের পরে থাকেন তবে আপনি স্কোয়ার টেবিলের বর্ধিত পরিমাণগুলি তৈরি করতে কেবল 'আনোভা' ব্যবহার করতে পারেন। এটি আপনার কোড থেকে অনুসরণ করবে:

 anova(fit)
Analysis of Variance Table

Response: dv
          Df   Sum Sq  Mean Sq F value Pr(>F)
iv1        1 0.033989 0.033989  0.7762 0.4281
iv2        1 0.022435 0.022435  0.5123 0.5137
iv3        1 0.003048 0.003048  0.0696 0.8050
iv4        1 0.115143 0.115143  2.6294 0.1802
iv5        1 0.000220 0.000220  0.0050 0.9469
Residuals  4 0.175166 0.043791        

-

সুতরাং সেখানে আমাদের ক্রমবর্ধমান বৈকল্পিক ব্যাখ্যা করা হয়েছে; আমরা অনুপাত কিভাবে পেতে পারি?

খুব তুচ্ছভাবে, তাদের যোগফলকে 1 দ্বারা ভাগ করে তাদের স্কেল করুন। (শতাংশের বৈকল্পিকতার জন্য 100 এর সাথে 1 প্রতিস্থাপন করুন))

এখানে আমি এটিকে অ্যানাভা টেবিলের একটি যুক্ত কলাম হিসাবে প্রদর্শন করেছি:

 af <- anova(fit)
 afss <- af$"Sum Sq"
 print(cbind(af,PctExp=afss/sum(afss)*100))
          Df       Sum Sq      Mean Sq    F value    Pr(>F)      PctExp
iv1        1 0.0339887640 0.0339887640 0.77615140 0.4280748  9.71107544
iv2        1 0.0224346357 0.0224346357 0.51230677 0.5137026  6.40989591
iv3        1 0.0030477233 0.0030477233 0.06959637 0.8049589  0.87077807
iv4        1 0.1151432643 0.1151432643 2.62935731 0.1802223 32.89807550
iv5        1 0.0002199726 0.0002199726 0.00502319 0.9468997  0.06284931
Residuals  4 0.1751656402 0.0437914100         NA        NA 50.04732577

-

আপনি যদি সিদ্ধান্ত নিতে চান যে আপনি বেশ কয়েকটি নির্দিষ্ট প্রবেশের আদেশ চান তবে আপনি এর থেকে আরও সাধারণ কিছু করতে পারেন (যা আপনাকে চাইলে একবারে ভেরিয়েবলের গোষ্ঠীগুলিতে প্রবেশ বা সরাতে দেয়):

 m5 = fit
 m4 = update(m5, ~ . - iv5)
 m3 = update(m4, ~ . - iv4)
 m2 = update(m3, ~ . - iv3)
 m1 = update(m2, ~ . - iv2)
 m0 = update(m1, ~ . - iv1)

 anova(m0,m1,m2,m3,m4,m5)
Analysis of Variance Table

Model 1: dv ~ 1
Model 2: dv ~ iv1
Model 3: dv ~ iv1 + iv2
Model 4: dv ~ iv1 + iv2 + iv3
Model 5: dv ~ iv1 + iv2 + iv3 + iv4
Model 6: dv ~ iv1 + iv2 + iv3 + iv4 + iv5
  Res.Df     RSS Df Sum of Sq      F Pr(>F)
1      9 0.35000                           
2      8 0.31601  1  0.033989 0.7762 0.4281
3      7 0.29358  1  0.022435 0.5123 0.5137
4      6 0.29053  1  0.003048 0.0696 0.8050
5      5 0.17539  1  0.115143 2.6294 0.1802
6      4 0.17517  1  0.000220 0.0050 0.9469

(এই জাতীয় দৃষ্টিভঙ্গি স্বয়ংক্রিয়ভাবেও হতে পারে, উদাহরণস্বরূপ লুপগুলির মাধ্যমে এবং এর ব্যবহারের মাধ্যমে getneeded প্রয়োজনে আপনি একাধিক অর্ডারে ভেরিয়েবলগুলি যুক্ত করতে এবং মুছতে পারেন)

... এবং তারপরে পূর্বের মতো শতাংশে স্কেল করুন।

(এনবি। আমি এই বিষয়গুলি কীভাবে করব তা আমি ব্যাখ্যা করি যে অগত্যা আমি যে সমস্ত ব্যাখ্যা করি তার সমর্থন হিসাবে নেওয়া উচিত নয়))


2
R2anova(fit)m0m5

এই সংশোধিত উত্তরটি সত্যিই দরকারী। আমি মনে করি আমি সেখানে যাচ্ছি। একটি প্রশ্ন: আমি যদি আপনি বর্ণিত পদ্ধতিতে iv5 (শেষ পরিবর্তনশীল) এর জন্য ব্যাখ্যা করা বৈকল্পিকের অনুপাতটি গণনা করি, তবে এই গাণিতিকভাবে মডেলটিতে প্রয়োগ করা সংক্ষিপ্তসার দ্বারা ফিরে আসা R ^ 2 মানের পার্থক্যের মতোই কি আইভ 5 এর সাথে এবং তার সাথে খাপ খায়? আমি আসলে একই মান পেয়ে যাচ্ছি এবং কেবল এইগুলি ধারণাগতভাবে একই জিনিস কিনা তা যাচাই করতে চেয়েছিলাম।
বাক্সেওয়ে

এবং আরও একটি প্রশ্ন: আমি পূর্ববর্তী মন্তব্যে দু'টি আলাদা আইভির প্রতি একবারের জন্য যা বর্ণনা করেছি তা করতে পেরেছ কি কোনও কারণ আছে? ভেরিয়েবল প্রবেশের বিভিন্ন আদেশ জড়িত এটি কি আপনার দ্বিতীয় প্রস্তাবিত পদ্ধতির সমতুল্য হবে?
বাক্সেওয়ে

R2summary.lm

2

আমি প্রমাণ করেছি যে একাধিক লিনিয়ার রিগ্রেশন প্রদত্ত ভবিষ্যদ্বাণী দ্বারা ব্যাখ্যা করা তারতম্যের শতাংশটি হ'ল opeাল সহগের উত্পাদন এবং নির্ভরশীল ভেরিয়েবলের লাগানো মানগুলির সাথে ভবিষ্যদ্বাণীকের পারস্পরিক সম্পর্ক (ধরে নেওয়া যে সমস্ত ভেরিয়েবলকে শূন্য বলে মান হিসাবে মানক করা হয়েছে) এবং বৈকল্পিক এক; যা সাধারণের ক্ষতি ছাড়াই)। এটি এখানে সন্ধান করুন:

https://www.researchgate.net/publication/306347340_A_Natural_Decomposition_of_R2_in_Multiple_Linear_Regression


3
ব্যবহারকারী 128460 স্বাগত, তবে এটি একটি প্রশ্নোত্তর সাইট, কোনও প্রশ্ন এবং লিঙ্ক-টু-উত্তর সাইট নয়।
রবার্ট লং

এটি কি প্র্যাট স্কোর নয়?
ব্রেট

2

আপনি একটি পৃথক নির্ভরশীল ভেরিয়েবলের সমস্ত সংমিশ্রণগুলিতে একক নির্ভরশীল ভেরিয়েবলের সংমিশ্রণের জন্য উপযুক্ত ব্যবস্থা গ্রহণের জন্য সদ্ব্যবহার করতে hier.part লাইব্রেরিটি ব্যবহার করতে পারেন

library(hier.part)
env <- D[,2:5]
all.regs(D$dv, env, fam = "gaussian", gof = "Rsqu",
     print.vars = TRUE)
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.