"পারস্পরিক সম্পর্ক" এর অর্থ কি রিগ্রেশন বিশ্লেষণের meanাল?


14

আমি একটি কাগজ পড়ছি এবং লেখক লিখেছেন:

Y, A, B, C এর প্রভাব একাধিক রিগ্রেশন বিশ্লেষণের মাধ্যমে অধ্যয়ন করা হয়েছিল। A, B, C নির্ভরশীল পরিবর্তনশীল হিসাবে Y এর সাথে রিগ্রেশন সমীকরণে প্রবেশ করেছিল। বৈকল্পিক বিশ্লেষণটি সারণি 3 এ উপস্থাপন করা হয়েছে, বি এর সাথে Y এর প্রভাব তাৎপর্যপূর্ণ ছিল, বি সাথে সম্পর্কযুক্ত 27।

ইংরেজি আমার মাতৃভাষা নয় এবং আমি এখানে সত্যিই বিভ্রান্ত হয়ে পড়েছি।

প্রথমে তিনি বলেছিলেন যে তিনি একটি রিগ্রেশন বিশ্লেষণ চালাবেন, তারপরে তিনি আমাদের বৈকল্পিক বিশ্লেষণটি দেখিয়েছিলেন। কেন?

এবং তারপরে তিনি পারস্পরিক সম্পর্কের সহগ সম্পর্কে লিখেছিলেন, এটি কি পারস্পরিক সম্পর্ক বিশ্লেষণ থেকে নয়? বা এই শব্দটি ব্যবহার করা যেতে পারে রিগ্রেশন opeাল বর্ণনা করতে?

উত্তর:


17

প্রথমে তিনি বলেছিলেন যে তিনি একটি রিগ্রেশন বিশ্লেষণ চালাবেন, তারপরে তিনি আমাদের বৈকল্পিক বিশ্লেষণটি দেখিয়েছিলেন। কেন?

বৈকল্পিক বিশ্লেষণ (এএনওওএ) কেবলমাত্র মডেল দ্বারা বর্ণিত ভিন্নতার তুলনায় মডেল দ্বারা ব্যাখ্যা করা বৈকল্পিকের তুলনা করার কৌশল। যেহেতু রিগ্রেশন মডেলগুলির ব্যাখ্যাযোগ্য এবং অব্যক্ত উভয় উপাদান রয়েছে তাই এএনওওএ তাদের প্রয়োগ করা স্বাভাবিক। অনেকগুলি সফ্টওয়্যার প্যাকেজগুলিতে, আনোভা ফলাফল নিয়মিতভাবে রৈখিক প্রতিরোধের সাথে প্রতিবেদন করা হয়। রিগ্রেশন একটি খুব বহুমুখী কৌশল। আসলে, টি-পরীক্ষা এবং এএনওভা উভয়ই রিগ্রেশন আকারে প্রকাশ করা যেতে পারে; তারা কেবল পীড়নের এক বিশেষ কেস।

উদাহরণস্বরূপ, এখানে একটি নমুনা রিগ্রেশন আউটপুট। ফলাফলটি কয়েকটি গাড়ীর প্রতি গ্যালন মাইল এবং স্বতন্ত্র পরিবর্তনশীলটি হ'ল গাড়িটি দেশীয় বা বিদেশী:

      Source |       SS       df       MS              Number of obs =      74
-------------+------------------------------           F(  1,    72) =   13.18
       Model |  378.153515     1  378.153515           Prob > F      =  0.0005
    Residual |  2065.30594    72  28.6848048           R-squared     =  0.1548
-------------+------------------------------           Adj R-squared =  0.1430
       Total |  2443.45946    73  33.4720474           Root MSE      =  5.3558

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
   1.foreign |   4.945804   1.362162     3.63   0.001     2.230384    7.661225
       _cons |   19.82692   .7427186    26.70   0.000     18.34634    21.30751
------------------------------------------------------------------------------

আপনি উপরে বাম দিকে রিপোর্ট করা আনোভা দেখতে পারেন। সামগ্রিক এফ-পরিসংখ্যান 13.18, যার পি-মান 0.0005, মডেলটিকে ভবিষ্যদ্বাণীপূর্ণ বলে ইঙ্গিত করে। এবং এখানে আনোভা আউটপুট:

                       Number of obs =      74     R-squared     =  0.1548
                       Root MSE      = 5.35582     Adj R-squared =  0.1430

              Source |  Partial SS    df       MS           F     Prob > F
          -----------+----------------------------------------------------
               Model |  378.153515     1  378.153515      13.18     0.0005
                     |
             foreign |  378.153515     1  378.153515      13.18     0.0005
                     |
            Residual |  2065.30594    72  28.6848048   
          -----------+----------------------------------------------------
               Total |  2443.45946    73  33.4720474   

লক্ষ্য করুন যে আপনি সেখানে একই এফ-পরিসংখ্যান এবং পি-মানটি পুনরুদ্ধার করতে পারেন।


এবং তারপরে তিনি পারস্পরিক সম্পর্কের সহগ সম্পর্কে লিখেছিলেন, এটি কি পারস্পরিক সম্পর্ক বিশ্লেষণ থেকে নয়? বা এই শব্দটি ব্যবহার করা যেতে পারে রিগ্রেশন opeাল বর্ণনা করতে?

বিশ্লেষণকে কেবল বি এবং ওয়াই ব্যবহার করে জড়িত বলে ধরে নিলাম, প্রযুক্তিগতভাবে আমি এই শব্দটি পছন্দের সাথে একমত হব না। বেশিরভাগ ক্ষেত্রে, opeালু এবং পারস্পরিক সম্পর্কের সহগ পরিবর্তন হয় না। একটি বিশেষ ক্ষেত্রে, এই দুটি একই, যখন স্বতন্ত্র এবং নির্ভরশীল ভেরিয়েবল উভয়ই মানক করা হয় (জেড-স্কোরের ইউনিটে ওরফে))

উদাহরণস্বরূপ, আসুন প্রতি গ্যালন মাইল এবং গাড়ির দামের সাথে সম্পর্ক স্থাপন করুন:

             |    price      mpg
-------------+------------------
       price |   1.0000
         mpg |  -0.4686   1.0000

এবং এখানে একই পরীক্ষাটি রয়েছে, মানযুক্ত ভেরিয়েবলগুলি ব্যবহার করে আপনি দেখতে পারেন যে পারস্পরিক সম্পর্ক সহগ অপরিবর্তিত রয়েছে:

             |  sdprice    sdmpg
-------------+------------------
     sdprice |   1.0000
       sdmpg |  -0.4686   1.0000

আসল ভেরিয়েবলগুলি ব্যবহার করে এখন দুটি রিগ্রেশন মডেল এখানে রয়েছে:

. reg mpg price

      Source |       SS       df       MS              Number of obs =      74
-------------+------------------------------           F(  1,    72) =   20.26
       Model |  536.541807     1  536.541807           Prob > F      =  0.0000
    Residual |  1906.91765    72  26.4849674           R-squared     =  0.2196
-------------+------------------------------           Adj R-squared =  0.2087
       Total |  2443.45946    73  33.4720474           Root MSE      =  5.1464

------------------------------------------------------------------------------
         mpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       price |  -.0009192   .0002042    -4.50   0.000    -.0013263   -.0005121
       _cons |   26.96417   1.393952    19.34   0.000     24.18538    29.74297
------------------------------------------------------------------------------

... এবং এখানে একটি মানক ভেরিয়েবল রয়েছে:

. reg sdmpg sdprice

      Source |       SS       df       MS              Number of obs =      74
-------------+------------------------------           F(  1,    72) =   20.26
       Model |  16.0295482     1  16.0295482           Prob > F      =  0.0000
    Residual |  56.9704514    72  .791256269           R-squared     =  0.2196
-------------+------------------------------           Adj R-squared =  0.2087
       Total |  72.9999996    73  .999999994           Root MSE      =  .88953

------------------------------------------------------------------------------
       sdmpg |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
     sdprice |  -.4685967   .1041111    -4.50   0.000    -.6761384   -.2610549
       _cons |  -7.22e-09   .1034053    -0.00   1.000    -.2061347    .2061347
------------------------------------------------------------------------------

আপনি দেখতে পাচ্ছেন যে, আসল ভেরিয়েবলগুলির slাল -0.0009192, এবং মানযুক্ত ভেরিয়েবলগুলির সাথে একটি -0.4686 হয়, এটিও পারস্পরিক সম্পর্ক সহগ।

সুতরাং, যদি না এ, বি, সি এবং ওয়াই মানক করা হয়, আমি নিবন্ধটির "সম্পর্কিত" সাথে একমত হব না। পরিবর্তে, আমি কেবল খ এর এক ইউনিট বৃদ্ধি অপরিশোধিত করলাম ওয়াইয়ের গড় গড় 0.27 শতাংশ বেশি হওয়ার সাথে যুক্ত।

আরও জটিল পরিস্থিতিতে যেখানে একাধিক স্বতন্ত্র ভেরিয়েবল জড়িত রয়েছে, উপরে বর্ণিত ঘটনাটি আর সত্য হবে না।


7

প্রথমে তিনি বলেছিলেন যে তিনি একটি রিগ্রেশন বিশ্লেষণ চালাবেন, তারপরে তিনি আমাদের বৈকল্পিক বিশ্লেষণটি দেখিয়েছিলেন। কেন?

বৈকল্পিক সারণির বিশ্লেষণটি হ'ল রিগ্রেশন থেকে প্রাপ্ত তথ্যের অংশের সংক্ষিপ্তসার। (ভেরিয়েন্সের বিশ্লেষণ হিসাবে আপনি যা ভাবতে পারেন তা হ'ল রিগ্রেশনের একটি বিশেষ ঘটনা either উভয় ক্ষেত্রেই আপনি বিভিন্ন অনুমানকে পরীক্ষা করতে ব্যবহার করতে পারেন এমন স্কোয়ারের যোগফলগুলিকে বিভাজন করতে পারেন এবং এটিকে বৈকল্পিক সারণির বিশ্লেষণ বলা হয়))

এবং তারপরে তিনি পারস্পরিক সম্পর্কের সহগ সম্পর্কে লিখেছিলেন, এটি কি পারস্পরিক সম্পর্ক বিশ্লেষণ থেকে নয়? বা এই শব্দটি ব্যবহার করা যেতে পারে রিগ্রেশন opeাল বর্ণনা করতে?

পারস্পরিক সম্পর্ক রিগ্রেশন opeালের মতো একই জিনিস নয়, তবে দুটিই সম্পর্কিত। তবে, যদি না তারা একটি শব্দ (বা সম্ভবত বেশ কয়েকটি শব্দ) রেখে দেয়, তবে Y এর সাথে বি এর যুগল পারস্পরিক সম্পর্ক আপনাকে একাধিক রিগ্রেশনে opeালের তাত্পর্য সম্পর্কে সরাসরি বলে না। একটি সাধারণ প্রতিরোধের মধ্যে, দুটি সরাসরি সম্পর্কিত, এবং এই ধরনের একটি সম্পর্ক ধরে রাখে। একাধিক পীড়নের ক্ষেত্রে আংশিক সম্পর্কগুলি সম্পর্কিত উপায়ে opালু সম্পর্কিত।


4

আমি আর-তে কোড সরবরাহ করছি একটি উদাহরণ, আপনি আর এর সাথে অভিজ্ঞতা না থাকলে আপনি উত্তরগুলি দেখতে পারেন I আমি কেবল উদাহরণ দিয়ে কিছু মামলা করতে চাই।

পারস্পরিক সম্পর্ক বনাম রিগ্রেশন

এক Y এবং একটি এক্স এর সাথে সরল রৈখিক সম্পর্ক এবং রেগ্রেশন:

মডেলটি:

y = a + betaX + error (residual) 

ধরা যাক আমাদের দুটি মাত্র ভেরিয়েবল রয়েছে:

X = c(4,5,8,6,12,15)
Y = c(3,6,9,8,6, 18)
plot(X,Y, pch = 19)

একটি বিক্ষিপ্ত ডায়াগ্রামে, বিন্দুগুলির কাছাকাছি একটি সরলরেখায় থাকে, দুটি ভেরিয়েবলের মধ্যে লিনিয়ার সম্পর্ক আরও দৃ .় হয়।

এখানে চিত্র বর্ণনা লিখুন

লিনিয়ার পারস্পরিক সম্পর্ক দেখুন।

cor(X,Y)
0.7828747

এখন লিনিয়ার রিগ্রেশন এবং টান আউট আর স্কোয়ার মানগুলি।

    reg1 <- lm(Y~X)
   summary(reg1)$r.squared
     0.6128929

এইভাবে মডেলের সহগগুলি হ'ল:

reg1$coefficients
(Intercept)           X 
  2.2535971   0.7877698

এক্স এর বিটাটি 0.7877698। সুতরাং আউট মডেল হবে:

  Y = 2.2535971 + 0.7877698 * X 

রিগ্রেশনে আর-স্কোয়ার মানটির স্কোয়ার রুট rলিনিয়ার রিগ্রেশন-এর মতোই ।

sqrt(summary(reg1)$r.squared)
[1] 0.7828747

আসুন উপরের উদাহরণটি ব্যবহার করে রিগ্রেশন opeাল এবং পারস্পরিক সম্পর্কের উপর স্কেল ইফেক্টটি দেখুন এবং Xএকটি ধ্রুবক বক্তব্য দিয়ে গুণ করি 12

    X = c(4,5,8,6,12,15)
    Y = c(3,6,9,8,6, 18)
    X12 <- X*12

    cor(X12,Y)
   [1] 0.7828747

পারস্পরিক সম্পর্ক হিসেবে আর-স্কোয়ারড অপরিবর্তিত থাকবে

    reg12 <- lm(Y~X12)
    summary(reg12)$r.squared
     [1] 0.6128929
     reg12$coefficients
(Intercept)         X12 
 0.53571429  0.07797619 

আপনি দেখতে পাচ্ছেন যে রিগ্রেশন সহগগুলি পরিবর্তন হয়েছে তবে আর-বর্গ নয়। এখন অন্য একটি পরীক্ষা একটি ধ্রুবক যোগ করতে দেয় Xএবং এটি কী প্রভাব ফেলবে তা দেখতে দেয়।

    X = c(4,5,8,6,12,15)
    Y = c(3,6,9,8,6, 18)
    X5 <- X+5

    cor(X5,Y)
   [1] 0.7828747

যোগ করার পরেও সম্পর্ক সম্পর্কিত নয় 5। আসুন দেখুন কীভাবে এটি রিগ্রেশন সহগের উপর প্রভাব ফেলবে।

        reg5 <- lm(Y~X5)
        summary(reg5)$r.squared
         [1] 0.6128929
         reg5$coefficients
(Intercept)          X5 
 -4.1428571   0.9357143

আর-বর্গ এবং পারস্পরিক সম্পর্ক স্কেল প্রভাব আছে না কিন্তু পথিমধ্যে এবং ঢাল না। সুতরাং opeাল পারস্পরিক সম্পর্কের সহগ হিসাবে একই নয় (যদি না ভেরিয়েবলগুলি গড় 0 এবং প্রকরণ 1 দিয়ে মানক হয়) are

আনোভা কী এবং কেন আমরা আনোভা করি?

আনোভা এমন কৌশল যা আমরা সিদ্ধান্ত নেওয়ার জন্য রূপগুলি তুলনা করি। প্রতিক্রিয়া পরিবর্তনশীল (যাকে বলা হয় Y) পরিমাণগত পরিবর্তনশীল যখন Xকরতে পরিমাণগত বা গুণগত (বিভিন্ন মাত্রায় ফ্যাক্টর)। উভয় Xএবং Yসংখ্যায় এক বা একাধিক হতে পারে। সাধারণত আমরা গুণগত পরিবর্তনশীলগুলির জন্য আনোভা বলি, রিগ্রেশন প্রসঙ্গে আনোভা কম আলোচনা হয়। এটি হতে পারে আপনার বিভ্রান্তির কারণ হতে পারে। গুণগত পরিবর্তনশীল (ফ্যাক্টর উদাহরণস্বরূপ গ্রুপ) এর নাল অনুমানটি হ'ল গ্রুপগুলির গড়টি আলাদা / সমান নয় যখন রিগ্রেশন বিশ্লেষণে আমরা পরীক্ষা করি যে রেখার opeাল 0 থেকে উল্লেখযোগ্যভাবে পৃথক কিনা কিনা test

আসুন একটি উদাহরণ দেখুন যেখানে আমরা উভয়ই রিগ্রেশন বিশ্লেষণ এবং গুণগত গুণক আনোভা করতে পারি যেহেতু এক্স এবং ওয়াই উভয়ই পরিমাণগত, তবে আমরা এক্সকে ফ্যাক্টর হিসাবে বিবেচনা করতে পারি।

    X1 <- rep(1:5, each = 5)
    Y1 <- c(12,14,18,12,14,  21,22,23,24,18,  25,23,20,25,26, 29,29,28,30,25, 29,30,32,28,27)
   myd <- data.frame (X1,Y1)

ডেটা নীচের মত দেখাচ্ছে।

   X1 Y1
1   1 12
2   1 14
3   1 18
4   1 12
5   1 14
6   2 21
7   2 22
8   2 23
9   2 24
10  2 18
11  3 25
12  3 23
13  3 20
14  3 25
15  3 26
16  4 29
17  4 29
18  4 28
19  4 30
20  4 25
21  5 29
22  5 30
23  5 32
24  5 28
25  5 27

এখন আমরা রিগ্রেশন এবং আনোভা উভয়ই করি। প্রথম প্রতিরোধ:

 reg <- lm(Y1~X1, data=myd)
 anova(reg)

Analysis of Variance Table

Response: Y1
          Df Sum Sq Mean Sq F value    Pr(>F)    
X1         1 684.50  684.50   101.4 6.703e-10 ***
Residuals 23 155.26    6.75                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

reg$coefficients             
(Intercept)          X1 
      12.26        3.70 

এক্স 1 কে ফ্যাক্টরে রূপান্তর করে এখন প্রচলিত আনোভা (মানে অ্যানোভা ফ্যাক্টর / গুণগত পরিবর্তনশীল)।

myd$X1f <- as.factor (myd$X1)
     regf <- lm(Y1~X1f, data=myd)
     anova(regf)
Analysis of Variance Table

Response: Y1
          Df Sum Sq Mean Sq F value    Pr(>F)    
X1f        4 742.16  185.54   38.02 4.424e-09 ***
Residuals 20  97.60    4.88                      
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

আপনি পরিবর্তিত X1f Df দেখতে পারবেন যা উপরের ক্ষেত্রে 1 এর পরিবর্তে 4।

গুণগত পরিবর্তনশীলগুলির জন্য এএনওওএর বিপরীতে, পরিমাণগত পরিবর্তনশীলগুলির প্রসঙ্গে যেখানে আমরা রিগ্রেশন বিশ্লেষণ করি - বৈকল্পিক বিশ্লেষণ (এএনওওএ) এমন গণনাগুলি নিয়ে গঠিত যা একটি রিগ্রেশন মডেলের মধ্যে পরিবর্তনশীলতার মাত্রা সম্পর্কে তথ্য সরবরাহ করে এবং তাত্পর্যটির পরীক্ষার জন্য একটি ভিত্তি তৈরি করে।

মূলত আনোভা নাল হাইপোথিসিস বিটা = 0 পরীক্ষা করে (বিকল্প হাইপোথিসিস বিটা 0 এর সমান নয়)। মডেল বনাম ত্রুটি (অবশিষ্ট বৈকল্পিক) দ্বারা বর্ণিত পরিবর্তনশীলতার অনুপাতটি এখানে আমরা এফ টেস্টটি করি। মডেল ভেরিয়েন্সটি আপনার মাপসই রেখার দ্বারা বর্ণিত পরিমাণ থেকে আসে যখন অবশিষ্টগুলি মডেল দ্বারা ব্যাখ্যা না করা মান থেকে আসে by একটি উল্লেখযোগ্য এফ মানে বিটা মান শূন্যের সমান নয়, এর অর্থ দুটি ভেরিয়েবলের মধ্যে উল্লেখযোগ্য সম্পর্ক রয়েছে।

 > anova(reg1)
    Analysis of Variance Table

    Response: Y
              Df Sum Sq Mean Sq F value Pr(>F)  
    X          1 81.719  81.719  6.3331 0.0656 .
    Residuals  4 51.614  12.904                 
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

এখানে আমরা উচ্চ পারস্পরিক সম্পর্ক বা আর-বর্গক্ষেত্র দেখতে পাচ্ছি তবে তাত্পর্যপূর্ণ ফলাফল নেই। কিছু সময় আপনি এমন ফলাফল পেতে পারেন যেখানে কম পারস্পরিক সম্পর্ক এখনও উল্লেখযোগ্য পারস্পরিক সম্পর্ক। এই ক্ষেত্রে তাত্পর্যপূর্ণ সম্পর্ক না থাকার কারণটি হ'ল আমাদের পর্যাপ্ত ডেটা নেই (এন = 6, অবশিষ্ট ডিএফ = 4), সুতরাং এফের সাথে F ডিঙ্কারেটর 1 ডিএফ বনাম 4 ডোনোমিটার ডিএফ দিয়ে এফ বিতরণে দেখা উচিত। সুতরাং এই ক্ষেত্রে আমরা ruleালু 0 এর সমান হতে পারি না।

আসুন আরেকটি উদাহরণ দেখুন:

 X = c(4,5,8,6,2,  5,6,4,2,3,   8,2,5,6,3,  8,9,3,5,10)
    Y = c(3,6,9,8,6,  8,6,8,10,5,  3,3,2,4,3,  11,12,4,2,14)
    reg3 <- lm(Y~X)
    anova(reg3)


     Analysis of Variance Table

    Response: Y
              Df  Sum Sq Mean Sq F value  Pr(>F)  
    X          1  69.009  69.009   7.414 0.01396 *
    Residuals 18 167.541   9.308                  
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

এই নতুন ডেটার জন্য আর-বর্গ মান:

 summary(reg3)$r.squared
 [1] 0.2917296
cor(X,Y)
[1] 0.54012

যদিও পারস্পরিক সম্পর্ক পূর্ববর্তী কেসের চেয়ে কম, আমরা একটি উল্লেখযোগ্য opeাল পেয়েছি। আরও ডেটা ডিএফ বৃদ্ধি করে এবং পর্যাপ্ত তথ্য সরবরাহ করে যাতে আমরা নাল অনুমানটি বাতিল করতে পারি যে opeাল শূন্যের সমান নয়।

অপেক্ষাকৃত পরস্পর সম্পর্ক আছে যেখানে অন্য একটি উদাহরণ নিতে দাও:

 X1 = c(4,5,8,6,12,15)
    Y1 = c(18,16,2,4,2, 8)
   # correlation 
    cor(X1,Y1)
 -0.5266847
   # r-square using regression
    reg2 <- lm(Y1~X1)
   summary(reg2)$r.squared
 0.2773967
  sqrt(summary(reg2)$r.squared)
[1] 0.5266847

মানগুলি বর্গক্ষেত্র হিসাবে স্কোয়ার রুট হিসাবে এখানে ইতিবাচক বা নেতিবাচক সম্পর্কের তথ্য সরবরাহ করবে না। মাত্রা কিন্তু একই।

একাধিক রিগ্রেশন কেস:

একাধিক লিনিয়ার রিগ্রেশন পর্যবেক্ষণ করা ডেটাতে রৈখিক সমীকরণ ফিট করে দুটি বা আরও বেশি ব্যাখ্যামূলক ভেরিয়েবল এবং একটি প্রতিক্রিয়া ভেরিয়েবলের মধ্যে সম্পর্ককে মডেল করার চেষ্টা করে। উপরের আলোচনাটি একাধিক রিগ্রেশন কেস পর্যন্ত বাড়ানো যেতে পারে। এই ক্ষেত্রে আমাদের এই শব্দটিতে একাধিক বিটা রয়েছে:

y = a + beta1X1 + beta2X2 + beta2X3 + ................+ betapXp + error 

Example: 
    X1 = c(4,5,8,6,2,  5,6,4,2,3,   8,2,5,6,3,  8,9,3,5,10)
    X2 = c(14,15,8,16,2,  15,3,2,4,7,   9,12,5,6,3,  12,19,13,15,20)
    Y = c(3,6,9,8,6,  8,6,8,10,5,  3,3,2,4,3,  11,12,4,2,14)
    reg4 <- lm(Y~X1+X2)

আসুন মডেলটির সহগগুলি দেখুন:

reg4$coefficients

(Intercept)          X1          X2 
 2.04055116  0.72169350  0.05566427

সুতরাং আপনার একাধিক লিনিয়ার রিগ্রেশন মডেলটি হ'ল:

Y = 2.04055116 + 0.72169350 * X1 + 0.05566427* X2 

এখন এক্স 1 এবং এক্স 2 এর বিটা 0 এর চেয়ে বড় কিনা তা পরীক্ষা করতে দিন।

 anova(reg4)
    Analysis of Variance Table

    Response: Y
              Df  Sum Sq Mean Sq F value  Pr(>F)  
    X1         1  69.009  69.009  7.0655 0.01656 *
    X2         1   1.504   1.504  0.1540 0.69965  
    Residuals 17 166.038   9.767                  
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

এখানে আমরা বলি যে এক্স 1 এর opeাল 0 এর চেয়ে বড়, তবে আমরা এক্স 2 এর slাল 0 এর চেয়ে বড় হওয়ার কথা বলতে পারি নি।

দয়া করে মনে রাখবেন যে opeাল X1 এবং Y বা X2 এবং Y এর মধ্যে পারস্পরিক সম্পর্ক নয় note

> cor(Y, X1)
[1] 0.54012
> cor(Y,X2)
[1] 0.3361571

একাধিক ভেরিয়েট পরিস্থিতিতে (যেখানে ভেরিয়েবল দুটির চেয়ে বেশি হয় আংশিক পারস্পরিক সম্পর্কটি খেলায় আসে tial

source("http://www.yilab.gatech.edu/pcor.R")
pcor.test(X1, Y,X2)
   estimate    p.value statistic  n gn  Method            Use
1 0.4567979 0.03424027  2.117231 20  1 Pearson Var-Cov matrix
pcor.test(X2, Y,X1)
    estimate   p.value statistic  n gn  Method            Use
1 0.09473812 0.6947774 0.3923801 20  1 Pearson Var-Cov matrix

1

বৈকল্পিক বিশ্লেষণ (এএনওওএ) এবং রিগ্রেশন আসলে খুব একই রকম (কেউ কেউ বলবে যে তারা একই জিনিস)।

বৈকল্পিক বিশ্লেষণে সাধারণত আপনার কয়েকটি বিভাগ (গোষ্ঠী) এবং পরিমাণগত প্রতিক্রিয়া পরিবর্তনশীল থাকে। আপনি সামগ্রিক ত্রুটির পরিমাণ, একটি দলের মধ্যে ত্রুটির পরিমাণ এবং গোষ্ঠীর মধ্যে ত্রুটির পরিমাণ গণনা করুন।

রিগ্রেশনে আপনার অগত্যা গ্রুপ নেই, তবে তবুও আপনি সামগ্রিক ত্রুটিতে ত্রুটির পরিমাণ বিভাজন করতে পারেন, আপনার রিগ্রেশন মডেল দ্বারা ব্যাখ্যা করা ত্রুটির পরিমাণ এবং আপনার রিগ্রেশন মডেল দ্বারা অবহিত ত্রুটি। রিগ্রেশন মডেলগুলি প্রায়শই আনোভা টেবিলগুলি ব্যবহার করে প্রদর্শিত হয় এবং এটি আপনার মডেল দ্বারা কতটা প্রকরণ ব্যাখ্যা করা হয়েছে তা দেখার একটি সহজ উপায়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.