পারস্পরিক সম্পর্কের অন্তর্নিহিত অনুমানগুলির মধ্যে পার্থক্য এবং তাৎপর্যের একটি রিগ্রেশন opeাল পরীক্ষার মধ্যে tests


21

আমার প্রশ্নটি @ হুবারের সাথে একটি পৃথক প্রশ্নের মন্তব্যে আলোচনার মধ্য দিয়ে বেড়েছে ।

বিশেষত, @ ভোবারের মন্তব্যটি নীচে ছিল:

এটি আপনাকে বিস্মিত করার একটি কারণ হ'ল পারস্পরিক সম্পর্ক পরীক্ষা এবং রিগ্রেশন স্লোপ টেস্টের অন্তর্নিহিত অনুমানগুলি আলাদা - তাই আমরা যখন বুঝতে পারি যে পরস্পর সম্পর্ক এবং opeাল সত্যই একই জিনিসটি পরিমাপ করছে, তখন কেন তাদের পি-মানগুলি একই হওয়া উচিত? এটি দেখায় যে এই সমস্যাগুলি কীভাবে r এবং সংখ্যার সমান হওয়া উচিত তার চেয়ে আরও গভীরতর হয়।β

এটি সম্পর্কে আমার চিন্তাভাবনা পেয়েছে এবং আমি বিভিন্ন আকর্ষণীয় উত্তর পেয়েছি। উদাহরণস্বরূপ, আমি এই প্রশ্নটি পেয়েছি " পারস্পরিক সম্পর্কের গুণাবলীর অনুমান " তবে এটি উপরের মন্তব্যটি কীভাবে পরিষ্কার করবে তা দেখতে পাচ্ছি না।

আমি পিয়ারসন এর সম্পর্ক আরো আকর্ষণীয় উত্তর পাওয়া যায় নি এবং ঢাল একটি সহজ রৈখিক রিগ্রেশনে (দেখুন এখানে এবং এখানে উদাহরণস্বরূপ) কিন্তু তাদের কেউ কি @whuber তার মন্তব্যে উল্লেখ হয়েছিল (অন্তত আপাত না উত্তর বলে মনে হচ্ছে আমাকে).rβ

প্রশ্ন 1: একটি সম্পর্ক সম্পর্কিত পরীক্ষা এবং একটি রিগ্রেশন opeাল পরীক্ষা অন্তর্নিহিত অনুমানগুলি কি কি?

আমার দ্বিতীয় প্রশ্নের জন্য নিম্নলিখিত ফলাফলগুলি বিবেচনা করুন R:

model <- lm(Employed ~ Population, data = longley)
summary(model)

Call:
lm(formula = Employed ~ Population, data = longley)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.4362 -0.9740  0.2021  0.5531  1.9048 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   8.3807     4.4224   1.895   0.0789 .  
Population    0.4849     0.0376  12.896 3.69e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.013 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

এবং cor.test()ফাংশনের আউটপুট :

with(longley, cor.test(Population, Employed))

    Pearson's product-moment correlation

data:  Population and Employed
t = 12.8956, df = 14, p-value = 3.693e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8869236 0.9864676
sample estimates:
      cor 
0.9603906 

যেমন lm()এবং cov.test()আউটপুট দ্বারা দেখা যায় , পিয়ারসনের পারস্পরিক সম্পর্ক সহগ এবং অনুমান ( ) যথাক্রমে 0.96 বনাম , তবে টি-মান এবং পি-মানগুলি একই।rβ1

তারপরে আমি এটিও চেষ্টা করেছিলাম যে আমি এবং এর টি-মান গণনা করতে সক্ষম , যা এবং ভিন্ন হওয়া সত্ত্বেও একইএবং এটিই আমি আটকে যাই, কমপক্ষে জন্যrβ1rβ1r :

X এবং y এর মোট বর্গের মোট যোগফল ব্যবহার করে াল ( reg 1 ) কে এক সরল রৈখিক প্রতিরোধে গণনা করুন :β1xy

x <- longley$Population; y <- longley$Employed
xbar <- mean(x); ybar <- mean(y)
ss.x <- sum((x-xbar)^2)
ss.y <- sum((y-ybar)^2)
ss.xy <- sum((x-xbar)*(y-ybar))

রিগ্রেশন opeালের সর্বনিম্ন-বর্গের অনুমান গণনা করুন, ( ক্রোলির আর বুক 1 ম সংস্করণে 393 পৃষ্ঠাতে এর প্রমাণ রয়েছে ):β1

b1 <- ss.xy/ss.x                        
b1
# [1] 0.4848781

জন্য স্ট্যান্ডার্ড ত্রুটি গণনা করুন :β1

ss.residual <- sum((y-model$fitted)^2)
n <- length(x) # SAMPLE SIZE
k <- length(model$coef) # NUMBER OF MODEL PARAMETER (i.e. b0 and b1)
df.residual <- n-k
ms.residual <- ss.residual/df.residual # RESIDUAL MEAN SQUARE
se.b1 <- sqrt(ms.residual/ss.x)
se.b1
# [1] 0.03760029

আর এর জন্য টি-মান এবং P-মান :β1

t.b1 <- b1/se.b1
p.b1 <- 2*pt(-abs(t.b1), df=n-2)
t.b1
# [1] 12.89559
p.b1
# [1] 3.693245e-09

আমি এই মুহুর্তে যা জানি না, এবং এটি হল প্রশ্ন 2 , কীভাবে β 1 এর পরিবর্তে ব্যবহার করে একই টি-মান গণনা করতে হবে (সম্ভবত শিশুর পদক্ষেপে)?rβ1

আমি অনুমান যে যেহেতু cor.test()এর বিকল্প হাইপোথিসিস কিনা তা ব্যবহারকারীকে সত্য পারস্পরিক সম্পর্ক 0 সমান নয় (দেখুন cor.test()উপরে আউটপুট), আমি পিয়ারসন পারস্পরিক সম্পর্কের সহগের ভালো কিছু আশা "পিয়ারসন পারস্পরিক সম্পর্কের সহগের মান ত্রুটি" দ্বারা বিভক্ত (অনুরূপ উপরে) ?! তবে সেই স্ট্যান্ডার্ড ত্রুটিটি কী হবে এবং কেন?rb1/se.b1

পারস্পরিক সম্পর্ক পরীক্ষা এবং রিগ্রেশন স্লোপ টেস্টের অন্তর্নিহিত পূর্বোক্ত অনুমানগুলির সাথে এর কিছু যুক্ত হতে পারে ?!

সম্পাদনা (২--জুলাই -২০১)): যদিও @ হুবুবার প্রশ্ন 1 (এবং আংশিক প্রশ্ন 2 ) এর জন্য খুব বিশদ ব্যাখ্যা দিয়েছেন , আমি আরও কিছু খনন করেছি এবং দেখতে পেয়েছি যে এই দুটি পোস্ট ( এখানে এবং এখানে ) করছে একটি নির্দিষ্ট দেন মান ত্রুটি জন্য , যা উত্তর দিতে ভাল কাজ করে প্রশ্ন 2 , টি-মান দেওয়া হয়েছে পুনর্গঠন করা হয় যে :rr

r <- 0.9603906
# n <- 16
r.se <- sqrt((1-r^2)/(n-2))
r/r.se
# [1] 12.8956

2
এটি একই পরীক্ষা বা কমপক্ষে একটি সমমানের পরীক্ষা। যদি আপনি এই অনুমানকে অস্বীকার করেন যে পরস্পর সম্পর্কটি শূন্য নয় তবে পরীক্ষাটি ালও শূন্য নয় এমন অনুমানও প্রত্যাখ্যান করে।
মাইকেল আর চেরনিক

6
@ মিশেল রাইট - তবে এখানে অনেকগুলি সম্ভাব্য মডেল রয়েছে এবং তারা একেবারেই আলাদা। তার মধ্যে একটি পারস্পরিক সম্পর্কের জন্য একটি আদর্শ মডেল, যার মধ্যে সহজতমটি হ'ল ডেটাটি কিছু অজানা দ্বিবিভক্ত সাধারণ বিতরণের একটি নমুনা। অন্যটি হ'ল এক্স - ইন দুটি স্বাদ, স্থির রেজিস্ট্রার এবং এলোমেলো রেজিস্ট্রারের বিপরীতে প্রতিরোধের জন্য ওএলএস মডেলের কিছু সংস্করণ । আরেকটি এক্স এবং ওয়াইয়ের ভূমিকাগুলি বিপরীত করে । আপনার যদি কোনও অনুভূতি হয় তবে তুলনামূলক হাইপোথিসিস পরীক্ষার জন্য এগুলির একই পি-মানগুলি তৈরি করা উচিত, এটি সম্ভবত কেবলমাত্র বিস্তৃত পরিচিতির মাধ্যমেই, তবে এটি স্বজ্ঞাতভাবে সুস্পষ্ট নয়! YXXY
শুক্র

1
@ শুভকর্তা যে এই কিউটি এত ভালভাবে প্রচারিত হয়েছে তবে সন্তোষজনক উত্তরের অভাব রয়েছে তা দেখে, আমি একটি উদারতা শুরু করেছি যা আজ আগে শেষ হয়েছে; এটি এখন গ্রেস পিরিয়ডে। একটি নতুন উত্তর পোস্ট করা হয়েছিল এবং এটি পারস্পরিক সম্পর্ক হিসাবে-slাল গণনা ব্যাখ্যা করে, তবে দাবি করেছে যে অনুমানের মধ্যে কোনও পার্থক্য নেই, আপনার উদ্ধৃত বক্তব্যের বিপরীতে। আমার অনুগ্রহ নতুন উত্তরটিতে উপস্থিত না হলে স্বয়ংক্রিয়ভাবে এই নতুন উত্তরে পুরস্কৃত হবে। আপনি নিজের উত্তর পোস্ট করার বিষয়টি বিবেচনা করবেন এমন ক্ষেত্রে আপনাকে জানাতে দিচ্ছি।
অ্যামিবা বলছেন মনিকাকে

1
@ অ্যামিবা আপনাকে ধন্যবাদ; আমি অনুগ্রহ লক্ষ্য করিনি। আমি এই প্রশ্নটি ছড়িয়ে দেওয়ার মত মন্তব্যটি লেখার সময় আমার মনে কী ছিল তার একটি আংশিক অ্যাকাউন্ট পোস্ট করেছি। আমি আশা করি এটি আপনার প্রস্তাবিত দিকটিতে কিছু অগ্রগতির প্রতিনিধিত্ব করে।
whuber

উত্তর:


5

ভূমিকা

এই উত্তর প্রশ্নের এই সেটগুলির অন্তর্নিহিত প্রেরণাকে সম্বোধন করে:

একটি সম্পর্ক সম্পর্কিত পরীক্ষা এবং একটি রিগ্রেশন opeাল পরীক্ষা অন্তর্নিহিত অনুমানগুলি কি কি?

প্রশ্নটিতে প্রদত্ত পটভূমির আলোকে, আমি এই প্রশ্নটি কিছুটা প্রসারিত করার পরামর্শ দিতে চাই: আসুন আমরা পারস্পরিক সম্পর্ক এবং প্রতিরোধের বিভিন্ন উদ্দেশ্য এবং ধারণাগুলি অন্বেষণ করি ।

সাধারণত সম্পর্কের ক্ষেত্রে পরিস্থিতি বিবেচনা করা হয়

  • ডেটা বিভাজনযুক্ত: প্রতিটি "বিষয়" বা "পর্যবেক্ষণ" এর সাথে যথাযথ দুটি স্বতন্ত্র মান যুক্ত।

  • তথ্যগুলি পর্যবেক্ষণমূলক: মানগুলির কোনওটি পরীক্ষক দ্বারা সেট করা হয়নি। উভয়ই পর্যবেক্ষণ বা পরিমাপ করা হয়েছিল।

  • আগ্রহগুলি ভেরিয়েবলগুলির মধ্যে এক ধরণের সম্পর্ক চিহ্নিতকরণ, পরিমাণ নির্ধারণ এবং পরীক্ষার মধ্যে অন্তর্ভুক্ত।

রিগ্রেশন যেখানে ব্যবহৃত হয়

  • ডেটা বিভাজনযুক্ত বা মাল্টিভারিয়েট: আগ্রহের দুটি পৃথক পৃথক মান থাকতে পারে।

  • "নির্ভরশীল" ভেরিয়েবল বা "প্রতিক্রিয়া" - - অন্যান্য সাবসেট - "স্বতন্ত্র" ভেরিয়েবল বা "রেজিস্ট্রার" সম্পর্কে কী জানা যেতে পারে তার উপর ভিত্তি করে - "নির্ভরশীল" ভেরিয়েবল বা "প্রতিক্রিয়াগুলি" - সম্পর্কে ভ্যারিয়েবলগুলির একটি উপসেট সম্পর্কে কী বলা যায় তা বোঝার দিকে আগ্রহ থাকে understanding

  • নিবন্ধকের নির্দিষ্ট মানগুলি পরীক্ষক দ্বারা সেট করা থাকতে পারে।

এই পৃথক লক্ষ্য এবং পরিস্থিতি স্বতন্ত্র পদ্ধতির দিকে পরিচালিত করে। যেহেতু এই থ্রেডটি তাদের সাদৃশ্যগুলি নিয়ে উদ্বিগ্ন, আসুন তারা যেখানে সর্বাধিক সাদৃশ্য রয়েছে সেই ক্ষেত্রে মনোযোগ দিন: দ্বিবিভক্ত তথ্য। উভয় ক্ষেত্রেই সেই ডেটাগুলি সাধারণত একটি এলোমেলো পরিবর্তনশীল আদায় হিসাবে মডেল করা হবে । খুব সাধারণভাবে, উভয় প্রকারের বিশ্লেষণই এই পরিবর্তনশীলটির তুলনামূলক সহজ বৈশিষ্ট্যগুলির সন্ধান করে।(X,Y)

অনুবন্ধ

আমি বিশ্বাস করি "পারস্পরিক সম্পর্ক বিশ্লেষণ" সাধারণত সংজ্ঞায়িত হয় নি। এটি কি কম্পিউটিং রিলেশন সহগের মধ্যে সীমাবদ্ধ হওয়া উচিত, বা এটি আরও ব্যাপকভাবে পিসিএ, ক্লাস্টার বিশ্লেষণ, এবং দুটি ভেরিয়েবল সম্পর্কিত যা বিশ্লেষণের অন্যান্য ফর্ম সমন্বিত হিসাবে বিবেচনা করা যেতে পারে? আপনার দৃষ্টিভঙ্গি সংক্ষিপ্তভাবে সাবস্ক্রাইব বা বিস্তৃত হোক না কেন, সম্ভবত আপনি সম্মত হবেন যে নীচের বিবরণটি প্রযোজ্য:

সহসম্পর্কন হ'ল একটি বিশ্লেষণ যা বিতরণ সম্পর্কে কোনও ধারণা পরিবর্তন করে না, এবং বিতরণ সম্পর্কে আরও সুনির্দিষ্ট সিদ্ধান্তে আসতে ডেটা ব্যবহার করে analysis(X,Y)

উদাহরণস্বরূপ, আপনি ধরে নিতে শুরু করতে পারেন এর দ্বিখণ্ডিত সাধারণ বিতরণ রয়েছে এবং সেই বিতরণের কোনও পরামিতি অনুমান করার জন্য ডেটার পিয়ারসন পারস্পরিক সম্পর্ক সহগ ব্যবহার করুন। এটি পারস্পরিক সম্পর্কের অন্যতম সংকীর্ণ (এবং প্রাচীনতম) ধারণা।(X,Y)

অন্য উদাহরণ হিসাবে, আপনি ধরে নিচ্ছেন কোনও বিতরণ থাকতে পারে এবং কে "কেন্দ্র" সনাক্ত করতে একটি ক্লাস্টার বিশ্লেষণ ব্যবহার করতে পারেন । যে কোনও এক ক্লাস্টারের জন্য একটি ইউনিম বিহীন বিভাজন বিস্তারের মিশ্রণে ( এক্স , ওয়াই ) বিতরণের রেজোলিউশনের সূচনা হিসাবে কেউ মনে করতে পারেন।(X,Y)k(X,Y)

এই সমস্ত পদ্ধতির মধ্যে একটি সাধারণ বিষয় হ'ল এবং ওয়াইয়ের প্রতিসাম্যিক চিকিত্সা : অন্যটির তুলনায় কোনওটিই সুবিধাযুক্ত নয়। উভয়ই সমান ভূমিকা পালন করে।XY

প্রত্যাগতি

রিগ্রেশন একটি স্পষ্ট, সর্বজনীন বোঝা সংজ্ঞা উপভোগ করে:

রিগ্রেশনটি (প্রতিক্রিয়া) প্রদত্ত এক্স (রেজিস্ট্রার) এর শর্তসাপেক্ষ বন্টনকে চিহ্নিত করে ।YX

Orতিহাসিকভাবে, রিগ্রেশন গলটনের আবিষ্কারে (সি। 1885) তার শিকড়গুলি সনাক্ত করে যা সাধারণ তথ্য একটি লিনিয়ার রিগ্রেশন উপভোগ করে: ওয়াইয়ের শর্তসাপেক্ষ প্রত্যাশা এক্স এর লিনিয়ার ফাংশন । বিশেষ-সাধারণ বর্ণালীটির একটি মেরুতে সাধারণ লেস্ট স্কোয়্যারস (ওএলএস) রিগ্রেশন হয় যেখানে ওয়াইয়ের শর্তসাপেক্ষ বন্টনটি নির্দিষ্ট পরামিতিগুলির জন্য সাধারণ ( β 0 + β 1 এক্স , σ 2 ) হিসাবে ধরা হয় β 0 , β 1 , এবং σ(X,Y)YXY(β0+β1X,σ2)β0,β1,σ তথ্য থেকে অনুমান করা।

এই বর্ণালীটির চূড়ান্ত সাধারণ প্রান্তে রৈখিক মডেলগুলি, জেনারেলাইজড অ্যাডিটিভ মডেলগুলি এবং তাদের বিভিন্ন বিষয়গুলি রয়েছে যা ওএলএসের সমস্ত দিককে শিথিল করে: প্রত্যাশা, প্রকরণ, এমনকি শর্তসাপেক্ষ বন্টনের আকারটিও অনৈখিকভাবে পরিবর্তিত হতে পারে সঙ্গে এক্স । এই সমস্ত সাধারণীকরণে যে ধারণাটি টিকে আছে সেই ধারণাটি হ'ল Y কীভাবে এক্স এর উপর নির্ভর করে তা বোঝার জন্য আগ্রহ নিবদ্ধ থাকে । সেই মৌলিক অসম্পূর্ণতা এখনও আছে।YXYX

সম্পর্ক এবং নিপীড়ন

একটি খুব বিশেষ পরিস্থিতি উভয় পদ্ধতির ক্ষেত্রেই সাধারণ এবং প্রায়শই মুখোমুখি হয়: দ্বিবিভক্ত সাধারণ মডেল। এই মডেলটিতে, ডেটার একটি ছড়িয়ে ছিটিয়ে থাকা একটি ধ্রুপদী "ফুটবল," ডিম্বাকৃতি বা সিগার আকৃতি গ্রহণ করবে: ডেটাগুলি একটি অরথোগোনাল জোড় অক্ষের চারপাশে দীর্ঘবৃত্তে ছড়িয়ে পড়ে।

  • একটি পারস্পরিক সম্পর্ক বিশ্লেষণ এই সম্পর্কের "শক্তি" উপর দৃষ্টি নিবদ্ধ করে, এই দিক থেকে যে মূল অক্ষের চারপাশে অপেক্ষাকৃত ছোট একটি বিস্তার "শক্তিশালী"।

  • উপরোক্ত আলোচনা মন্তব্য, রিগ্রেশনে উপর এক্স (এবং সমান, রিগ্রেশনে এক্স উপর ওয়াই ) হল রৈখিক : সাড়া শর্তসাপেক্ষ প্রত্যাশা regressor একটি রৈখিক ফাংশন।YXXY

(এই দুটি বর্ণনার মধ্যে সুস্পষ্ট জ্যামিতিক পার্থক্য বিবেচনা করা সার্থক: তারা অন্তর্নিহিত পরিসংখ্যানগত পার্থক্য আলোকিত করে।)

পঞ্চম পরামিতি: (দুই মানে, দুই স্প্রেড, এবং আরো একটি ব্যবস্থা দুটি ভেরিয়েবল মধ্যে নির্ভরতা), একটি সাধারণ সুদ হয় পাঁচটি bivariate সাধারন প্যারামিটার । এটি সরাসরি (এবং সহজভাবে) সম্পর্কিতρ

  1. সহগ রিগ্রেশনে ওয়াই উপর এক্সXYX

  2. সহগ রিগ্রেশনে এক্স উপর ওয়াইYXY

  3. এবং ( 2 ) উভয়ের মধ্যে শর্তসাপেক্ষ বৈকল্পিক ।(1)(2)

  4. উপবৃত্তাকার অক্ষের চারপাশে বিস্তার (রূপ হিসাবে পরিমাপ করা)।(X,Y)

একটি পারস্পরিক সম্পর্ক বিশ্লেষণ এক্স এবং ওয়াইয়ের ভূমিকা আলাদা না করে উপর দৃষ্টি নিবদ্ধ করে ।(4)XY

একটি রিগ্রেশন বিশ্লেষণ মাধ্যমে ( 3 ) সংস্করণগুলিতে নিবন্ধক এবং প্রতিক্রিয়াশীল ভেরিয়েবলগুলির পছন্দ অনুযায়ী উপযুক্ত।(1)(3)

উভয় ক্ষেত্রেই হাইপোথিসিস একটি বিশেষ ভূমিকা উপভোগ করেছে: এটি কোনও পারস্পরিক সম্পর্ক এবং X এর সাথে Y এর কোনও প্রকারের ইঙ্গিত দেয় না । কারণ (এই সরলতম অবস্থায়) উভয় সম্ভাব্যতা মডেল এবং নাল হাইপোথিসিস পারস্পরিক সম্পর্ক এবং রিগ্রেশন সাধারণ ব্যাপার ছিল, এটা কোন বিস্ময়ের ব্যাপার নয় যে উভয় পদ্ধতি একই পরিসংখ্যান ব্যাপারে আগ্রহ ভাগ করুন (কিনা বলা হয় " R " অথবা " β "); এই পরিসংখ্যানগুলির নাল নমুনা বিতরণ একই; এবং (সুতরাং) অনুমানের পরীক্ষাগুলি অভিন্ন পি-মানগুলি তৈরি করতে পারে।H0:ρ=0YXrβ^

এই সাধারণ অ্যাপ্লিকেশনটি, যেটি যে কেউ প্রথমে শিখেছে, তাদের ধারণাগুলি এবং লক্ষ্যগুলিতে ঠিক কীভাবে আলাদা পারস্পরিক সম্পর্ক এবং প্রতিরোধের তা সনাক্ত করা কঠিন করে তুলতে পারে। যখন আমরা তাদের সাধারণীকরণ সম্পর্কে জানতে পারি তখনই অন্তর্নিহিত পার্থক্যগুলি প্রকাশিত হয়। "রিগ্রেশন" এর ফর্ম হিসাবে একটি ক্লাস্টারের বিশ্লেষণ ফ্রেম করা যেমন শক্ত, ঠিক তেমনি "পারস্পরিক সম্পর্ক" সম্পর্কে অনেক তথ্য দেওয়ার মতো একটি গ্যাম গঠন করাও কঠিন হবে। দুটি হ'ল বিভিন্ন উদ্দেশ্যে বিভিন্ন পদ্ধতির পরিবার, যখন যথাযথভাবে প্রয়োগ করা হয় তখন প্রতিটি তার নিজস্বভাবে কার্যকর।


আমি আশা করি যে এই বরং সাধারণ এবং কিছুটা অস্পষ্ট পর্যালোচনা উপায়ে কিছু উদ্ভাসিত হয়েছে "এই বিষয়গুলো কেবল কিনা চেয়ে গভীরে যেতে এবং β সংখ্যাসূচকভাবে সমান হওয়া উচিত।" এই পার্থক্যের একটি উপলব্ধি আমাকে বুঝতে সাহায্য করেছে যে বিভিন্ন কৌশলগুলি কী কী সম্পাদন করার চেষ্টা করছে, পাশাপাশি পরিসংখ্যানগত সমস্যাগুলি সমাধানে সেগুলির আরও ভাল ব্যবহার করতে।rβ^


এই অন্তর্দৃষ্টিপূর্ণ উত্তরের জন্য শুকরিয়া ধন্যবাদ! @ ম্যাট-বারস্টেড এর উত্তরে মন্তব্যে যেমন উল্লেখ করা হয়েছে , আমার দ্বিতীয় প্রশ্ন সম্পর্কে আমি মানক ত্রুটি পেয়েছি across আমি কীভাবে বেশিরভাগই বুঝতে পারি না এটি কীভাবে উত্পন্ন এবং কেন ( এখানে প্রশ্নের অনুরূপ )r
স্টিফান

1
আর এর জন্য এসই নির্দিষ্ট বন্টনমূলক অনুমানগুলি তৈরি যেতে পারে, যেমন ( এক্স , ওয়াই ) বিভাজনযুক্ত সাধারণ। এই মুহুর্তে এটি অবিচ্ছেদ্য ক্যালকুলাসের একটি অনুশীলন - যা এই প্রশ্নের জন্য অনুসরণ করা কোনও আলোকিত জিনিস নয়। বিতরণের R দ্বারা উদ্ধৃত করা হয় উইকিপিডিয়া এবং প্রাপ্ত করা হয় (জ্যামিতিক) আমার পোস্টে stats.stackexchange.com/a/85977/919r(X,Y)r
whuber

আমি কৃমি এই ক্যান ছেড়ে অন্য কিছু সময় ছেড়ে দেব :) আপনার মন্তব্য @ ধন্যবাদ! ধন্যবাদ!
স্টেফান

3

@ হুবহু এর উত্তর থেকে বোঝা যাচ্ছে যে অনেকগুলি মডেল এবং কৌশল রয়েছে যা পারস্পরিক সম্পর্কের ছাতার নীচে পড়তে পারে যা রিগ্রেশন ওয়ার্ল্ডে সুস্পষ্ট এনালগগুলি এবং এর বিপরীতে থাকতে পারে না। যাইহোক, বড় আকারে লোকেরা যখন গণনা সংক্রান্ত মুদ্রার (সাধারণত একটি লিনিয়ার রিগ্রেশন এবং পিয়ারসনের পারস্পরিক সম্পর্ক) দুটি দিক বিবেচনা করে তখন তারা তুলনামূলক বৈপরীত্য এবং পারস্পরিক সম্পর্ক সম্পর্কে চিন্তাভাবনা করে। তাদের উভয় পরিবারের বিশ্লেষণের বিস্তৃত দৃষ্টিভঙ্গি গ্রহণ করা উচিত কিনা তা পৃথক বিতর্কের কিছু এবং গবেষকরা কমপক্ষে ন্যূনতমভাবে কুস্তিগীদ হওয়া উচিত।

শেষ পর্যন্ত, তাদের সর্বাধিক প্রচলিত অ্যাপ্লিকেশনগুলিতে পারস্পরিক সম্পর্ক এবং রিগ্রেশনকে মূল্যায়ন করার সময়, এই দুটিয়ের মধ্যে ধারণাগত পার্থক্য রয়েছে তবে গাণিতিক নয়, এবং y এর লিনিয়ার রূপান্তরকে বাদ দিয়ে ( x , y ) এর নির্দিষ্ট বিতরণ বৈশিষ্ট্য নির্দিষ্ট করে ।এক্সY(এক্স,Y)

প্রতিরোধ ও পারস্পরিক সম্পর্কের উভয়ের এই সংক্ষিপ্ত দৃষ্টিভঙ্গিতে নিম্নলিখিত বিবরণগুলি কীভাবে এবং কেন তাদের অনুমান, স্ট্যান্ডার্ড ত্রুটি এবং পি মানগুলি একে অপরের বৈকল্পিক তা ব্যাখ্যা করতে সহায়তা করবে।

Dataframe সঙ্গে datহচ্ছে longleyআমরা উপরোক্ত রেফারেন্সড ডেটা সেট cor.test জন্য নিম্নলিখিত পেতে। (আপনি উপরের প্রশ্নটি বাদ দিয়ে সরাসরি উত্তরগুলি পড়তে না পারলে এখানে নতুন কিছু নেই):

> cor.test(dat$Employed, dat$Population)

    Pearson's product-moment correlation

data:  dat$Employed and dat$Population
t = 12.896, df = 14, p-value = 3.693e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
 0.8869236 0.9864676
sample estimates:
      cor 
0.9603906 

এবং রৈখিক মডেলটির জন্য নিম্নলিখিতগুলি (উপরেও একই)

> summary(lm(Employed~Population, data=dat))

Call:
lm(formula = Employed ~ Population, data = dat)

Residuals:
    Min      1Q  Median      3Q     Max 
-1.4362 -0.9740  0.2021  0.5531  1.9048 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   8.3807     4.4224   1.895   0.0789 .  
Population    0.4849     0.0376  12.896 3.69e-09 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.013 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

এখন এই উত্তরের নতুন উপাদানটির জন্য। প্রথমত, এর দুটি নতুন প্রমিত সংস্করণ তৈরি Employedএবং Populationভেরিয়েবল:

> dat$zEmployed<-scale(dat$Employed)
> dat$zPopulation<-scale(dat$Population)

দ্বিতীয়টি পুনরায় চালন করুন:

> summary(lm(zEmployed~zPopulation, data=dat))

Call:
lm(formula = zEmployed ~ zPopulation, data = dat)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.40894 -0.27733  0.05755  0.15748  0.54238 

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -2.956e-15  7.211e-02     0.0        1    
zPopulation  9.604e-01  7.447e-02    12.9 3.69e-09 ***
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2884 on 14 degrees of freedom
Multiple R-squared:  0.9224,    Adjusted R-squared:  0.9168 
F-statistic: 166.3 on 1 and 14 DF,  p-value: 3.693e-09

ভাল খবর! রিগ্রেশন opeাল উপরে থেকে পারস্পরিক সম্পর্ক সহগের সমান। প্রশ্ন 1 এর উত্তর হ'ল উভয় পরীক্ষার জন্য অনুমানগুলি মূলত একই:

  1. পর্যবেক্ষণের স্বাধীনতা
  2. এক্সY
  3. সাধারণত শূন্য, সাথে রেসিডুয়াল বিতরণ করা হয়এন(0,σ2)
  4. ত্রুটি শর্তাবলী একইভাবে প্রতিরোধের রেখার প্রতিটি পূর্বাভাসিত মানতে বিতরণ করা হয় (অর্থাত্ ত্রুটির পরিবর্তনের একাকীকরণ)

এক্সY

প্রশ্ন 2 এর জন্য আসুন উপরে ব্যবহৃত রিগ্রেশন opeাল সূত্রের স্ট্যান্ডার্ড ত্রুটি দিয়ে শুরু করুন (আর কোডে বর্ণিত - তবে নীচে পুরোপুরি বর্ণিত):

=Σ(এক্সআমি-এক্স¯)(ওয়াইআমি-ওয়াই¯)Σ(এক্সআমি-এক্স¯)2

ভীএকটিR()এক্সআমি=(এক্সআমি-এক্স¯)ওয়াইআমি=(ওয়াইআমি-ওয়াই¯)

ভীএকটিR()=ভীএকটিR(Σ(এক্সআমিওয়াইআমি)Σ(এক্সআমি2))

সেই সূত্র থেকে আপনি নিম্নলিখিত, ঘনীভূত এবং আরও দরকারী অভিব্যক্তি পেতে পারেন ( ধাপে ধাপে এই লিঙ্কটি দেখুন ):

ভীএকটিR()=σ2Σ(এক্সআমি-এক্স¯)2
এস()=ভীএকটিR()=σ2Σ(এক্সআমি-এক্স¯)2

σ2

আমি মনে করি আপনি যদি এই নিরবচ্ছিন্ন এবং মানক (যেমন, পারস্পরিক সম্পর্ক) রৈখিক মডেলগুলির জন্য এই সমীকরণটি সমাধান করেন তবে আপনি আপনার opালের জন্য একই পি এবং টি মান পাবেন। উভয় পরীক্ষা সাধারণ ন্যূনতম স্কোয়ার অনুমানের উপর নির্ভর করে এবং একই অনুমান করে। অনুশীলনে, অনেক গবেষক সাধারণ লিনিয়ার রিগ্রেশন মডেল এবং পারস্পরিক সম্পর্ক উভয়ের জন্যই অনুমানের চেকিং এড়িয়ে যান, যদিও আমি মনে করি যে সংশ্লেষগুলির জন্য এটি করা আরও বেশি প্রচলিত কারণ অনেক লোক এগুলিকে সাধারণ লিনিয়ার রিগ্রেশনগুলির বিশেষ ক্ষেত্রে হিসাবে স্বীকৃতি দেয় না। (দ্রষ্টব্য: এটি গ্রহণ করা ভাল অভ্যাস নয়)


2
এই উত্তরটি @ প্রশ্নে পুনরুত্পাদন করা উক্তিটির উদ্ধৃতিটিকে সম্বোধন করে না, যেখানে তিনি দাবি করেছেন যে অনুমানগুলি আলাদা। আপনি কি বলতে চান যে এই বক্তব্যটি ভুল ছিল?
অ্যামিবা বলেছেন

আপনি যদি এই সমীকরণগুলি অনুসরণ করেন তবে পিয়ারসনের পারস্পরিক সম্পর্কের একটি সাধারণ লিনিয়ার রিগ্রেশন একইরকম প্রাথমিক অনুমান রয়েছে। আমি আমার প্রতিক্রিয়া সংশোধন করতে পারেন আরও স্পষ্টভাবে এই।
ম্যাট বার্সেস্ট

1
আপনার উত্তরের জন্য ধন্যবাদ! আমি সচেতন ছিলাম যে প্রাসঙ্গিক মানটি মানক হওয়ার সময় রিগ্রেশন opeালের সমান। এটি আমার প্রশ্নের 3 এবং 4 লিঙ্কে দেখানো হয়েছিল। আপনি তালিকাভুক্ত সাধারণ অনুমান সম্পর্কেও আমি সচেতন ছিলাম এবং সে কারণেই @ হুবহু মন্তব্যটি আমাকে এই প্রশ্নটির দিকে নিয়ে যায় বলে ভাবছে। আমার ক্ষমা প্রার্থনা সম্পর্কে আমি যে অনুমানগুলি সম্পর্কে সচেতন তা স্পষ্ট করে বলে দেওয়া উচিত ছিল।
স্টেফান

1
RRr <- 0.9603906; n <- 16; r/(sqrt((1-r^2)/(n-2))) # 12.8956

0

এখানে পরীক্ষার সমতুল্যতার একটি ব্যাখ্যা দেওয়া হচ্ছে, এটিও দেখানো হচ্ছে যে r এবং b কীভাবে সম্পর্কিত।

http://www.real-statistics.com/regression/hypothesis-testing-significance-regression-line-slope/

ওএলএস সম্পাদনা করতে আপনাকে https://en.wikedia.org/wiki/Ordinary_least_squares#Asomptions করতে হবে

অতিরিক্তভাবে, ওএলএস এবং করর এলোমেলো নমুনা গ্রহণের প্রয়োজন হয়।

একটি কর পরীক্ষার নির্মাণ অনুমান:

(X, y) এর জনসংখ্যা থেকে আমাদের কাছে একটি "এলোমেলো এবং বড় পরিমাণের নমুনা" রয়েছে।


0

প্রশ্ন 2 সম্পর্কিত

কীভাবে using1 এর পরিবর্তে r ব্যবহার করে একই টি-মান গণনা করব

আমি এটি গণনা করা সম্ভব বলে মনে করি না টি থেকে পরিসংখ্যান R মান, তবে একই পরিসংখ্যানগত অনুমানটি থেকে প্রাপ্ত করা যেতে পারে এফ পরিসংখ্যান, যেখানে বিকল্প অনুমানটি হল মডেলটি ডেটা ব্যাখ্যা করে না, এবং এটি থেকে গণনা করা যেতে পারে R

এফ=R2/(1-R2)/(এন-)

সঙ্গে =2 মডেল এবং পরামিতি এন=একটিটিএকটিপিআমিএনটিগুলি

যে সীমাবদ্ধতার সাথে

... যখন মডেলটির বাধা নেই তখন এফ রেশিও ব্যবহার করা যায় না

উত্স: একাধিক রিগ্রেশন মডেলে হাইপোথিসিস পরীক্ষা করা


1
আপনি কোন প্রশ্নের জবাব দিচ্ছেন তা শনাক্ত করতে আমি মূল পোস্টটির দিকে ফিরে তাকালাম। আমি দুটি পেয়েছি, সংখ্যা 1 (অনুমান সম্পর্কে) এবং 2 (একটি টি-মান গণনা সম্পর্কে), কিন্তু উভয়ই এই উত্তর দ্বারা সম্বোধিত বলে মনে হয় না। আপনি কোন প্রশ্নটির উত্তর দিচ্ছেন তা আপনি আরও পরিষ্কারভাবে বলতে পারেন?
whuber

1
স্পষ্টতার জন্য আপনাকে ধন্যবাদ: প্রশ্নের সংযোগ এখন স্পষ্ট। যদিও আমি প্রশ্নটি আলাদাভাবে ব্যাখ্যা করি। আমি এটি জিজ্ঞাসা করে নিতে পারি যে কীভাবে পারস্পরিক সম্পর্ক বিশ্লেষণের জন্য পি-মান (এটি, নমুনা পারস্পরিক সম্পর্ক সহগের উপর ভিত্তি করে)Rএবং এটি যে মডেলটি ইঙ্গিত করে) তা গণনা করা হয় (এবং স্পষ্টভাবে এটি বোঝাতে যে কেন এটি রিগ্রেশন বিশ্লেষণের জন্য একই মান অর্জন করা উচিত) show আপনার উত্তরটি সঠিক হলেও এটি রিগ্রেশন ভিত্তিক, তাই এটি এখনও আমাদের অবাক করে দেয় ering
whuber

1
আমি মনে করি আমি বুঝতে পেরেছি, সম্ভবত আমি জেনারেলের চেয়ে নির্দিষ্ট ক্ষেত্রে প্রশ্নের উত্তর দিচ্ছিলাম। আমি মনে করি যে এই সাধারণ ক্ষেত্রে বিবেচনা করতে সক্ষম হতে একটি সাধারণ নাল এবং বিকল্প অনুমানের দিক থেকে প্রশ্নটি উত্সাহিত করা কার্যকর হবে বলে আমি মনে করি যেহেতু আমি লড়াই করে যাচ্ছি।
হ্যারি সালমন

আমি সম্মত: পারস্পরিক সম্পর্ক এবং বিশ্লেষণ বিশ্লেষণগুলির জন্য পরিষ্কার মডেলগুলি এবং সিদ্ধান্তের মানদণ্ডগুলি প্রদর্শন করা তাদের পার্থক্য করতে সহায়ক হবে। কখনও কখনও একটি উত্তরের উত্তরটি পুনঃবিবেচনা করা বা প্রশ্নটি স্পষ্ট করার চেয়ে কিছুটা বেশি থাকে এবং প্রায়শই সেরা উত্তরগুলি প্রশ্নের কার্যকর পুনঃস্থাপনের সাথে শুরু হয়, সুতরাং সেই দিকে যেতে ভয় পাবেন না।
হোবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.