এক্স এবং এক্সওয়াই র্যান্ডম ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক সহগ কেন 0.7 থাকে


49

চিকিত্সা গবেষণার জন্য ব্যবহারিক পরিসংখ্যান থেকে নেওয়া যেখানে ডগলাস আল্টম্যান ২৮৫ পৃষ্ঠাতে লিখেছেন:

... যে কোনও দুটি পরিমাণের জন্য এক্স এবং ওয়াই, এক্স এক্সওয়াইয়ের সাথে সম্পর্কিত হবে। আসলে, এক্স এবং ওয়াই এলোমেলো সংখ্যার নমুনা হলেও আমরা এক্স এবং এক্সওয়াইয়ের পারস্পরিক সম্পর্ক 0.7 হওয়ার আশা করব

আমি আর-তে এটি চেষ্টা করেছি এবং মনে হচ্ছে এটির ক্ষেত্রে:

x <- rnorm(1000000, 10, 2)
y <- rnorm(1000000, 10, 2)
cor(x, x-y)

xu <- sample(1:100, size = 1000000, replace = T)
yu <- sample(1:100, size = 1000000, replace = T)
cor(xu, xu-yu)

তা কেন? এর পেছনে তত্ত্ব কী?


আপনি কোন অংশটির ব্যাখ্যা চান? আপনি কি কেবলমাত্র পারস্পরিক সম্পর্কের সরলিকৃত সমীকরণ চান যা এক্স, এবং ওয়াইয়ের মধ্যে জ্ঞাত পারস্পরিক সম্পর্ক এবং x এবং xy এর মধ্যে স্বীয় সম্পর্কের কারণে ফলাফল হয়? বা, আপনি কি কেবল এখানে জানতে চান যে এখানে কেন কোনও সম্প্রদায় রয়েছে?
জন

এটি কি কোনও এবং জন্য সত্য ? ধরা যাক এবং নিরক্ষিত এবং । তারপরে আমার সন্দেহ হয় সাথে সম্পর্কযুক্ত করা হবে না । Y X Z Y = X - Z X X - YXYXZY=XZXXY
হেনরি

উত্তর:


69

তাহলে এবং হয় সম্পর্কহীন সমান ভ্যারিয়েন্স সঙ্গে র্যান্ডম ভেরিয়েবল , তাহলে আমরা আছে ফলস্বরূপ,ওয়াই σ 2 ভ্যার ( এক্স - ওয়াই )XYσ2ρএক্স,এক্স-ওয়াই=কোভ(এক্স,এক্স-ওয়াই)

var(XY)=var(X)+var(Y)=var(X)+var(Y)=2σ2,cov(X,XY)=cov(X,X)cov(X,Y)bilinearity of covariance operator=var(X)00 because X and Y are uncorrelated=σ2.
n i = 1 (xi- ˉ x )((xi-yi)-( ˉ x - ˉ y ))
ρX,XY=cov(X,XY)var(X)var(XY)=σ2σ22σ2=12.
সুতরাং, আপনি যখন large large বড় ডেটা সেট জন্য এবং এর নমুনা পারস্পরিক সম্পর্ক এই বৈশিষ্ট্য সঙ্গে জনসংখ্যা, যা একটি বিশেষ ক্ষেত্রে হিসাবে "র্যান্ডম সংখ্যা" অন্তর্ভুক্ত থেকে টানা, ফলে জনসংখ্যা পারস্পরিক সম্পর্ক মান পাসে হতে থাকে
i=1n(xix¯)((xiyi)(x¯y¯))i=1n(xix¯)2i=1n((xiyi)(x¯y¯))2
xxy{(xi,yi):1in}120.7071

আপনি দয়া করে আরও কিছু ব্যাখ্যা করতে পারেনcov(X,X)-cov(X,Y)=s^2
নস্টক

5
কোভ (এক্স, এক্স) ভার (এক্স) এর আরেকটি নাম। কোভ (এক্স, ওয়াই) = 0 যেহেতু এক্স এবং ওয়াই অসম্পর্কিত বলে ধরে নেওয়া হয় (সুতরাং সমবায় = 0)।
দিলীপ সরোতে

58

একটি জ্যামিতিক-পরিসংখ্যানীয় ব্যাখ্যা।

কল্পনা করুন আপনি একটি "ভিতরে-আউট" scatterplot করা যেখানে বিষয় হয় অক্ষ এবং ভেরিয়েবল এবং হয় পয়েন্ট । একে সাবজেক্ট স্পেস প্লট (সাধারণ ভেরিয়েবল স্পেস প্লটের বিপরীতে ) বলা হয়। যেহেতু প্লট করার জন্য কেবলমাত্র 2 টি পয়েন্ট রয়েছে, কেবলমাত্র দুটি দুটি স্বেচ্ছাসেবী মাত্রা ব্যতীত এমন কোনও জায়গার সমস্ত মাত্রা যা 2 পয়েন্ট প্লাস উত্সকে সমর্থন করতে সক্ষম, অপ্রয়োজনীয় এবং নিরাপদে ফেলে দেওয়া যেতে পারে। এবং তাই আমরা একটি বিমান সঙ্গে বাকি আছে। আমরা উত্স থেকে বিন্দুতে ভেক্টর তীরগুলি আঁকি: এটি আমাদের ভ্যারিয়েবলগুলি এবং ডেটার বিষয়বস্তুতে ভেক্টর হিসাবে।n 2 XYXY

এখন, যদি ভেরিয়েবলগুলি তখন কেন্দ্রীভূত হত , কোনও সাবজেক্টে, তাদের ভেক্টরগুলির মধ্যে কোণটির কোসাইন তাদের পারস্পরিক সম্পর্ক সহগ হয় । নিচে মাংসখণ্ডের এবং ভেক্টর লম্ব আছেন: তাদের । Uncorrelatedness তাদের উত্তরে @ দিলিপ দ্বারা বর্ণিত একটি পূর্বশর্ত ছিল।ওয়াই আর = 0XYr=0

কেন্দ্রীভূত পরিবর্তনশীলগুলির জন্য, কোনও সাবজেক্টে তাদের ভেক্টরের দৈর্ঘ্য হ'ল তাদের স্ট্যান্ডার্ড বিচ্যুতি । ছবিটিতে , এবং সমান দৈর্ঘ্যের - সমান বৈচিত্রগুলিও @ ডিলিপ দ্বারা তৈরি পূর্বশর্ত ছিল।ওয়াইXY

পরিবর্তনশীল বা ভেরিয়েবল আঁকার জন্য আমরা কেবল ভেক্টর সংযোজন বা বিয়োগফল ব্যবহার করি যা আমরা স্কুল থেকে ভুলে গিয়েছি (ওয়াই ভেক্টরকে এক্স ভেক্টরের শেষের দিকে নিয়ে যান এবং বিয়োগের ক্ষেত্রে দিকটি উল্টান, - এটি ধূসর তীরগুলির দ্বারা দেখানো হয়েছে ছবিটিতে, - তারপরে ধূসর তীরের বিন্দুতে কোনও ভেক্টর আঁকুন)।এক্স + ওয়াইXYX+Y

এটি খুব স্পষ্ট হয়ে যায় যে বা ভেক্টরগুলির দৈর্ঘ্য (এই ভেরিয়েবলগুলির স্ট্যান্ডার্ড বিচ্যুতি), পাইথাগোরিয়ান উপপাদ্য দ্বারা, , এবং এবং বা মধ্যবর্তী কোণটি is 45 ডিগ্রি, কোন কোসাইন - পারস্পরিক সম্পর্ক - এটিএক্স + ওয়াই XYX+Y এক্সএক্স-ওয়াইএক্স+ওয়াই0.707 ...2σ2XXYX+Y0.707...

এখানে চিত্র বর্ণনা লিখুন


4
এই পদ্ধতির ভাগ করে নেওয়ার জন্য একটি বড় +1।
হোবল

(+1) এটি উপস্থাপনের এটি খুব ঝরঝরে উপায়!
ম্যাট ক্রাউস

আহা ... ছবি! (+1) ভাল হয়েছে। :-)
মূল

11

আমি বিশ্বাস করি যে এখানেও প্রতিসাম্যের উপর ভিত্তি করে একটি সাধারণ অন্তর্দৃষ্টি রয়েছে। যেহেতু এক্স এবং ওয়াই এর সমান বিতরণ এবং 0 এর সমবায় রয়েছে তাই এক্স এর সাথে এক্স ± ওয়াইয়ের সম্পর্কের এক্স ± ওয়াইয়ের অর্ধেক প্রকরণের "ব্যাখ্যা" করা উচিত; অন্যান্য অর্ধেকটি ওয়াই দ্বারা ব্যাখ্যা করা উচিত So সুতরাং আর 2 টি 1/2 হওয়া উচিত, যার অর্থ আর 1 / √2 ≈ 0.707।


এটি একটি চমৎকার অনুভূতি মত মনে হয়, কিন্তু মনে রাখবেন যদি , লিখতে আদর্শ উপায় হবে , না যা এমনকি যদি কিছু মানুষ গুলান পারে তারা বীজগণিত হিসাবে সমতুল্য। আরr2=12r 1/1/21/2
গুং - মনিকা পুনরায়

না, এটি আসলে আরও মানক নয়। (আপনার যদি প্রমাণের প্রয়োজন হয় তবে উপরের উত্তরটি দেখুন already যে 38 জন লোক ইতিমধ্যে এটির পক্ষে ভোট দিয়েছিল তারা একই স্বরলিপি দিয়ে
কাঁপেনি

আমি সেই 38 ;-) এর একজন। প্রশ্নটি হল, যার বীজগণিত মোটামুটি দুর্বল, খুব সহজেই কী অনুসরণ করতে পারবেন? তাহলে , তাহলে এটি দেখতে সহজ । R = r2=1/2r=1/2
গুং - মনিকা পুনরায়

3

এখানে কেন একে অপরের সাথে পারস্পরিক সম্পর্ক রয়েছে সে সম্পর্কে ভাবার সহজ উপায়।

আপনি দুটি বিতরণ বিয়োগ করলে কী হয় তা কল্পনা করুন। যদি x এর মান কম হয় তবে, x এর x - yমান বেশি হলে তার চেয়ে কম মান হবে। এক্স বৃদ্ধি x - yপাওয়ার সাথে সাথে গড়ে বৃদ্ধি পায় এবং এইভাবে একটি ধনাত্মক সম্পর্ক থাকে।


4
আপনার বক্তব্য সর্বদা সত্য বলে আমি মনে করি না "যখন গাণিতিক সম্পর্ক থাকে তখন সর্বদা দুটি এলোমেলো বিতরণের মধ্যে একটি সম্পর্ক থাকবে" " যেমন x <- rnorm(1e6, 0,1) y <- rnorm(1e6, 0,1) $cor((x-y)^2,x-y)$
কৌতূহলী_ক্যাট

4
@ কুরিয়াস_ক্যাট: বা সম্ভবত আরও উত্তেজক হওয়ার জন্য yপুরোপুরি বাদ দিন। :-)
কার্ডিনাল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.