সংক্ষিপ্ত উত্তর: খুব অ-দৃ .়। পারস্পরিক সম্পর্কটি লিনিয়ার নির্ভরতার একটি পরিমাপ , এবং যখন একটি ভেরিয়েবল অন্যটির লিনিয়ার ফাংশন হিসাবে লেখা যায় না (এবং এখনও প্রদত্ত প্রান্তিক বিতরণ থাকে), আপনার নিখুঁত (ধনাত্মক বা নেতিবাচক) পারস্পরিক সম্পর্ক থাকতে পারে না। আসলে, সম্ভাব্য পারস্পরিক সম্পর্কের মানগুলি কঠোরভাবে সীমাবদ্ধ করা যেতে পারে।
সমস্যাটি হ'ল জনসংখ্যার পারস্পরিক সম্পর্ক সর্বদা এবং 1 এর মধ্যে থাকলেও সঠিক পরিসরটি প্রান্তিক বিতরণের উপর নির্ভর করে। একটি দ্রুত প্রমাণ এবং বিক্ষোভ:- 11
পারস্পরিক সম্পর্কের অর্জনযোগ্য পরিসর
যদি এর বিতরণ ফাংশন এইচ এবং প্রান্তিক বিতরণ ফাংশন এফ এবং জি থাকে তবে এইচ ,
এইচ - ( x , y ) ≤ এইচ ( এক্স , ওয়াই ) ≤ এইচ + ( x , y ) ,
ফ্র্যাচেটের সীমানা বলে। এগুলি
হ - - ( x , y )( এক্স, Y)এইচএফজিএইচ
এইচ-( x , y)) ≤ এইচ( x , y)) ≤ এইচ+ +( x , y)) ,
(এটি প্রমাণ করার চেষ্টা করুন; এটি খুব কঠিন কিছু নয়।)
এইচ-( x , y))এইচ+ +( x , y))= সর্বোচ্চ ( চ( x ) + জি ( y )) - 1 , 0 )= মিনিট ( চ( এক্স ) , জি ( ওয়াই )) ) ।
সীমানা তাদের বিতরণ ফাংশন হয়। যাক একটি অভিন্ন বন্টন আছে। উপরের গণ্ডিটি হল ( এক্স , ওয়াই ) = ( এফ -ইউ এর বিতরণ ফাংশন এবং নিম্ন সীমাটি ( এফ - ( - ইউ ) , জি - ( 1 - ইউ এর বিতরণ ফাংশন ) ) ) ।( এক্স, Y) = ( চ-( ইউ) , জি-( ইউ) )( চ-( - ইউ) , জি-( 1 - ইউ) )
এখন, সহভেদাংক জন্য সূত্র এই বৈকল্পিক ব্যবহার করে,
আমরা দেখতে যে আমরা সর্বোচ্চ এবং সর্বনিম্ন পারস্পরিক সম্পর্ক প্রাপ্ত যখন এইচ সমান এইচ + + এবং এইচ - যথাক্রমে, অর্থাত্, যখন ওয়াই একটি (ইতিবাচক বা নেতিবাচক যথাক্রমে) এর একঘেয়েমি ফাংশন এক্স ।
Cov( এক্স, Y) = ∬এইচ( x , y)) - এফ( x ) জি ( y )) ঘএক্স ডিY,
এইচএইচ+ +এইচ-ওয়াইএক্স
উদাহরণ
এখানে কয়েকটি উদাহরণ রয়েছে (প্রমাণ ছাড়াই):
যখন এবং ওয়াই সাধারণত বিতরণ করা হয়, তখন আমরা সর্বাধিক এবং সর্বনিম্ন পাই যখন ( এক্স)এক্সওয়াই চলিত bivariate সাধারন বন্টনের যেখানে রয়েছে ওয়াই একটি রৈখিক ফাংশন হিসাবে লেখা হয় এক্স । তা হল, আমরা Y = μ Y + σ Y X - μ X এর সর্বাধিক পাই
( এক্স, Y)ওয়াইএক্স
এখানে সীমাগুলি (অবশ্যই)-1এবং1,XএবংY এরঅর্থ এবং প্রকরণগুলি কী তা বিবেচনা করে না।
ওয়াই= μওয়াই+ + σওয়াইএক্স- μএক্সσএক্স।
- 11এক্সওয়াই
যখন এবং ওয়াইয়ের লগন্যাল বিতরণ হয়, নীচের গণ্ডিটি কখনই অর্জনযোগ্য হয় না, কারণ এর দ্বারা বোঝা যায় যে Y কে a এবং a ইতিবাচক খ এর জন্য Y = a - b X লেখা যেতে পারে এবং Y কখনই নেতিবাচক হতে পারে না। সঠিক সীমানার জন্য এখানে কিছুটা (কুৎসিত) সূত্র রয়েছে, তবে আমাকে কেবল একটি বিশেষ কেস দেই। যখন এক্স এবং ওয়াইয়ের স্ট্যান্ডার্ড লগনরমাল বিতরণ থাকে (অর্থাত্ যখন ক্ষুদ্রতর হয়ে থাকে তখন তারা মানক সাধারণ হয়), তখন অর্জনের পরিসীমা [ - 1 / e , 1 ] ≈এক্সওয়াইওয়াইওয়াই= ক - খ এক্সএকটিখওয়াইXY । (সাধারণভাবে, উপরের সীমাটিও সীমাবদ্ধ))[−1/e,1]≈[−0.37,1]
যখন একটি মানক সাধারণ বিতরণ থাকে এবং ওয়াইয়ের একটি স্ট্যান্ডার্ড লগনরমাল বিতরণ থাকে তখন পারস্পরিক সম্পর্কের সীমা
± 1 হয়XY
±1e−1−−−−√≈0.76.
নোট করুন যে সমস্ত সীমা জনসংখ্যার পারস্পরিক সম্পর্কের জন্য। নমুনা পারস্পরিক সম্পর্ক সহজেই সীমার বাইরে প্রসারিত করতে পারে, বিশেষত ছোট নমুনাগুলির জন্য (দ্রুত উদাহরণ: 2 নমুনার আকার)।
পারস্পরিক সম্পর্কের সীমা নির্ধারণ করা
আপনি যদি প্রান্তিক বিতরণগুলি থেকে অনুকরণ করতে পারেন তবে পারস্পরিক সম্পর্কের উপরের এবং নীচের সীমানাগুলি অনুমান করা এটি বেশ সহজ। উপরের শেষ উদাহরণের জন্য, আমরা এই আর কোডটি ব্যবহার করতে পারি:
> n = 10^5 # Sample size: 100,000 observations
> x = rnorm(n) # From the standard normal distribution
> y = rlnorm(n) # From the standard lognormal distribution
>
> # Estimated maximum correlation
> cor( sort(x), sort(y) )
0.772
>
> # Estimated minimum correlation
> cor( sort(x), sort(y, decreasing=TRUE) )
−0.769
যদি কেবলমাত্র আমাদের কাছে সত্যিকারের ডেটা থাকে এবং প্রান্তিক বিতরণগুলি না জানলে আমরা এখনও উপরের পদ্ধতিটি ব্যবহার করতে পারি। এটা একটা সমস্যা না যে ভেরিয়েবল যতদিন পর্যবেক্ষণ নির্ভরশীল জোড়া নির্ভরশীল। তবে এটি অনেকগুলি পর্যবেক্ষণ জোড়া রাখতে সহায়তা করে ।
ডেটা ট্রান্সফর্ম করা হচ্ছে
YX
আপনি এখানে যা করছেন তা নির্ভরযোগ্যতার একটি নতুন পরিমাপ তৈরি করছে যা প্রান্তিক বিতরণের উপর নির্ভর করে না ; অর্থাত্, আপনি নির্ভরশীলতার একটি কোপুলা ভিত্তিক পরিমাপ তৈরি করছেন । ইতিমধ্যে বিভিন্ন ধরনের পরিমাপ, বিদ্যমান Spearman এর ρ এবং কেন্ডাল এর τ সবচেয়ে সুপরিচিত হচ্ছে। (যদি আপনি নির্ভরশীলতা ধারণাগুলিতে সত্যিই আগ্রহী হন, তবে কপুলাসগুলি অনুসন্ধান করা কোনও খারাপ ধারণা নয়))
উপসংহারে
কিছু চূড়ান্ত চিন্তাভাবনা এবং পরামর্শ: কেবলমাত্র সম্পর্কের দিকে তাকানোতে একটি বড় সমস্যা রয়েছে: এটি আপনাকে চিন্তাভাবনা বন্ধ করে দেয়। অন্যদিকে বিক্ষিপ্ত প্লটের দিকে তাকানো আপনাকে প্রায়শই ভাবতে শুরু করে। আমার মূল পরামর্শটি তাই বিচ্ছুরিত প্লটগুলি পরীক্ষা করা এবং স্পষ্টভাবে নির্ভরতা মডেল করার চেষ্টা করা হবে।
এটি বলেছে, আপনার যদি কোনও সহজ সম্পর্কের মতো পরিমাপের প্রয়োজন হয় তবে আমি কেবল স্পিয়ারম্যানের use (এবং সম্পর্কিত আত্মবিশ্বাসের ব্যবধান এবং পরীক্ষা) ব্যবহার করব। এর পরিসর সীমাবদ্ধ নয়। তবে অ-মনোোটোন নির্ভরতা সম্পর্কে খুব সচেতন হন। পারস্পরিক সম্পর্ক উইকিপিডিয়ার নিবন্ধ সম্ভাব্য সমস্যার ব্যাখ্যা চমৎকার প্লট একটি দম্পতি আছে।