ফাই, ম্যাথিউস এবং পিয়ারসন পারস্পরিক সম্পর্কের সহগগুলির মধ্যে সম্পর্ক


13

ফাই এবং ম্যাথিউসের পারস্পরিক সম্পর্কের সহগগুলি কি একই ধারণা? তারা দুটি বাইনারি ভেরিয়েবলের জন্য কীভাবে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সাথে সম্পর্কিত বা সমতুল্য? আমি ধরে নিই বাইনারি মানগুলি 0 এবং 1 হয়।


দুটি বার্নোল্লি র্যান্ডম ভেরিয়েবল এবং এর মধ্যে পিয়ারসনের পারস্পরিক সম্পর্ক :xy

ρ=E[(xE[x])(yE[y])]Var[x]Var[y]=E[xy]E[x]E[y]Var[x]Var[y]=n11nn1n1n0n1n0n1

কোথায়

E[x]=n1nVar[x]=n0n1n2E[y]=n1nVar[y]=n0n1n2E[xy]=n11n

উইকিপিডিয়া থেকে ফি সহগ :

পরিসংখ্যানগুলিতে, ফাই সহগ ("বর্গক্ষেত্রের আকস্মিক সংখ্যাসমূহ হিসাবেও পরিচিত এবং বা দ্বারা চিহ্নিত ) কার্ল পিয়ারসন দ্বারা প্রবর্তিত দুটি বাইনারি ভেরিয়েবলের সংযোগের একটি পরিমাপ। এই পরিমাপটি এর ব্যাখ্যাতে পিয়ারসন পারস্পরিক সম্পর্ক সহগের সাথে সমান। প্রকৃতপক্ষে, দুটি বাইনারি ভেরিয়েবলের জন্য অনুমান করা পিয়ারসন পারস্পরিক সম্পর্ক সহগ ফি ফি সহগতি ফিরিয়ে দেবে ...ϕrϕ

ও জন্য দুটি র্যান্ডম ভেরিয়েবলের জন্য যদি আমাদের কাছে 2 × 2 টেবিল থাকেxy

এখানে চিত্র বর্ণনা লিখুন

এবং বর্ণনা করে এমন phi সহগ হ'ল xy

ϕ=n11n00n10n01n1n0n0n1

ম্যাথিউস উইকিপিডিয়া থেকে পারস্পরিক সম্পর্ক সহগ :

ম্যাথিউস পারস্পরিক সম্পর্কের সহগ (এমসিসি) সূত্রটি ব্যবহার করে সরাসরি বিভ্রান্তির ম্যাট্রিক্স থেকে গণনা করা যায়:

MCC=TP×TNFP×FN(TP+FP)(TP+FN)(TN+FP)(TN+FN)

এই সমীকরণে টিপি হ'ল সত্যের ধনাত্মক সংখ্যা, টিএন সত্য negativeণাত্মক সংখ্যা, এফপি মিথ্যা ধনাত্মক সংখ্যা এবং এফএন মিথ্যা sণাত্মক সংখ্যা। ডিনোমিনেটরের চারটি অঙ্কের যদি কোনও শূন্য হয় তবে ডিনোনিটারটি নির্বিচারে একটিতে সেট করা যেতে পারে; এর ফলে শূন্যের ম্যাথিউসের পারস্পরিক সম্পর্ক সহগ হয়, যা সঠিক সীমাবদ্ধ মান হিসাবে দেখানো যেতে পারে।

উত্তর:


14

হ্যাঁ, তারা একই। ম্যাথিউস পারস্পরিক সম্পর্কের সহগ একটি বিভ্রান্তি ছকে কেবল পিয়ারসন সহাবস্থান সহগের একটি নির্দিষ্ট প্রয়োগ।

একটি কন্টিজেন্সি টেবিলটি অন্তর্নিহিত ডেটার সংক্ষিপ্তসার মাত্র। আপনি এটিকে কনজিস্টেন্সি টেবিলের দেখানো গণনা থেকে পর্যবেক্ষণের জন্য এক সারিতে রূপান্তর করতে পারেন।

5 সত্য ধনাত্মক, 17 সত্য নেতিবাচক, 2 মিথ্যা ধনাত্মক এবং 3 মিথ্যা নেতিবাচক সহ উইকিপিডিয়া নিবন্ধে বিভ্রান্তির ম্যাট্রিক্সের উদাহরণটি বিবেচনা করুন

> matrix(c(5,3,2,17), nrow=2, byrow=TRUE)
     [,1] [,2]
[1,]    5    3
[2,]    2   17
> 
> # Matthews correlation coefficient directly from the Wikipedia formula
> (5*17-3*2) / sqrt((5+3)*(5+2)*(17+3)*(17+2))
[1] 0.5415534
> 
> 
> # Convert this into a long form binary variable and find the correlation coefficient
> conf.m <- data.frame(
+ X1=rep(c(0,1,0,1), c(5,3,2,17)),
+ X2=rep(c(0,0,1,1), c(5,3,2,17)))
> conf.m # what does that look like?
   X1 X2
1   0  0
2   0  0
3   0  0
4   0  0
5   0  0
6   1  0
7   1  0
8   1  0
9   0  1
10  0  1
11  1  1
12  1  1
13  1  1
14  1  1
15  1  1
16  1  1
17  1  1
18  1  1
19  1  1
20  1  1
21  1  1
22  1  1
23  1  1
24  1  1
25  1  1
26  1  1
27  1  1
> cor(conf.m)
          X1        X2
X1 1.0000000 0.5415534
X2 0.5415534 1.0000000

ধন্যবাদ, পিটার! গাণিতিকভাবে, ফাই এবং ম্যাথিউ দুটি বাইনারি র্যান্ডম ভেরিয়েবলের জন্য পিয়ারসনের সমতুল্য কেন?
টিম

আপনি যদি পিয়ারসন পারস্পরিক সম্পর্কের সংজ্ঞাটি গ্রহণ করেন এবং এটি পরিচালনা করেন তবে এটি পৃথক পর্যবেক্ষণ এবং উপায়গুলির মধ্যে পার্থক্যের যোগফলের চেয়ে গণনাগুলিকে বোঝায়, আপনি ম্যাথিউস সূত্রটি পাবেন। আমি আসলে এটি করি নি, তবে এটি অবশ্যই যুক্তিসঙ্গত সোজা হতে হবে।
পিটার এলিস

2

প্রথমত, সেখানে প্রশ্নে একটি টাইপো ত্রুটি ছিল: নয় বরংE[xy]n1n1n2

n11n×1×1+n10n×1×0+n01n×0×1+n00n×0×0=n11n

দ্বিতীয়ত, দেখানো চাবিকাঠি যে হয়ρ=ϕ

n11nn1n1=n11(n01+n10+n11+n00)(n11+n10)(n11+n01)=n11n00n10n01
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.