দুটি শ্রেণিবদ্ধ ভেরিয়েবল
দুটি শ্রেণীবদ্ধ ভেরিয়েবল স্বতন্ত্র কিনা তা খতিয়ে দেখা স্বাধীনতার চি-স্কোয়ার্ড পরীক্ষা দিয়ে করা যেতে পারে।
এটি একটি সাধারণ চি-স্কোয়ার পরীক্ষা : আমরা যদি ধরে নিই যে দুটি ভেরিয়েবলগুলি স্বতন্ত্র, তবে এই ভেরিয়েবলগুলির জন্য কন্টিজেন্সি টেবিলের মানগুলি সমানভাবে বিতরণ করা উচিত। এবং তারপরে আমরা যাচাই করি যে প্রকৃত মানগুলি ইউনিফর্ম থেকে কত দূরে।
একটি ক্রামার্স ভিও রয়েছে যা এই পরীক্ষা থেকে পরস্পরের সম্পর্কের একটি পরিমাপ
উদাহরণ
ধরুন আমাদের দুটি ভেরিয়েবল রয়েছে
- লিঙ্গ: পুরুষ এবং মহিলা
- শহর: ব্লাইস এবং ট্যুর
আমরা নিম্নলিখিত তথ্য পর্যবেক্ষণ:
লিঙ্গ এবং শহর কি স্বাধীন? আসুন একটি চি-স্কুয়েড পরীক্ষা করান। নাল হাইপোথিসিস: এগুলি স্বতন্ত্র, বিকল্প অনুমান হ'ল এগুলি কোনও উপায়ে সম্পর্কযুক্ত।
নাল অনুমানের অধীনে, আমরা অভিন্ন বিতরণ ধরে নিই। সুতরাং আমাদের প্রত্যাশিত মান নিম্নলিখিত
সুতরাং আমরা চি-স্কোয়ার্ড পরীক্ষা চালাই এবং ফলস্বরূপ পি-মানটি এই দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্কের পরিমাপ হিসাবে দেখা যেতে পারে।
ক্র্যামারের ভি এর গণনা করার জন্য আমরা প্রথমে সাধারণকরণের ফ্যাক্টরটি পাই-স্কোয়ারড-ম্যাক্স পাই যা সাধারণত নমুনার আকার হয়, এটি দ্বারা চি-স্কোয়ারকে বিভক্ত করে একটি বর্গমূল গ্রহণ করি
আর
tbl = matrix(data=c(55, 45, 20, 30), nrow=2, ncol=2, byrow=T)
dimnames(tbl) = list(City=c('B', 'T'), Gender=c('M', 'F'))
chi2 = chisq.test(tbl, correct=F)
c(chi2$statistic, chi2$p.value)
এখানে পি মান 0.08 - বেশ ছোট, কিন্তু স্বাধীনতার অনুমানটি প্রত্যাখ্যান করার জন্য এখনও পর্যাপ্ত নয়। সুতরাং আমরা বলতে পারি যে এখানে "পারস্পরিক সম্পর্ক" 0.08
আমরা ভিও গণনা করি:
sqrt(chi2$statistic / sum(tbl))
এবং 0.14 পান (কম ভি, কম পারস্পরিক সম্পর্ক)
অন্য একটি ডেটাसेट বিবেচনা করুন
Gender
City M F
B 51 49
T 24 26
এই জন্য, এটি নিম্নলিখিত দিতে হবে
tbl = matrix(data=c(51, 49, 24, 26), nrow=2, ncol=2, byrow=T)
dimnames(tbl) = list(City=c('B', 'T'), Gender=c('M', 'F'))
chi2 = chisq.test(tbl, correct=F)
c(chi2$statistic, chi2$p.value)
sqrt(chi2$statistic / sum(tbl))
পি-মানটি 0.72 যা 1 এর কাছাকাছি, এবং v 0.03 - খুব 0 এর কাছাকাছি
শ্রেণিবদ্ধ বনাম সংখ্যাসূচক চলক
এই ধরণের জন্য আমরা সাধারণত ওয়ান-ওয়ে আনোভা পরীক্ষা করি : আমরা ইন-গ্রুপ বৈকল্পিক এবং অন্তঃ-গোষ্ঠী বৈকল্পিক গণনা করি এবং তারপরে তাদের তুলনা করি।
উদাহরণ
আমরা ডোনাট থেকে শোষিত ফ্যাট এবং বনাম উত্পাদন করতে ব্যবহৃত ফ্যাট জাতীয় ধরণের মধ্যে সম্পর্ক অধ্যয়ন করতে চাই (উদাহরণস্বরূপ এখান থেকে নেওয়া হয় )
ভেরিয়েবলের মধ্যে কোনও নির্ভরতা আছে কি? এর জন্য আমরা আনোভা পরীক্ষা করি এবং দেখি যে পি-মানটি মাত্র 0.007 - এই ভেরিয়েবলগুলির মধ্যে কোনও সম্পর্ক নেই।
আর
t1 = c(164, 172, 168, 177, 156, 195)
t2 = c(178, 191, 197, 182, 185, 177)
t3 = c(175, 193, 178, 171, 163, 176)
t4 = c(155, 166, 149, 164, 170, 168)
val = c(t1, t2, t3, t4)
fac = gl(n=4, k=6, labels=c('type1', 'type2', 'type3', 'type4'))
aov1 = aov(val ~ fac)
summary(aov1)
আউটপুট হয়
Df Sum Sq Mean Sq F value Pr(>F)
fac 3 1636 545.5 5.406 0.00688 **
Residuals 20 2018 100.9
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
সুতরাং আমরা এখানেও পারস্পরিক সম্পর্কের পরিমাপ হিসাবে পি-মানটি নিতে পারি।
তথ্যসূত্র