দুটি শ্রেণিবদ্ধ ভেরিয়েবল এবং একটি শ্রেণিবদ্ধ ভেরিয়েবল এবং অবিচ্ছিন্ন ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক কীভাবে পাওয়া যায়?


63

আমি একটি রিগ্রেশন মডেল তৈরি করছি এবং পারস্পরিক সম্পর্কের জন্য যাচাই করার জন্য আমাকে নীচে গণনা করতে হবে

  1. 2 বহু স্তরের শ্রেণিবদ্ধ ভেরিয়েবলের মধ্যে সম্পর্ক
  2. একাধিক স্তরের শ্রেণীবদ্ধ পরিবর্তনশীল এবং অবিচ্ছিন্ন পরিবর্তনশীল এর মধ্যে সম্পর্ক
  3. একাধিক স্তরের শ্রেণীবদ্ধ ভেরিয়েবলের জন্য ভিআইএফ (ভেরিয়েন্স মুদ্রাস্ফীতি ফ্যাক্টর)

আমি উপরের পরিস্থিতিগুলির জন্য পিয়ারসন পারস্পরিক সম্পর্কের সহগ ব্যবহার করা ভুল বলে বিশ্বাস করি কারণ পিয়ারসন কেবলমাত্র 2 ধারাবাহিক ভেরিয়েবলের জন্য কাজ করেন।

নীচের প্রশ্নের উত্তর দিন

  1. উপরোক্ত মামলার জন্য কোন পারস্পরিক সম্পর্ক সহগ সেরা কাজ করে?
  2. ভিআইএফ গণনা শুধুমাত্র একটানা তথ্যের জন্য কাজ করে তাই বিকল্পটি কী?
  3. আপনার প্রস্তাবিত পারস্পরিক সম্পর্ক সহগ ব্যবহার করার আগে আমার কী অনুমানগুলি পরীক্ষা করতে হবে?
  4. কীভাবে এগুলিকে এসএএস এবং আর-তে প্রয়োগ করবেন?

4
আমি বলব সিভি.এসই এই জাতীয় আরও তাত্ত্বিক পরিসংখ্যান সম্পর্কে প্রশ্নের উত্তম স্থান। যদি তা না হয় তবে আমি বলব যে আপনার প্রশ্নের উত্তর প্রসঙ্গে নির্ভর করবে। কখনও কখনও এটি একাধিক স্তরকে ডামি ভেরিয়েবলগুলিতে সমতল করা বোধগম্য হয়, অন্য সময়
বহুবারিক

আপনার শ্রেণিবদ্ধ ভেরিয়েবলগুলি অর্ডার করা হয়? যদি হ্যাঁ হয় তবে এটি আপনার সন্ধানের প্রকারের সম্পর্ককে প্রভাবিত করতে পারে।
nassimhddd

আমার গবেষণায় আমাকে একই সমস্যার মুখোমুখি হতে হবে। তবে আমি এই সমস্যাটি সমাধান করার সঠিক পদ্ধতি খুঁজে পাইনি। সুতরাং আপনি দয়া করে আমাকে পাওয়া রেফারেন্স দিতে যথেষ্ট দয়া করতে পারেন।
ব্যবহারকারী 89797

আপনার অর্থ কি পি-মানটি পারস্পরিক সম্পর্ক সহগ আর?
অায়ো এমা

ধারাবাহিক বনাম অবিচ্ছিন্ন জন্য এএনওওএর সাথে উপরের সমাধানটি ভাল। ছোট হিচকি। পি-মানটি যত ছোট হবে, দুটি ভেরিয়েবলের মধ্যে আরও ভাল "ফিট"। প্রায় অন্য উপায় না.
মিউডেলসন

উত্তর:


73

দুটি শ্রেণিবদ্ধ ভেরিয়েবল

দুটি শ্রেণীবদ্ধ ভেরিয়েবল স্বতন্ত্র কিনা তা খতিয়ে দেখা স্বাধীনতার চি-স্কোয়ার্ড পরীক্ষা দিয়ে করা যেতে পারে।

এটি একটি সাধারণ চি-স্কোয়ার পরীক্ষা : আমরা যদি ধরে নিই যে দুটি ভেরিয়েবলগুলি স্বতন্ত্র, তবে এই ভেরিয়েবলগুলির জন্য কন্টিজেন্সি টেবিলের মানগুলি সমানভাবে বিতরণ করা উচিত। এবং তারপরে আমরা যাচাই করি যে প্রকৃত মানগুলি ইউনিফর্ম থেকে কত দূরে।

একটি ক্রামার্স ভিও রয়েছে যা এই পরীক্ষা থেকে পরস্পরের সম্পর্কের একটি পরিমাপ

উদাহরণ

ধরুন আমাদের দুটি ভেরিয়েবল রয়েছে

  • লিঙ্গ: পুরুষ এবং মহিলা
  • শহর: ব্লাইস এবং ট্যুর

আমরা নিম্নলিখিত তথ্য পর্যবেক্ষণ:

পর্যবেক্ষণ মান

লিঙ্গ এবং শহর কি স্বাধীন? আসুন একটি চি-স্কুয়েড পরীক্ষা করান। নাল হাইপোথিসিস: এগুলি স্বতন্ত্র, বিকল্প অনুমান হ'ল এগুলি কোনও উপায়ে সম্পর্কযুক্ত।

নাল অনুমানের অধীনে, আমরা অভিন্ন বিতরণ ধরে নিই। সুতরাং আমাদের প্রত্যাশিত মান নিম্নলিখিত

প্রত্যাশিত মান

সুতরাং আমরা চি-স্কোয়ার্ড পরীক্ষা চালাই এবং ফলস্বরূপ পি-মানটি এই দুটি ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্কের পরিমাপ হিসাবে দেখা যেতে পারে।

ক্র্যামারের ভি এর গণনা করার জন্য আমরা প্রথমে সাধারণকরণের ফ্যাক্টরটি পাই-স্কোয়ারড-ম্যাক্স পাই যা সাধারণত নমুনার আকার হয়, এটি দ্বারা চি-স্কোয়ারকে বিভক্ত করে একটি বর্গমূল গ্রহণ করি

crammers v

আর

tbl = matrix(data=c(55, 45, 20, 30), nrow=2, ncol=2, byrow=T)
dimnames(tbl) = list(City=c('B', 'T'), Gender=c('M', 'F'))

chi2 = chisq.test(tbl, correct=F)
c(chi2$statistic, chi2$p.value)

এখানে পি মান 0.08 - বেশ ছোট, কিন্তু স্বাধীনতার অনুমানটি প্রত্যাখ্যান করার জন্য এখনও পর্যাপ্ত নয়। সুতরাং আমরা বলতে পারি যে এখানে "পারস্পরিক সম্পর্ক" 0.08

আমরা ভিও গণনা করি:

sqrt(chi2$statistic / sum(tbl))

এবং 0.14 পান (কম ভি, কম পারস্পরিক সম্পর্ক)

অন্য একটি ডেটাसेट বিবেচনা করুন

    Gender
City  M  F
   B 51 49
   T 24 26

এই জন্য, এটি নিম্নলিখিত দিতে হবে

tbl = matrix(data=c(51, 49, 24, 26), nrow=2, ncol=2, byrow=T)
dimnames(tbl) = list(City=c('B', 'T'), Gender=c('M', 'F'))

chi2 = chisq.test(tbl, correct=F)
c(chi2$statistic, chi2$p.value)

sqrt(chi2$statistic / sum(tbl))

পি-মানটি 0.72 যা 1 এর কাছাকাছি, এবং v 0.03 - খুব 0 এর কাছাকাছি

শ্রেণিবদ্ধ বনাম সংখ্যাসূচক চলক

এই ধরণের জন্য আমরা সাধারণত ওয়ান-ওয়ে আনোভা পরীক্ষা করি : আমরা ইন-গ্রুপ বৈকল্পিক এবং অন্তঃ-গোষ্ঠী বৈকল্পিক গণনা করি এবং তারপরে তাদের তুলনা করি।

উদাহরণ

আমরা ডোনাট থেকে শোষিত ফ্যাট এবং বনাম উত্পাদন করতে ব্যবহৃত ফ্যাট জাতীয় ধরণের মধ্যে সম্পর্ক অধ্যয়ন করতে চাই (উদাহরণস্বরূপ এখান থেকে নেওয়া হয় )

ডোনাট

ভেরিয়েবলের মধ্যে কোনও নির্ভরতা আছে কি? এর জন্য আমরা আনোভা পরীক্ষা করি এবং দেখি যে পি-মানটি মাত্র 0.007 - এই ভেরিয়েবলগুলির মধ্যে কোনও সম্পর্ক নেই।

আর

t1 = c(164, 172, 168, 177, 156, 195)
t2 = c(178, 191, 197, 182, 185, 177)
t3 = c(175, 193, 178, 171, 163, 176)
t4 = c(155, 166, 149, 164, 170, 168)

val = c(t1, t2, t3, t4)
fac = gl(n=4, k=6, labels=c('type1', 'type2', 'type3', 'type4'))

aov1 = aov(val ~ fac)
summary(aov1)

আউটপুট হয়

            Df Sum Sq Mean Sq F value  Pr(>F)   
fac          3   1636   545.5   5.406 0.00688 **
Residuals   20   2018   100.9                   
---
Signif. codes:  0***0.001**0.01*0.05 ‘.’ 0.1 ‘ ’ 1

সুতরাং আমরা এখানেও পারস্পরিক সম্পর্কের পরিমাপ হিসাবে পি-মানটি নিতে পারি।

তথ্যসূত্র


1
বিস্তারিত জানার জন্য অ্যালেক্সিকে ধন্যবাদ। পলিসেরিয়াল এবং পলিক্লোরিক পারস্পরিক সম্পর্ক সম্পর্কে আরও গবেষণার ভিত্তিতে আমি খুঁজে পেয়েছি। এগুলির চেয়ে আপনার পদ্ধতির কীভাবে ভাল? দয়া করে ব্যাখ্যা দিন
জর্জঅফTheআরএফ

1
আমি এই বিষয়গুলি সম্পর্কে সচেতন নই, দুঃখিত।
আলেক্সি গ্রিগোরভ

@ অ্যালেক্সির তাত্পর্যপূর্ণ উত্তর answer আমি আপনার মন্তব্য পড়ার পরে অনলাইনে পলিটিক / পলিসারিজ সম্পর্কিত পড়ি read তারা দুটি পর্যবেক্ষক ভেরিয়েবল থেকে দুটি সুপ্ত ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক নির্ধারণের কৌশল technique আপনি যা চেয়েছিলেন সেটাই আমি মনে করি না এবং এটি আলেক্সির উত্তরের সাথে তুলনামূলক নয়।
কার্তিক এস

1
আপনার প্রথম উদাহরণ, বনাম শ্রেণীগত সম্পর্কে শ্রেণীগত নয় বরং এটি সংখ্যাসূচক বনাম শ্রেণীগত হয়, আসলে আপনি এ খুঁজছেন শহর বিরুদ্ধে পুরুষদের সংখ্যা (নারী যথাক্রমে) যা সংখ্যাসূচক হয়। শ্রেণিবদ্ধ বনাম শ্রেণিবদ্ধ হবে, বলুন, শহর বনাম চোখের বর্ণ বা আকার বা অন্য যে কোনও কিছু হতে পারে তবে কোনওভাবেই এটি লিঙ্গের প্রতিনিধির সংখ্যা হবে না।
জেনেট

1
@ অ্যালেক্সিগ্রিগরেভ যদি আমাদের তথ্য সাধারণত বিতরণ না kruskal-wallicকরা হয় তবে তার পরিবর্তে ব্যবহার করা উচিত one-way anova? আগাম ধন্যবাদ.
ইব্রাহিমী
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.