এনএক্সএম কন্টিনজেন্সি টেবিলগুলির জন্য পরিসংখ্যান পরীক্ষা


12

আমার কাছে তিনটি গ্রুপের উপাদানগুলির সমন্বয়ে একটি ডেটাসেট রয়েছে, আসুন তাদের জি 1, জি 2 এবং জি 3 বলি। আমি এই উপাদানগুলির কয়েকটি বৈশিষ্ট্য বিশ্লেষণ করে এগুলিকে 3 ধরণের "আচরণ" টি 1, টি 2, এবং টি 3 তে ভাগ করেছি (এটি করার জন্য আমি ক্লাস্টার বিশ্লেষণ ব্যবহার করেছি)।

সুতরাং, এখন আমার কাছে একটি 3 এক্স 3 কন্টিনজেন্সি টেবিল রয়েছে তিনটি গ্রুপের উপাদানগুলির সংখ্যার সাথে টাইপ করে বিভক্ত:

      |    T1   |    T2   |    T3   |
------+---------+---------+---------+---
  G1  |   18    |   15    |   65    | 
------+---------+---------+---------+---
  G2  |   20    |   10    |   70    |
------+---------+---------+---------+---
  G3  |   15    |   55    |   30    |

এখন, আমি আর এই ডেটাগুলিতে একটি ফিশার পরীক্ষা চালাতে পারি

data <- matrix(c(18, 20, 15, 15, 10, 55, 65, 70, 30), nrow=3)
fisher.test(data)

এবং আমি পেতে

   Fisher's Exact Test for Count Data

data:  data 
p-value = 9.028e-13
alternative hypothesis: two.sided     

সুতরাং আমার প্রশ্নগুলি হ'ল:

  • এইভাবে ফিশার টেস্ট ব্যবহার করা কি সঠিক?

  • আমি কীভাবে জানতে পারি কে কার থেকে আলাদা? আমি কি পোস্ট-হক পরীক্ষা ব্যবহার করতে পারি? ডেটার দিকে তাকিয়ে আমি বলব 3 য় গ্রুপের প্রথম দুটি থেকে আলাদা আচরণ আছে, আমি কীভাবে এটি পরিসংখ্যান দেখাব?

  • কেউ আমাকে লগিত মডেলগুলির দিকে ইঙ্গিত করেছেন: তারা কি এই জাতীয় বিশ্লেষণের জন্য একটি কার্যকর বিকল্প?

  • এই জাতীয় ডেটা বিশ্লেষণের জন্য অন্য কোনও বিকল্প নেই?

আপনাকে অনেক ধন্যবাদ

নিকো

উত্তর:


13

প্রথমে আমি মনে করি যে ফিশার পরীক্ষাটি সঠিকভাবে ব্যবহৃত হয়েছে।

গণনা তথ্য লগ-লিনিয়ার মডেলগুলি (লগইট নয়, ফিটেড মানগুলি নীচে আবদ্ধ হয় তা নিশ্চিত করার জন্য) ব্যবহার করে আরও ভাল পরিচালনা করা হয়। আর এ আপনি উল্লেখ করতে পারেন family=poisson(যা ত্রুটিগুলি = পোইসন এবং লিঙ্ক = লগ সেট করে)। লগ লিঙ্কটি নিশ্চিত করে যে সমস্ত উপযুক্ত মানগুলি ধনাত্মক, যখন পইসন ত্রুটিগুলি ডেটাটি পূর্ণসংখ্যার এবং তারতম্যগুলির সাথে তারতম্যগুলির সত্যতা বিবেচনা করে। উদাহরণস্বরূপ glm(y~x,poisson)এবং মডেলটি লগ লিঙ্ক এবং পোইসন ত্রুটি (অ-স্বাভাবিকতার জন্য অ্যাকাউন্টে) দিয়ে সজ্জিত।

অতিরিক্ত বিতরণ আছে এমন ক্ষেত্রে (যদি পয়সন ত্রুটি অনুমান করা যথাযথ হয় তবে অবশেষের বিচ্যুতি স্বাধীনতার অবশিষ্টাংশের ডিগ্রির সমান হওয়া উচিত) quasipoisson, আপনি ত্রুটিযুক্ত পরিবার হিসাবে ব্যবহার করার পরিবর্তে , আপনি একটি নেতিবাচক দ্বিপদী মডেল ফিট করতে পারেন। (এটি glm.nbপ্যাকেজ থেকে ফাংশন জড়িত MASS)

আপনার ক্ষেত্রে আপনি নীচের মত কমান্ড ব্যবহার করে মডেলগুলি ফিট করতে এবং তুলনা করতে পারেন:

observed <- as.vector(data)
Ts<-factor(rep(c("T1","T2","T3"),each=3))
Gs<-factor(rep(c("G1","G2","G3"),3))

model1<-glm(observed~Ts*Gs,poisson)

#or and a model without the interaction terms
model2<-glm(observed~Ts+Gs,poisson)


#you can compare the two models using anova with a chi-squared test
anova(model1,model2,test="Chi")
summary(model1)

সর্বদা নিশ্চিত করুন যে আপনার ন্যূনতম মডেলটিতে সমস্ত উপদ্রব ভেরিয়েবল রয়েছে।

আমরা কীভাবে জানি যে কে কার থেকে আলাদা, এমন কিছু প্লট রয়েছে যা আপনাকে সাহায্য করতে পারে। আর ফাংশন assocplotএকটি অ্যাসোসিয়েশন প্লট তৈরি করে যা একটি দ্বি মাত্রিক কন্টিনজেন্সি টেবিলের মধ্যে সারি এবং কলামগুলির স্বাধীনতা থেকে বিচ্যুতি নির্দেশ করে।

মোজাইক প্লট হিসাবে একই ডেটা প্লট করা হয়েছে

mosaicplot(data, shade = TRUE)

আপনাকে ধন্যবাদ, আমার ঠিক এটি দরকার ছিল আপনি যখন অতিরিক্ত মাত্রায় কথা বলছেন তখন আপনি কী বোঝাতে চেয়েছিলেন তা সম্পর্কে আমি নিশ্চিতভাবে নিশ্চিত নই (দুঃখিত, আমি কোনও পরিসংখ্যানবিদ নই, সম্ভবত এটি খুব প্রাথমিক কিছু) ... আপনি বলে থাকেন যে অবশিষ্ট অব্যাহতাকে স্বাধীনতার অবশিষ্টাংশের সমান হতে হবে ... আমি কীভাবে এটি পরীক্ষা করব?
নিকো

আপনি summary(model1)Residual deviance: -2.7768e-28 on 0 degrees of freedom
দিলে আপনি এর

4

আপনি ব্যবহার করতে পারেন multinom MULTINOMIAL রিগ্রেশন জন্য nnet প্যাকেজ থেকে। পোস্ট-হক পরীক্ষা আপনি গাড়ী প্যাকেজ থেকে লিনিয়ারহাইপোথেসিস ব্যবহার করতে পারেন । আপনি লিনিয়ারহাইপোথেসিস (ওয়াল্ড পরীক্ষা) বা আনোভা (এলআর পরীক্ষা) ব্যবহার করে স্বাধীনতার পরীক্ষা পরিচালনা করতে পারেন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.