3-স্তরের आकस्मिक টেবিলটি মোকাবেলা করার উপযুক্ত উপায়


12

আমার কাছে একটি তিন স্তরের কন্টিনজেন্সি টেবিল রয়েছে, বেশ কয়েকটি প্রজাতির গণনা তথ্য, যে হোস্ট প্ল্যান্ট থেকে তারা সংগ্রহ করা হয়েছিল এবং সেই সংগ্রহটি কোনও বৃষ্টির দিনে ঘটেছিল কিনা (এটি আসলে গুরুত্বপূর্ণ!)। আর, জাল তথ্য ব্যবহার করা কিছু হতে পারে:

count    <- rpois(8, 10)
species  <- rep(c("a", "b"), 4)
host     <- rep(c("c","c", "d", "d"), 2)
rain     <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)


, , rain = 0

    species
host  a  b
   c 12 15
   d 10 13

, , rain = 1

    species
host  a  b
   c 11 12
   d 12  7

এখন, আমি দুটি জিনিস জানতে চাই: প্রজাতিগুলি কি হোস্ট গাছের সাথে যুক্ত? "বৃষ্টি বা না" এই সমিতি প্রভাবিত করে? আমি ব্যবহৃত loglm()থেকে MASSএই জন্য:

 # Are species independent to host plants, given the effect of rain?
loglm(~species + host + rain + species*rain + host*rain, data=my.table)

 # Given any relationship between host plants and species, does rain change it?
loglm(~species + host + rain + species*host)

এটি আমার স্বাচ্ছন্দ্যের সামান্য বাইরে, এবং আমি যাচাই করতে চেয়েছিলাম যে আমি মডেলগুলি ঠিকঠাকভাবে স্থাপন করেছি এবং এই প্রশ্নগুলির কাছে যাওয়ার জন্য এটিই সেরা উপায়।

উত্তর:


10

আপনার প্রথম প্রশ্নের ব্যাখ্যার জন্য দুটি উপায় রয়েছে যা আপনি এটি জিজ্ঞাসা করেছেন এমন দুটি উপায়ে প্রতিফলিত: "প্রজাতিগুলি কি হোস্ট গাছের সাথে যুক্ত?" এবং, "বৃষ্টিপাতের প্রভাবে প্রজাতিরা কি গাছপালা হোস্ট করার জন্য স্বাধীন?"

প্রথম ব্যাখ্যাটি যৌথ স্বাধীনতার একটি মডেলের সাথে সামঞ্জস্য করে , যা বলে যে প্রজাতি এবং হোস্টগুলি নির্ভরশীল, তবে বৃষ্টি হয়েছে কিনা তা নিয়ে যৌথভাবে স্বাধীন:

pshr=pshpr

যেখানে the এমন একটি সম্ভাবনা যা কোনও পর্যবেক্ষণ কোষে পড়ে যেখানে সূচী প্রজাতি, হোস্ট প্রকার এবং বৃষ্টিপাতের মান, the প্রান্তিক সম্ভাবনা কক্ষ যেখানে আমরা বৃষ্টিপাতের পরিবর্তনশীলের উপরে পড়ে এবং হ'ল বৃষ্টিপাতের প্রান্তিক সম্ভাবনা।pshr(s,h,r)shrpsh(s,h,)pr

দ্বিতীয় ব্যাখ্যাটি শর্তাধীন স্বাধীনতার একটি মডেলের সাথে সামঞ্জস্য করে , যা বলে যে প্রজাতি এবং হোস্টগুলি বৃষ্টি হয়েছে কিনা তা প্রদত্ত স্বাধীন:

psh|r=ps|rph|r বাpshr=psrphr/pr

যেখানে এর শর্তাধীন সম্ভাব্যতা সেল, একটি মান দেওয়া । ( s , h , r ) rpsh|r(s,h,r)r

আপনি এই মডেলগুলিকে আরে পরীক্ষা করতে পারেন ( loglinখুব ভাল কাজ করবে তবে আমি এর সাথে আরও পরিচিত glm):

count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence

উপরে, mod1যৌথ স্বাধীনতার mod2সাথে মিলে যায় এবং শর্তাধীন স্বাধীনতার mod0সাথে , যেখানে পারস্পরিক স্বাধীনতার মডেলটির সাথে । আপনি প্যারামিটারের প্রাক্কলনগুলি ইত্যাদি ব্যবহার করে দেখতে পারেন usual আপনার সরবরাহিত ডেটাগুলিতে নাল মডেলটি আসলে পর্যাপ্তভাবে ফিট করে।pshr=psphprsummary(mod2)

আপনার প্রথম প্রশ্নের কাছে যাওয়ার একটি ভিন্ন উপায় fisher.test(xtabs(count ~ host + species))হ'ল ফিশারের সঠিক পরীক্ষা ( ) ধসে পড়া 2x2 টেবিলের উপর (প্রথম ব্যাখ্যা) বা ম্যান্টেল-হেইনসেল পরীক্ষা ( mantelhaen.test(xtabs(count ~ host + species + rain))) 2-স্তরিত 2x2 টেবিলের জন্য বা স্ট্রাস্টিফিকেশনকে সম্মান করে এমন একটি ক্রমশক্তি পরীক্ষা লিখতে হবে (দ্বিতীয় ব্যাখ্যা)।

আপনার দ্বিতীয় প্রশ্নটি তুলে ধরতে, প্রজাতি এবং হোস্টের মধ্যে সম্পর্ক বৃষ্টি হয়েছে কিনা তার উপর নির্ভর করে?

mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)

পুরো মডেলটি mod4স্যাচুরেটেড, তবে আপনি mod3উপরে যেমনটি করেছেন ঠিক তেমন বিচ্যুতি দেখে আপনি প্রশ্নের প্রভাবটি পরীক্ষা করতে পারেন ।


ধন্যবাদ লকডফ, বিশেষত আমার নিজের চিন্তাভাবনাটি শর্তযুক্ত এবং যৌথ স্বাধীনতার মডেলের মধ্যে পার্থক্য বাছাই করতে সাহায্য করার জন্য
ডেভিড ডব্লিউ

1

লজিস্টিক রিগ্রেশন আপনার সমস্যার জন্য উপযুক্ত বলে মনে হচ্ছে। আপনি যে পরিবর্তনশীলটি ভবিষ্যদ্বাণী করতে চেষ্টা করছেন সেটি হ'ল সম্ভাবনা হ'ল কোনও পর্যবেক্ষণ (যা উভয় প্রজাতি এ বা প্রজাতি বি) হ'ল প্রজাতি এ। কোভেরিয়েটগুলি , এবং বিকল্পভাবে ।r a i n h o s t r a i nhostrainhostrain

আর কমান্ডটি হ'ল:

গ্ল্যাম (সূত্র = প্রজাতি ~ হোস্ট + বৃষ্টি, পরিবার = দ্বিপদী (লগইট), ওজন = গণনা)

এবং আপনি opালগুলির মূল্যগুলিতে আগ্রহী হবেন । মনে রাখবেন যে আপনি একাধিক অনুমান পরীক্ষা করছেন।p


1
লজিস্টিক রিগ্রেশন ঠিক আছে বলে মনে হচ্ছে তবে এতে সারি এবং কলামের মোটের অতিরিক্ত সীমাবদ্ধতা ঠিক করা হচ্ছে। পয়সন ডেটার ক্ষেত্রে এটি নাও হতে পারে। আমি বিশ্বাস করি উত্তরগুলি খুব বেশি পৃথক হবে না।
সানকুলসু

1

প্রাথমিকভাবে আমি veganপ্যাকেজ থেকে নিয়ন্ত্রিত কৌশলগুলির মধ্যে একটি চেষ্টা করার পরামর্শ দিয়েছিলাম , তবে দ্বিতীয় ভাবিতে আমি সন্দেহ করি যে এটি কার্যকর হবে, কারণ আপনার কাছে আসলে 2 টি आकस्मिक টেবিল রয়েছে। আমি আশা করি যে এই উদাহরণের দ্বিতীয় অংশ [পিডিএফ: আর বিক্ষোভ - শ্রেণিবদ্ধ বিশ্লেষণ] সহায়ক হবে।


লিঙ্কটি ভাঙ্গা ভাবেন, আপনি কি এখানে এই শ্রেণিবদ্ধ বোঝাতে চাইছেন ? এটি সহায়ক ছিল, ধন্যবাদ!
ডেভিড ডাব্লু

হ্যাঁ, দেখে মনে হচ্ছে যে URL- এর স্পেসটি এটি ভেঙে গেছে।
ইল্স
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.