2 এক্স 3 টেবিলটিতে কীভাবে একাধিক পোস্ট-হক চ-স্কোয়ার পরীক্ষা করা যায়?


9

আমার ডেটা সেটটি মোট তিনটি সাইটের ধরণের, ইনশোর, মিডচ্যানেল এবং অফশোর-তে মোট মৃত্যুর বা জীবের বেঁচে থাকার সমন্বয়ে গঠিত। নীচের সারণীতে নম্বরগুলি সাইটের সংখ্যা উপস্থাপন করে।

              100% Mortality            100% Survival
Inshore             30                       31 
Midchannel          10                       20 
Offshore             1                       10

আমি জানতে চাই যে সাইটগুলির ধরণের উপর ভিত্তি করে যেখানে 100% মৃত্যুর ঘটনা ঘটেছে সেখানে # টির সাইটগুলি উল্লেখযোগ্য কিনা। আমি যদি 2 x 3 চি-স্কোয়ার চালাই তবে আমি একটি উল্লেখযোগ্য ফলাফল পেয়েছি। এই যে পোস্ট-হকের পেয়ারাইজাইড তুলনা করা যেতে পারে যা আমি চালাতে পারি বা আমার আসলে একটি লজিস্টিকাল আনোভা বা দ্বিপদী বিতরণের সাথে রিগ্রেশন ব্যবহার করা উচিত? ধন্যবাদ!

উত্তর:


7

একটি आकस्मिक সারণীতে উভয় অক্ষের মধ্যে সমস্ত পারস্পরিক একচেটিয়া বিভাগ থাকা উচিত categories ইনশোর / মিডচ্যানেল / অফশোর ভাল দেখায়, তবে এই জৈবিক সেটিংয়ে "100% এর চেয়ে কম মৃত্যুর" অর্থ যদি না হয় তবে আপনি যে সমস্ত টেবিলগুলি পর্যবেক্ষণ করেছেন সেগুলির জন্য অ্যাকাউন্ট তৈরি করতে হবে বা আপনি কেন বিশ্লেষণকে চূড়ান্তভাবে সীমাবদ্ধ রাখবেন তা ব্যাখ্যা করতে পারে নমুনার শেষ।

যেহেতু 100% বেঁচে থাকার অর্থ 0% মৃত্যু, আপনার কাছে কলাম 100% = মৃত্যুকাল / 100%> মৃত্যুকাল> 0% / মৃত্যুকাল = 0% সহ একটি টেবিল থাকতে পারে। এক্ষেত্রে আপনি শতাংশের তুলনায় আর কোনও তুলনা করবেন না, তবে তিনটি সাইটের ধরণের বিভাগের মধ্যে সাধারণ মৃত্যুর ব্যবস্থার তুলনা করুন। (বিভাগগুলির পরিবর্তে মূল শতাংশের মানগুলি সম্পর্কে কী বলা যায়?) কৃসকল-ওয়ালিস পরীক্ষার একটি সংস্করণ এখানে উপযুক্ত হতে পারে যা বন্ধনগুলি যথাযথভাবে বিবেচনায় রাখে (সম্ভবত কোনও অনুমানের পরীক্ষা)।

কৃসকল-ওয়ালিস পরীক্ষার জন্য প্রতিষ্ঠিত পোস্ট হকের পরীক্ষা রয়েছে: 1 , 2, 3 । (একটি পুনরায় মডেলিং পদ্ধতির সাথে সম্পর্ক মোকাবেলা করতে সহায়তা করা যেতে পারে))

লজিস্টিক রিগ্রেশন এবং দ্বিপদী রিগ্রেশন আরও ভাল হতে পারে কারণ এগুলি কেবল আপনাকে পি মান দেয় না, তবে কার্যকর আকার এবং প্রভাবের আকারগুলির আস্থা অন্তরগুলিও দেয়। তবে এই মডেলগুলি সেট আপ করার জন্য 100%> মৃত্যুহার> 0% সাইট সম্পর্কিত আরও বিশদ প্রয়োজন।


4

আমি ধরে নিচ্ছি যে "100% টিকে থাকা" এর অর্থ আপনার সাইটের মধ্যে কেবল একটি একক জীব রয়েছে contained সুতরাং 30 এর মানে 30 টি প্রাণীর মৃত্যু হয়েছে, এবং 31 এর অর্থ 31 জীবানু হয়নি। এর উপর ভিত্তি করে চি-বর্গক্ষেত্রটি সূক্ষ্ম হওয়া উচিত, তবে কোনটি অনুমানটি ডেটা দ্বারা সমর্থন করে না তা কেবল তা বলে দেবে - দুটি যুক্তিসঙ্গত অনুমান আরও ভাল হয় কি না তা আপনাকে জানায় না। আমি একটি সম্ভাব্যতা বিশ্লেষণ উপস্থাপন করি যা এই তথ্যটি নিষ্কাশন করে - এটি চি-বর্গ পরীক্ষার সাথে একমত হয় তবে এটি আপনাকে চ-বর্গ পরীক্ষার চেয়ে আরও তথ্য দেয় এবং ফলাফল উপস্থাপনের আরও ভাল উপায়।

মডেলটি "মৃত্যুর" সূচকটির জন্য বার্নৌলি মডেল, ওয়াইআমি~বিআমিএন(1,θআমি) (আমি এর ঘরকে বোঝায় 2×3 টেবিল, এবং কক্ষের মধ্যে স্বতন্ত্র ইউনিটকে বোঝায়)।

চি-বর্গ পরীক্ষার অন্তর্নিহিত দুটি বৈশ্বিক ধারণা রয়েছে:

  1. টেবিলের একটি প্রদত্ত কক্ষের মধ্যে the θআমি সব সমান, যে θআমি=θআমি=θআমি
  2. দ্য ওয়াইআমি পরিসংখ্যানগতভাবে স্বাধীন, দেওয়া হয় θআমি। এর অর্থ হ'ল সম্ভাবনার পরামিতিগুলি আপনাকে সমস্ত কিছু বলেওয়াইআমি - অন্যান্য সমস্ত তথ্য অপ্রাসঙ্গিক যদি আপনি জানেন তবে θআমি

বোঝান এক্সআমি যোগফল হিসাবে ওয়াইআমি, (তাই) এক্স1=30,এক্স2=10,এক্স3=1) এবং যাক এনআমি গ্রুপ আকার হতে (তাই এন1=61,এন2=30,এন3=11)। এখন আমাদের পরীক্ষা করার একটি অনুমান আছে:

এইচএকজন:θ1=θ2,θ1=θ3,θ2=θ3

কিন্তু বিকল্প কি? আমি সমান বা সমান না অন্যান্য সম্ভাব্য সংমিশ্রণগুলি বলব।

এইচবি1:θ1θ2,θ1θ3,θ2=θ3
এইচবি2:θ1θ2,θ1=θ3,θ2θ3
এইচবি3:θ1=θ2,θ1θ3,θ2θ3
এইচসি:θ1θ2,θ1θ3,θ2θ3

উপরের "গ্লোবাল" অনুমানগুলি বিবেচনা করে এর মধ্যে একটি অনুমানকে সত্য হতে হবে। তবে মনে রাখবেন যে এর মধ্যে কোনওটিই হারের জন্য নির্দিষ্ট মান নির্দিষ্ট করে না - তাই তাদের অবশ্যই একীভূত করতে হবে। এখন যে দেওয়াHA সত্য, আমাদের কেবলমাত্র একটি প্যারামিটার রয়েছে (কারণ সমস্ত সমান) এবং ইউনিফর্ম পূর্ববর্তী একটি রক্ষণশীল পছন্দ, এটি এবং বিশ্বব্যাপী অনুমানগুলি দ্বারা চিহ্নিত I0। তাহলে আমাদের আছে:

P(X1,X2,X3|N1,N2,N3,HA,I0)=01P(X1,X2,X3,θ|N1,N2,N3,HA,I0)dθ
=(N1X1)(N2X2)(N3X3)01θX1+X2+X3(1θ)N1+N2+N3X1X2X3dθ
=(N1X1)(N2X2)(N3X3)(N1+N2+N3+1)(N1+N2+N3X1+X2+X3)

Which is a hypergeometric distribution divided by a constant. Similarly for HB1 we will have:

P(X1,X2,X3|N1,N2,N3,HB1,I0)=01P(X1,X2,X3,θ1θ2|N1,N2,N3,HB1,I0)dθ1dθ2
=(N2X2)(N3X3)(N1+1)(N2+N3+1)(N2+N3X2+X3)

You can see the pattern for the others. We can calculate the odds for say HAvsHB1 by simply dividing the above two expressions. The answer is about 4, which means the data support HA over HB1 by about a factor of 4 - fairly weak evidence in favour of equal rates. The other probabilities are given below.

Hypothesisprobability(HA|D)0.018982265(HB1|D)0.004790669(HB2|D)0.051620022(HB3|D)0.484155874(HC|D)0.440451171

This is showing strong evidence against equal rates, but not in strong evidence favour of a defintie alternative. It seems like there is strong evidence that the "offshore" rate is different to the other two rates, but inconclusive evidence as to whether "inshore" and "mid-channel" rates differ. This is what the chi-square test won't tell you - it only tells you that hypothesis A is "crap" but not what alternative to put in its place


1

চি স্কোয়ার টেস্টগুলি করার পাশাপাশি বিভিন্ন পরীক্ষার পরিসংখ্যান তৈরি করার কোড এখানে। তবে, টেবিল মার্জিনগুলির সংস্থার পরিসংখ্যানগত পরীক্ষাগুলি এখানে অকেজো; উত্তর সুস্পষ্ট। শীতের চেয়ে গ্রীষ্ম আরও গরম কিনা তা দেখার জন্য কোনও স্ট্যাটিস্টিকাল টেস্ট করে না।

Chompy<-matrix(c(30,10,1,31,20,10), 3, 2)
Chompy
chisq.test(Chompy)
chisq.test(Chompy, simulate.p.value = TRUE, B = 10000)
chompy2<-data.frame(matrix(c(30,10,1,31,20,10,1,2,1,2,1,2,1,2,3,1,2,3), 6,3))
chompy2
chompy2$X2<-factor(chompy2$X2) 
chompy2$X3<-factor(chompy2$X3)
summary(fit1<-glm(X1~X2+X3, data=chompy2, family=poisson))
summary(fit2<-glm(X1~X2*X3, data=chompy2, family=poisson)) #oversaturated
summary(fit3<-glm(X1~1, data=chompy2, family=poisson)) #null
anova(fit3,fit1)
library(lmtest)
waldtest(fit1)
waldtest(fit2) #oversaturated
kruskal.test(X1~X2+X3, data=chompy2)
kruskal.test(X1~X2*X3, data=chompy2)

3
পাঠক (এবং ওপি) এর জন্য আকর্ষণীয় হবে যদি আপনি প্রদত্ত বিভিন্ন আর সিনট্যাক্স (এবং অন্তর্নিহিত পরীক্ষাগুলি) সম্পর্কে বিশদ সরবরাহ করতে পারেন, এবং বিশেষত কীভাবে ক্রুসকল-ওয়ালিস পরীক্ষা লগ-লিনিয়ার মডেলের সাথে তুলনা করে।
chl

কোডটি অনুলিপি করে আর কনসোলে পেস্ট করে আপনি এটি দেখতে পারেন।
প্যাট্রিক ম্যাকক্যান

1
অবশ্যই। প্রতিক্রিয়াগুলি অবশ্যই কোড চালানোর মাধ্যমে নিজের কাছ থেকে আসে।
chl

0

আমি বিশ্বাস করি আপনি একাধিক তুলনা করার জন্য "একযোগে আত্মবিশ্বাসের অন্তর" ব্যবহার করতে পারেন। রেফারেন্সটি হলেন আগ্রেস্তি এট আল al দ্বিপদী প্যারামিটারগুলির তুলনা করার জন্য 2008 একযোগে আস্থা অন্তর inter বায়োমেট্রিকস 12 1270-1275।

আপনি http://www.stat.ufl.edu/~aa/cda/software.html এ সম্পর্কিত আর কোডটি পেতে পারেন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.