দ্বিপদী ডেটাতে আনোভা


32

আমি একটি পরীক্ষামূলক ডেটা সেট বিশ্লেষণ করছি। ডেটাতে চিকিত্সার ধরণ এবং দ্বিপদী ফলাফলের জোড়যুক্ত ভেক্টর রয়েছে:

Treatment    Outcome
A            1
B            0
C            0
D            1
A            0
...

ফলাফল কলামে, 1 একটি সাফল্য এবং 0 ব্যর্থতা নির্দেশ করে। আমি চিকিত্সা ফলাফল উল্লেখযোগ্যভাবে পরিবর্তিত হয় তা খুঁজে বের করতে চাই। প্রতিটি পরীক্ষার সাথে 4 টি পৃথক চিকিত্সা প্রচুর পরিমাণে পুনরাবৃত্তি হয় (প্রতিটি চিকিত্সার জন্য 2000)।

আমার প্রশ্ন হ'ল, আমি আনোভা ব্যবহার করে বাইনারি ফলাফল বিশ্লেষণ করতে পারি? বা দ্বিপদী ডেটা পরীক্ষা করার জন্য আমার কি চি-স্কোয়ার পরীক্ষা করা উচিত? দেখে মনে হচ্ছে চি-স্কোয়ার অনুপাতটি সমানভাবে বিভক্ত হবে, যা এটি নয়। আর একটি ধারণা হ'ল প্রতিটি চিকিত্সার জন্য ব্যর্থতা বনাম সাফল্যের অনুপাত ব্যবহার করে ডেটা সংক্ষিপ্ত করে এবং তারপরে একটি অনুপাত পরীক্ষা ব্যবহার করা।

আমি পরীক্ষাগুলির জন্য আপনার সুপারিশগুলি শুনতে আগ্রহী, যা এই ধরণের দ্বিপদী সাফল্য / ব্যর্থতা পরীক্ষার জন্য অর্থ দেয়।

উত্তর:


18

আনোভা না, যা সাধারণত বিতরণ করা ফলাফলের পরিবর্তনশীল (অন্যান্য জিনিসের মধ্যে) ধরে নেয় ass "পুরানো স্কুল" রূপান্তরগুলি বিবেচনা করার জন্য রয়েছে, তবে আমি লজিস্টিক রিগ্রেশনকে পছন্দ করব (যখন আপনার ক্ষেত্রে যেমন একটি মাত্র পৃথক ভেরিয়েবল থাকে তখন চি চি স্কোয়ারের সমতুল্য)। চি স্কোয়ার টেস্টে লজিস্টিক রিগ্রেশন ব্যবহারের সুবিধা হ'ল আপনি যদি সামগ্রিক পরীক্ষার (টাইপ 3) কোনও উল্লেখযোগ্য ফলাফল খুঁজে পান তবে চিকিত্সার নির্দিষ্ট স্তরের তুলনা করতে আপনি সহজেই একটি রৈখিক বিপরীতে ব্যবহার করতে পারেন। উদাহরণস্বরূপ এ বনাম বি, বি বনাম সি ইত্যাদি

আপডেট স্পষ্টতার জন্য যুক্ত করা হয়েছে:

হাতে হাতে ডেটা নেওয়া ( অ্যালিসন থেকে পোস্ট ডক ডেটা সেট করা ) এবং ভেরিয়েবল সিটগুলি নিম্নরূপে ব্যবহার করা, এটি আমার বক্তব্য ছিল:

postdocData$citsBin <- ifelse(postdocData$cits>2, 3, postdocData$cits)
postdocData$citsBin <- as.factor(postdocData$citsBin)
ordered(postdocData$citsBin, levels=c("0", "1", "2", "3"))
contrasts(postdocData$citsBin) <- contr.treatment(4, base=4) # set 4th level as reference
contrasts(postdocData$citsBin)
     #   1 2 3
     # 0 1 0 0
     # 1 0 1 0
     # 2 0 0 1
     # 3 0 0 0

# fit the univariate logistic regression model
model.1 <- glm(pdoc~citsBin, data=postdocData, family=binomial(link="logit"))

library(car) # John Fox package
car::Anova(model.1, test="LR", type="III") # type 3 analysis (SAS verbiage)
     # Response: pdoc
     #          LR Chisq Df Pr(>Chisq)
     # citsBin   1.7977  3     0.6154

chisq.test(table(postdocData$citsBin, postdocData$pdoc)) 
     # X-squared = 1.7957, df = 3, p-value = 0.6159

# then can test differences in levels, such as: contrast cits=0 minus cits=1 = 0
# Ho: Beta_1 - Beta_2 = 0
cVec <- c(0,1,-1,0)
car::linearHypothesis(model.1, cVec, verbose=TRUE) 

1
@ user2040। আমি বুঝতে পারি না আপনি "টাইপ 3" পরীক্ষাটি কীভাবে করবেন? এটি কি এসএএস সম্পর্কিত কিছু? (দুঃখিত আমার এসএএস জ্ঞান খুব সীমাবদ্ধ)। আপনার পরামর্শ অনুসারে আমি একটি লজিস্টিক রিগ্রেশন করতে পারতাম তবে 2 টি ডামি ভেরিয়েবল সহ। এছাড়াও, আমি সঠিকভাবে বুঝতে পেরেছি যে, আপনি যদি লজিস্টিক রিগ্রেশন করেন, পরীক্ষা করে কিছু বা সমস্ত সহগ 0 হয় তবে ডিভ্যান্স (বা সম্ভাবনা অনুপাত) দ্বারা সম্পন্ন হয় এবং এটি
অ্যাসিপোটোটিকভাবে

1
@ সানকুলসু: হ্যাঁ, ব্যবহারিকভাবে বলতে গেলে আপনারও একই উপসংহার পাওয়া উচিত। আমার "সমতুল্য" বলা উচিত ছিল না (আমি বড় ডেটা নিয়ে কাজ করি যাতে তারা একই রকম হয়)। আমি পরিষ্কার করতে সাহায্যের উত্তরে কিছু কোড যুক্ত করেছি।
বি_মিনার

8

Xkknkkkp^k=Xk/nk

g(p)=arcsinp

তবে কিছু আধুনিক লেখক আরকসিন রূপান্তর সম্পর্কে বেশ সংশয়বাদী, উদাহরণস্বরূপ দেখুন http://www.mun.ca/biology/dschneider/b7932/B7932Final10Dec2010.pdf তবে এই লেখকরা ভবিষ্যদ্বাণী হিসাবে সমস্যা নিয়ে উদ্বিগ্ন, যেখানে তারা দেখায় আরকসিন সমস্যার কারণ হতে পারে। আপনি যদি কেবল হাইপোথিসিস টেস্টিং নিয়েই উদ্বিগ্ন হন তবে তা ঠিক হওয়া উচিত। আরও আধুনিক পদ্ধতি লজিস্টিক রিগ্রেশন ব্যবহার করতে পারে।


4
(+1) ... সব গ্রুপে যদি একই নম্বর হয়। পর্যবেক্ষণ।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

1
অথবা পর্যবেক্ষণের সংখ্যার ভিত্তিতে ওজন ব্যবহার করতে পারেন।
কেজেটিল বি হালওয়ারসেন

3

আপনি চি-স্কয়ার পরীক্ষা সম্পর্কে যা ভাবেন তার থেকে আমি আলাদা হতে চাই। ডেটা দ্বিপদী না হলেও এটি প্রযোজ্য। এটি ম্লে এর অ্যাসিম্পোটিক স্বাভাবিকতার উপর ভিত্তি করে (বেশিরভাগ ক্ষেত্রে)।

আমি এটির মতো লজিস্টিক রিগ্রেশন করব:

logπ^1π^=β0+β1×D1+β2×D2

কোথায়

D1D2D1=D2=0A,D1=1,D2=0B,D1=1D2=1C

Ho:β0=β1=β2=0

আনোভা সমতুল্য যদি কোনও সম্পর্ক থাকে বা না থাকে।

Ho:β0=0

পরীক্ষাটি হ'ল এ এর ​​কিছু প্রভাব রয়েছে।

Ho:β1β0=0

পরীক্ষাটি কি বি এর কিছু প্রভাব রয়েছে।

Ho:β2(β0+β12)=0

পরীক্ষাটি কি সি এর কিছু প্রভাব রয়েছে।

আপনি কী আগ্রহী তা আমাদের জানতে এখন আপনি আরও বৈপরীত্য করতে পারেন এটি এখনও একটি চি-বর্গ পরীক্ষা, তবে স্বাধীনতার বিভিন্ন ডিগ্রি সহ (যথাক্রমে 3, 1, 1 এবং 1)


আমার এখনও এর বিপরীতে চিন্তা করা দরকার। আমি যখনই সময় পাব আমি এটি সংশোধন করব। সে সম্পর্কে দুঃখিত
সানকুলসু

-3

আমি মনে করি আপনি ঠিক বলেছেন যে দ্বিপাক্ষিক নির্ভরশীল পরিবর্তনশীল বিশ্লেষণের জন্য এএনওওএ ব্যবহার করা উচিত নয়। অনেকে বাইনারি প্রতিক্রিয়া পরিবর্তনশীল (0 1) এর মাধ্যমের তুলনা করতে এটি ব্যবহার করেন তবে এটি ব্যবহার করা উচিত নয় কারণ এটি গুরুত্ব সহকারে স্বাভাবিকতা এবং সমান বৈকল্পিক অনুমানকে লঙ্ঘন করে। এই-পরিস্থিতির জন্য চি-স্কোয়ার পরীক্ষা বা লজিস্টিক রিগ্রেশন সেরা।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.