ব্যবহারিকভাবে বলতে গেলে, ডেটাগুলি বেশিরভাগ অনুমানের সাথে মেটাতে না পারলে লোকেরা কীভাবে আনোভা পরিচালনা করবে?


19

এটি কোনও কঠোর পরিসংখ্যানের প্রশ্ন নয় - আমি আনোভা অনুমান সম্পর্কে সমস্ত পাঠ্যপুস্তক পড়তে পারি - প্রকৃত কর্মী বিশ্লেষকরা কীভাবে এমন ডেটা পরিচালনা করেন যা অনুমানগুলি পুরোপুরি পূরণ করে না figure আমি এই সাইটে অনেকগুলি প্রশ্নের উত্তর খুঁজে পেয়েছি এবং আনোভা কখন ব্যবহার করবেন না (একটি বিমূর্ত, আদর্শিক গাণিতিক প্রসঙ্গে) বা আমি নীচে কিছু বর্ণনা করব সেগুলি সম্পর্কে আর পোস্টে আমি পোস্টগুলি সন্ধান করতে থাকি I I আমি প্রকৃতপক্ষে লোকেরা কী সিদ্ধান্ত নেয় এবং কেন তা জানার চেষ্টা করছি।

আমি চারটি গ্রুপে গাছের (প্রকৃত গাছ, পরিসংখ্যান গাছ নয়) গোষ্ঠীভুক্ত ডেটা নিয়ে বিশ্লেষণ চালাচ্ছি। আমি প্রতিটি গাছের জন্য প্রায় 35 টির জন্য গুণাবলীর জন্য ডেটা পেয়েছি এবং প্রতিটি বৈশিষ্ট্যের মধ্য দিয়ে যাচ্ছি যাতে এই বৈশিষ্ট্যের উপর গ্রুপগুলি উল্লেখযোগ্যভাবে পৃথক হয় কিনা determine তবে, বেশ কয়েকটি ক্ষেত্রে, আনোভা অনুমানগুলি সামান্য লঙ্ঘন করা হয়েছে কারণ বৈকল্পিকগুলি সমান নয় (আলফা = .05 ব্যবহার করে একটি লেভেনের পরীক্ষা অনুযায়ী)।

আমি এটি দেখতে পাচ্ছি, আমার বিকল্পগুলি হ'ল: ১. ডেটাটিকে রূপান্তরিত করুন এবং দেখুন যে এটি লেভেনের পি-ভালকে পরিবর্তন করে কিনা। ২. উইলকক্সনের মতো একটি নন-প্যারাম্যাট্রিক পরীক্ষা ব্যবহার করুন (যদি তা হয় তবে কোনটি?) ৩.অনোভা ফলাফলের সাথে কোনও ধরণের সংশোধন করে, বোনফেরনির মতো (আমি আসলে নিশ্চিত নই যে এর মতো কিছু আছে কিনা?) আমি প্রথম দুটি বিকল্প চেষ্টা করে দেখেছি এবং কিছুটা আলাদা ফলাফল পেয়েছি - কিছু ক্ষেত্রে একটি পদ্ধতির তাৎপর্যপূর্ণ এবং অন্যটি নয়। আমি পি-ভ্যালু ফিশিংয়ের ফাঁদে পড়ার ভয় পাচ্ছি এবং আমি এমন পরামর্শের সন্ধান করছি যা কোন পদ্ধতির ব্যবহারের ন্যায্যতা প্রমাণ করতে সহায়তা করবে।

আমি এমন কিছু জিনিসও পড়েছি যেগুলি বোঝায় যে হিটোরিসেসটাস্টিটি আনোভার পক্ষে সমস্যাটি এত বড় সমস্যা নয় যতক্ষণ না উপায় এবং রূপগুলি একে অপরের সাথে সংযুক্ত থাকে (যেমন তারা উভয়ই একসাথে বৃদ্ধি পায়), সুতরাং সম্ভবত আমি লেভিনের ফলাফলটিকে অগ্রাহ্য করতে পারি যদি না দেখি প্যাটার্নের মতো? যদি তা হয় তবে এর জন্য কি কোনও পরীক্ষা আছে?

পরিশেষে, আমার যুক্ত করা উচিত যে আমি পিয়ার-পর্যালোচিত জার্নালে প্রকাশের জন্য এই বিশ্লেষণটি করছি, সুতরাং আমি যেভাবেই পন্থা স্থির করি তা পর্যালোচকদের সাথে মিস্টার পাস করতে হবে। সুতরাং, যদি কেউ অনুরূপ, প্রকাশিত উদাহরণগুলির লিঙ্ক সরবরাহ করতে পারে যা চমত্কার হবে।


3
আপনি ব্যবহার করুন বা না করুন R, আমার উত্তরটি এখানে পড়তে আপনার পক্ষে উপকৃত হতে পারে: হেটেরোসেসটাস্টিক ডেটার জন্য একমুখী আনোভা বিকল্প , যা এই কয়েকটি বিষয় নিয়ে আলোচনা করে।
গুং - মনিকা পুনরায়

উত্তর:


18

আমি প্রকৃত কর্মক্ষম বিশ্লেষকরা কীভাবে এমন ডেটা পরিচালনা করেন যা অনুমানগুলি পুরোপুরি পূরণ করে না তা বের করার চেষ্টা করছি।

এটি আমার প্রয়োজনগুলির উপর নির্ভর করে, কোন অনুমানগুলি লঙ্ঘিত হয়, কোন উপায়ে, কতটা খারাপভাবে, কতটা প্রভাবকে প্রভাবিত করে এবং কখনও কখনও নমুনার আকারের উপর।

আমি চারটি গ্রুপের গাছ থেকে গোষ্ঠীভুক্ত ডেটা নিয়ে বিশ্লেষণ চালাচ্ছি। আমি প্রতিটি গাছের জন্য প্রায় 35 টির জন্য গুণাবলীর জন্য ডেটা পেয়েছি এবং প্রতিটি বৈশিষ্ট্যের মধ্য দিয়ে যাচ্ছি যাতে এই বৈশিষ্ট্যের উপর গ্রুপগুলি উল্লেখযোগ্যভাবে পৃথক হয় কিনা determine তবে, বেশ কয়েকটি ক্ষেত্রে, আনোভা অনুমানগুলি সামান্য লঙ্ঘন করা হয়েছে কারণ বৈকল্পিকগুলি সমান নয় (আলফা = .05 ব্যবহার করে একটি লেভেনের পরীক্ষা অনুযায়ী)।

1) যদি নমুনার আকারগুলি সমান হয় তবে আপনার খুব বেশি সমস্যা নেই। এনও সমান হলে বিভিন্ন রূপগুলিতে আনোভা বেশ (স্তরের-) মজবুত।

2) এটি বিভিন্ন ধরণের স্টাডিজের বিরুদ্ধে সুপারিশ করা হয়েছে কিনা তা ধরে নেওয়ার আগে সিদ্ধান্তের আগে বৈচিত্রের সাম্যতা পরীক্ষা করে নেওয়া। আপনি যদি সত্যই সন্দেহ করেন যে তারা সমান হয়ে উঠবেন তবে কেবল তারা অসম বলে ধরে নেওয়া ভাল।

কিছু উল্লেখ:

জিমারম্যান, ডিডাব্লু (2004),
"বৈচিত্রের সাম্যতার প্রাথমিক পরীক্ষার উপর একটি নোট।"
ব্রাউ। জে ম্যাথ। তাত্ক্ষণিকবাজার। Psychol। , মে ; 57 (pt 1): 173-81।
http://www.ncbi.nlm.nih.gov/pubmed/15171807

হেনরিক এখানে তিনটি রেফারেন্স দেয়

3) আপনার স্যাম্পলটি যথেষ্ট উল্লেখযোগ্য যে আপনাকে উল্লেখযোগ্যভাবে পৃথক হতে পারে তা বলার অপেক্ষা রাখে না তার চেয়ে প্রভাবের আকারটি গুরুত্বপূর্ণ। সুতরাং বড় নমুনাগুলিতে, লেভেনের পরীক্ষার দ্বারা বৈকল্পিকের একটি সামান্য পার্থক্য অত্যন্ত তাত্পর্যপূর্ণ দেখাবে, তবে এটির প্রভাবের মূলত কোনও ফল হবে না। যদি নমুনাগুলি বড় হয় এবং এফেক্ট আকার - বৈকল্পিকের অনুপাত বা বৈকল্পের পার্থক্য - তাদের হওয়া উচিত এর খুব কাছাকাছি হয়, তবে পি-মানটির কোনও ফল হয় না। (অন্যদিকে, ছোট নমুনাগুলিতে একটি দুর্দান্ত বড় পি-মান সামান্য স্বাচ্ছন্দ্যের E কোনওভাবেই পরীক্ষা সঠিক প্রশ্নের উত্তর দেয় না))

নোট করুন যে দুটি ওয়েল-নমুনা টি-টেস্টে যেমন রয়েছে, তেমনি আনোভাতে রেসিডুয়াল স্ট্যান্ডার্ড ত্রুটির অনুমান এবং ডিএফ-তে একটি ওয়েলচ-স্যাটার্থওয়েট টাইপের সমন্বয় রয়েছে।

  1. উইলকক্সনের মতো নন-প্যারাম্যাট্রিক পরীক্ষা ব্যবহার করুন (যদি তা হয় তবে কোনটি?)

আপনি যদি লোকেশন-শিফ্ট বিকল্পগুলিতে আগ্রহী হন তবে আপনি এখনও ধ্রুব স্প্রেড ধরে নিচ্ছেন। আপনি যদি আরও অনেক সাধারণ বিকল্পে আগ্রহী হন তবে সম্ভবত আপনি এটি বিবেচনা করতে পারেন; উইলকক্সন পরীক্ষার সমতুল্য কে-স্যাম্পল হ'ল ক্রুশকাল-ওয়ালিস পরীক্ষা।

আনোভা ফলাফলে এক ধরণের সংশোধন করুন

ওয়েলচ-স্যাটার্থওয়েট বিবেচনা করার জন্য আমার উপরের পরামর্শটি দেখুন, এটি 'ধরণের সংশোধন'।

(বিকল্পভাবে আপনি আপনার এএনওওয়াকে জোড়ের মতো ওয়েলচ-টাইপ টি-টেস্টের সেট হিসাবে নিক্ষেপ করতে পারেন, সেক্ষেত্রে আপনি সম্ভবত কোনও বনফেরোনি বা অনুরূপ কিছু সন্ধান করতে চান)

আমি এমন কিছু জিনিসও পড়েছি যা বোঝায় যে হিটোরিসেসটাস্টিটি আনোভার পক্ষে সমস্যাটি এতটা বড় নয় যতক্ষণ না উপায় এবং রূপগুলি পরস্পর সম্পর্কিত হয় (অর্থাত তারা উভয়ই একসাথে বৃদ্ধি করে)

আপনাকে এরকম কিছু উদ্ধৃত করতে হবে। টি-টেস্ট নিয়ে বেশ কয়েকটি পরিস্থিতির দিকে নজর রেখে, আমি মনে করি এটি স্পষ্টভাবে সত্য নয়, তাই আমি কেন দেখতে চাই তা দেখতে চাই like সম্ভবত পরিস্থিতি কোনওভাবেই সীমাবদ্ধ। এটি যদি ঘটনাটি হত তবে এটি দুর্দান্ত হবে কারণ প্রায়শই সাধারণ রৈখিক মডেলগুলি সেই পরিস্থিতিতে সহায়তা করতে পারে।

পরিশেষে, আমার যুক্ত করা উচিত যে আমি পিয়ার-পর্যালোচিত জার্নালে প্রকাশের জন্য এই বিশ্লেষণটি করছি, সুতরাং আমি যেভাবেই পন্থা স্থির করি তা পর্যালোচকদের সাথে মিস্টার পাস করতে হবে।

আপনার পর্যালোচকদের সন্তুষ্ট হতে পারে কি তা ভবিষ্যদ্বাণী করা খুব কঠিন। আমাদের বেশিরভাগ গাছ নিয়ে কাজ করে না।


12

এটা আসলে সাধারণ লিনিয়ার মডেলগুলিতে (যেমন, এক- বা দ্বিমুখী আনোভা-জাতীয় মডেলগুলি) হিটারোসেসডাস্টিক্যালিটি পরিচালনা করা খুব কঠিন নয় difficult

আনোভা দৃ Rob়তা

প্রথমত, যেমন অন্যদের মন্তব্য রয়েছে, আনোভা সমান বৈকল্পিকগুলির ধারণা থেকে বিচ্যুত হওয়ার জন্য আশ্চর্যজনকভাবে শক্তিশালী, বিশেষত যদি আপনার প্রায় ভারসাম্যপূর্ণ ডেটা থাকে (প্রতিটি গ্রুপে সমান পর্যবেক্ষণের সংখ্যা)। অন্যদিকে সমান বৈকল্পিকের প্রাথমিক পরীক্ষাগুলি হয় না (যদিও পাঠ্যপুস্তকগুলিতে সাধারণত পড়াশুনা করা এফ- টেষ্টের চেয়ে লেভেনের পরীক্ষা অনেক ভাল )। জর্জ বক্স যেমন লিখেছেন:

বৈকল্পিক ক্ষেত্রে প্রাথমিক পরীক্ষা করা সমুদ্রের নৌকায় বন্দরের ছেড়ে যাওয়ার জন্য পরিস্থিতি পর্যাপ্ত পরিমাণে শান্ত কিনা তা অনুসন্ধান করার জন্য একটি রোয়িং নৌকায় সমুদ্রে নামার মতো!

যদিও এনোভা খুব শক্তিশালী, কারণ হিটারোসেসড্যাটিকটি বিবেচনায় নেওয়া খুব সহজ, এটি না করার খুব কম কারণ আছে।

নন-প্যারামেট্রিক পরীক্ষা

যদি আপনি প্রকৃত অর্থে পার্থক্যে আগ্রহী হন , তবে প্যারামিমেট্রিকবিহীন পরীক্ষাগুলি (উদাহরণস্বরূপ, ক্রুসকল – ওয়ালিস পরীক্ষা) আসলেই কোনও কাজে আসে না। তারা দলের মধ্যে পার্থক্য পরীক্ষা করে, কিন্তু তারা তা করে না মানে সাধারণ পরীক্ষা পার্থক্য হবে।

উদাহরণ ডেটা

আসুন ডেটাগুলির একটি সাধারণ উদাহরণ তৈরি করা যাক যেখানে কেউ আনোভা ব্যবহার করতে চান তবে যেখানে সমান পরিবর্তনের অনুমানটি সত্য নয়।

set.seed(1232)
pop = data.frame(group=c("A","B","C"),
                 mean=c(1,2,5),
                 sd=c(1,3,4))
d = do.call(rbind, rep(list(pop),13))
d$x = rnorm(nrow(d), d$mean, d$sd)

আমাদের দুটি গ্রুপ রয়েছে, উভয় মাধ্যম এবং বৈকল্পিক (স্পষ্ট) পার্থক্য সহ:

stripchart(x ~ group, data=d)

স্ট্রিপচার্ট উদাহরণস্বরূপ ডেটা দেখাচ্ছে।

ANOVA

অবাক হওয়ার মতো বিষয় নয়, একটি সাধারণ আনোভা এটিকে বেশ ভালভাবে পরিচালনা করে:

> mod.aov = aov(x ~ group, data=d)
> summary(mod.aov)
            Df Sum Sq Mean Sq F value  Pr(>F)    
group        2  199.4   99.69   13.01 5.6e-05 ***
Residuals   36  275.9    7.66                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

সুতরাং, কোন গ্রুপ পৃথক? আসুন টুকির এইচএসডি পদ্ধতিটি ব্যবহার করুন:

> TukeyHSD(mod.aov)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = x ~ group, data = d)

$group
        diff        lwr      upr     p adj
B-A 1.736692 -0.9173128 4.390698 0.2589215
C-A 5.422838  2.7688327 8.076843 0.0000447
C-B 3.686146  1.0321403 6.340151 0.0046867

একটি সঙ্গে পি 0.26 এর -value, আমরা গ্রুপ A এবং B. এমনকি যদি আমরা কোন পার্থক্য (মানে) দাবি করতে পারবেন না করা হয়নি যে অ্যাকাউন্টটি আমরা তিনটি তুলনা করেনি নিতে, আমরা একটি কম না পেতে হবে পি - মান ( পি  = 0.12):

> summary.lm(mod.aov)
[…]
Coefficients:
            Estimate Std. Error t value  Pr(>|t|)    
(Intercept)   0.5098     0.7678   0.664     0.511    
groupB        1.7367     1.0858   1.599     0.118    
groupC        5.4228     1.0858   4.994 0.0000153 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.768 on 36 degrees of freedom

তা কেন? চক্রান্ত উপর ভিত্তি করে, সেখানে হয় একটি প্রশংসনীয় স্পষ্ট পার্থক্য। কারণটি হ'ল আনোভা প্রতিটি গোষ্ঠীতে সমান বৈকল্পিকতা গ্রহণ করে এবং ২. in in এর একটি সাধারণ স্ট্যান্ডার্ড বিচ্যুতিটি summary.lmটেবিলের 'রেসিডুয়াল স্ট্যান্ডার্ড ত্রুটি হিসাবে দেখানো হয়' বা অনুমানের গড় বর্গক্ষেত্রের বর্গমূল গ্রহণ করে আপনি এটি পেতে পারেন (.6..66) আনোভা টেবিলে)।

তবে গ্রুপ এ এর ​​একটি (জনসংখ্যা) স্ট্যান্ডার্ড বিচ্যুতি রয়েছে এবং এটি ২.77 ove এর অতিমাত্রায় পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফল পাওয়া (অকারণে) কঠিন করে তোলে, যেমন আমাদের (খুব) কম শক্তি নিয়ে একটি পরীক্ষা রয়েছে।

অসম বৈকল্পিক সহ 'আনোভা'

সুতরাং, কীভাবে একটি উপযুক্ত মডেল ফিট করতে হবে, এমন একটি যা বৈকল্পিকগুলির মধ্যে পার্থক্য বিবেচনা করে? এটি আর এ সহজ:

> oneway.test(x ~ group, data=d, var.equal=FALSE)
    One-way analysis of means (not assuming equal variances)

data:  x and group
F = 12.7127, num df = 2.000, denom df = 19.055, p-value = 0.0003107

সুতরাং, আপনি যদি সমান বৈকল্পিকতা ধরে না রেখে আর-তে একটি সাধারণ একমুখী 'আনোভা' চালাতে চান তবে এই ফাংশনটি ব্যবহার করুন। এটি t.test()অসম বৈকল্পিক সহ দুটি নমুনার জন্য মূলত (ওয়েলচ) একটি বর্ধিতাংশ ।

দুর্ভাগ্যবশত, এটা সাথে কাজ করে না TukeyHSD()(অথবা অন্যান্য অধিকাংশ ফাংশন আপনি ব্যবহার aovবস্তু), আমরা, তাই এমনকি যদি নিশ্চিত সেখানে হয় গ্রুপ পার্থক্য, আমরা জানি না যেখানে তারা হয়।

হেটেরোসেসটাস্টিটির মডেলিং

সর্বোত্তম সমাধান হ'ল রূপগুলি স্পষ্টভাবে মডেল করা। আর এটি খুব সহজ:

> library(nlme)
> mod.gls = gls(x ~ group, data=d,
                weights=varIdent(form= ~ 1 | group))
> anova(mod.gls)
Denom. DF: 36 
            numDF  F-value p-value
(Intercept)     1 16.57316  0.0002
group           2 13.15743  0.0001

এখনও অবশ্যই উল্লেখযোগ্য পার্থক্য। তবে এখন গোষ্ঠী A এবং B এর মধ্যে পার্থক্যগুলিও স্থিতিশীলভাবে তাত্পর্যপূর্ণ হয়ে উঠেছে ( পি  = 0.025):

> summary(mod.gls)
Generalized least squares fit by REML
  Model: x ~ group
  […]
Variance function:
 Structure: Different standard
            deviations per stratum
 Formula: ~1 | group 
 Parameter estimates:
       A        B        C 
1.000000 2.444532 3.913382 

Coefficients:
               Value Std.Error  t-value p-value
(Intercept) 0.509768 0.2816667 1.809829  0.0787
groupB      1.736692 0.7439273 2.334492  0.0253
groupC      5.422838 1.1376880 4.766542  0.0000
[…]
Residual standard error: 1.015564 
Degrees of freedom: 39 total; 36 residual

সুতরাং একটি উপযুক্ত মডেল ব্যবহার সাহায্য করে! এছাড়াও নোট করুন যে আমরা (আপেক্ষিক) স্ট্যান্ডার্ড বিচ্যুতির অনুমান পাই get গ্রুপ এ এর ​​জন্য অনুমিত স্ট্যান্ডার্ড বিচ্যুতি, ফলাফলগুলির নীচে পাওয়া যাবে, 1.02। গ্রুপ বি এর আনুমানিক স্ট্যান্ডার্ড বিচ্যুতি এর থেকে 2.44 গুণ বা 2.48 গুণ এবং গ্রুপ সি এর আনুমানিক মান বিচ্যুতি একইভাবে 3.97 ( intervals(mod.gls)বি এবং সি গ্রুপের আপেক্ষিক স্ট্যান্ডার্ড বিচ্যুতির জন্য আত্মবিশ্বাসের অন্তর পেতে টাইপ )।

একাধিক পরীক্ষার জন্য সংশোধন করা হচ্ছে

তবে একাধিক পরীক্ষার জন্য আমাদের সত্যই সংশোধন করা উচিত। এটি 'মাল্টকম্প' লাইব্রেরিটি ব্যবহার করা সহজ। দুর্ভাগ্যক্রমে, এটি 'gls' অবজেক্টের জন্য অন্তর্নির্মিত সমর্থন করে না, তাই আমাদের প্রথমে কিছু সহায়ক ফাংশন যুক্ত করতে হবে:

model.matrix.gls <- function(object, ...)
    model.matrix(terms(object), data = getData(object), ...)
model.frame.gls <- function(object, ...)
  model.frame(formula(object), data = getData(object), ...)
terms.gls <- function(object, ...)
  terms(model.frame(object),...)

এখন কাজ করা যাক:

> library(multcomp)
> mod.gls.mc = glht(mod.gls, linfct = mcp(group = "Tukey"))
> summary(mod.gls.mc)
[…]
Linear Hypotheses:
           Estimate Std. Error z value Pr(>|z|)    
B - A == 0   1.7367     0.7439   2.334   0.0480 *  
C - A == 0   5.4228     1.1377   4.767   <0.001 ***
C - B == 0   3.6861     1.2996   2.836   0.0118 *  

এখনও গ্রুপ এ এবং গ্রুপ বিয়ের মধ্যে পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পার্থক্য! Group এবং আমরা এমনকি গ্রুপের মধ্যে পার্থক্যের জন্য আত্মবিশ্বাসের অন্তর অন্তর পেতে পারি:

> confint(mod.gls.mc)
[…]
Linear Hypotheses:
           Estimate lwr     upr    
B - A == 0 1.73669  0.01014 3.46324
C - A == 0 5.42284  2.78242 8.06325
C - B == 0 3.68615  0.66984 6.70245

আনুমানিক (ঠিক এখানে) সঠিক মডেল ব্যবহার করে আমরা এই ফলাফলগুলিতে বিশ্বাস রাখতে পারি!

নোট করুন যে এই সাধারণ উদাহরণের জন্য, গ্রুপ সি এর ডেটা সত্যই গ্রুপ এ এবং বি এর মধ্যে পার্থক্য সম্পর্কে কোনও তথ্য যুক্ত করে না, যেহেতু আমরা প্রতিটি গ্রুপের জন্য পৃথক উপায় এবং স্ট্যান্ডার্ড বিচ্যুতি উভয়কেই মডেল করি। আমরা কেবল একাধিক তুলনার জন্য সংশোধন করা টিয়ারসাইট টি- টেস্ট ব্যবহার করতে পারি:

> pairwise.t.test(d$x, d$group, pool.sd=FALSE)
    Pairwise comparisons using t tests with non-pooled SD 

data:  d$x and d$group 

  A       B      
B 0.03301 -      
C 0.00098 0.02032

P value adjustment method: holm 

তবে আরও জটিল মডেলগুলির জন্য, উদাহরণস্বরূপ, দ্বি-মুখী মডেল বা অনেক ভবিষ্যদ্বাণীকারী সহ রৈখিক মডেলগুলির জন্য, জিএলএস (জেনারেলাইজড ন্যূনতম স্কোয়ারস) ব্যবহার করে এবং স্পষ্টতই ভেরিয়েন্স ফাংশনগুলির মডেলিং সেরা সমাধান।

এবং বৈকল্পিক ক্রিয়াটি প্রতিটি গ্রুপে কেবল আলাদা ধ্রুবক হওয়া উচিত নয়; আমরা এটির উপর কাঠামো চাপিয়ে দিতে পারি। উদাহরণস্বরূপ, আমরা প্রতিটি গ্রুপের গড়ের শক্তি হিসাবে প্রকরণটি মডেল করতে পারি (এবং এইভাবে কেবলমাত্র একটি প্যারামিটার, এক্সপোনেন্টটি অনুমান করা প্রয়োজন ), অথবা সম্ভবত মডেলের কোনও ভবিষ্যদ্বাণীকের লগারিদম হিসাবে। জিএলএস (এবং gls()আর মধ্যে) এর মাধ্যমে এগুলি খুব সহজ ।

সাধারণীকরণের সর্বনিম্ন স্কোয়ারগুলি হ'ল আইএমএইচও হ'ল একটি খুব কম ব্যবহৃত স্ট্যাটিস্টিকাল মডেলিং কৌশল। মডেল অনুমানগুলি থেকে বিচ্যুতির বিষয়ে চিন্তা করার পরিবর্তে সেই বিচ্যুতির মডেল করুন !


1
উত্তরের জন্য ধন্যবাদ! অসম বৈকল্পিক আনোভা (ওয়েলচ আনোভা) এর জন্য ওয়ানওয়েস্টেস্ট () এবং জিএলএস () থেকে ফলাফল সম্পর্কে আমি বুঝতে পারি না। ওয়ানওয়েস্টেস্টের () এর পি মান হ'ল পি-মান = 0.0003107। তবে gls (x ~ গ্রুপ, ডেটা = ডি, ওয়েট = ভারিডেন্ট (ফর্ম = ~ 1 | গোষ্ঠী)) থেকে প্রাপ্ত পি মানটি 0.0001। এই দুটি ফলাফল পৃথক কেন?
ডাব্লুসিএমসি

2
একাধিক পরীক্ষার সংশোধন নিয়ে ক্রমবর্ধমান উদ্বেগ রয়েছে, আমি মনে করি যে তুলনামূলক সংখ্যার সাথে আপনি করেছেন অপরিশোধিত পি-মানগুলি প্রতিবেদন করা আরও স্বচ্ছ। বিশেষত যেহেতু আর-তে পরীক্ষা করার সময় আপনি প্রতিটি যুগের তুলনায় আগ্রহী নাও হতে পারেন, তাই কোনও আগ্রহের নয় এমন তুলনা বিবেচনায় নিয়ে সংশোধন করা হবে।
নাকেক্স

7
  1. সত্যিই আপনার ডেটার এমন কিছু রূপান্তর হতে পারে যা গ্রহণযোগ্যভাবে স্বাভাবিক বিতরণ তৈরি করে। অবশ্যই, এখন আপনার অনুক্রমটি রূপান্তরিত ডেটা সম্পর্কে, পরিবর্তিত ডেটা নয়।

  2. ধরে নিই যে আপনি একদিক আনোভা সম্পর্কে কথা বলছেন, ক্রুশকাল -ওয়ালিস পরীক্ষা ওয়ানওয়ে আনোভা -র উপযুক্ত ননপ্যারমেট্রিক অ্যানালগ। ডানের পরীক্ষা (বাগান-জাতের র‌্যাঙ্কের সমষ্টি পরীক্ষা নয়) সম্ভবত এই পোস্ট- জোড়-ভিত্তিক একাধিক তুলনার জন্য উপযুক্ত সবচেয়ে সাধারণ ননপ্যারমেট্রিক পরীক্ষা , যদিও কনভারার-ইমান পরীক্ষার মতো অন্যান্য পরীক্ষা রয়েছে (প্রত্যাখ্যানের পরে ডানের পরীক্ষার চেয়ে কঠোরভাবে আরও শক্তিশালী) কুরস্কাল-ওয়ালিস), এবং দ্বাস-স্টিল-ক্রিচটলো-ফ্লাইনার পরীক্ষা।

  3. α

আনোভা গ্রুপের মধ্যে এবং গ্রুপ বৈকল্পের মধ্যে অনুপাতের ভিত্তিতে তৈরি। এই প্রসঙ্গে আপনি ভিন্ন ভিন্নতা বলতে কী বোঝাতে চেয়েছেন তা সম্পূর্ণরূপে আমি নিশ্চিত নই, তবে আপনি যদি গ্রুপগুলির মধ্যে অসম বৈকল্পিক বলতে চান তবে এটি আমার মনে হবে পরীক্ষার নাল অনুমানের যুক্তিটি মৌলিকভাবে ভেঙে ফেলবে।

আপনার শৃঙ্খলা থেকে একটি সাধারণ পদ সহ "ডান পরীক্ষা" এর জন্য একটি সাধারণ গুগল স্কলার ক্যোয়ারির প্রচুর প্রকাশিত উদাহরণগুলি ফিরে আসা উচিত।


তথ্যসূত্র

কনভার, ডব্লিউজে এবং ইমান, আরএল (1979) একাধিক তুলনা পদ্ধতিতে । প্রযুক্তিগত প্রতিবেদন এলএ -7677-এমএস, লস আলামোস বৈজ্ঞানিক পরীক্ষাগার।

ক্রিচটলো, ডিই এবং ফ্লাইনার, এমএ (1991)। বৈকল্পিকের একমুখী বিশ্লেষণে বিতরণ-মুক্ত একাধিক তুলনাপরিসংখ্যানগুলিতে যোগাযোগ — তত্ত্ব ও পদ্ধতি , 20 (1): 127।

ডান, ওজে (1964)। র‌্যাঙ্কের যোগফল ব্যবহার করে একাধিক তুলনাটেকনোমেট্রিক্স , 6 (3): 241-252।


2
ঠিক আছে, এই উত্তরের জন্য ধন্যবাদ, তবে আপনি কী বলছেন তা সম্পর্কে আমি সম্পূর্ণ পরিষ্কার নই। যতদূর 'হেটেরোসেসটাস্টিটি' হিসাবে আমি ভেবেছিলাম আমি এই শব্দটি সাধারণ অর্থে ব্যবহার করছি: "এলোমেলো ভেরিয়েবলগুলির সংকলন হ'ল উপ-জনগোষ্ঠীর অন্যের থেকে ভিন্ন ভিন্নতা রয়েছে Here পরিসংখ্যান বিচ্ছুরণের অন্য কোনও পদক্ষেপ "" - উইকিপিডিয়া। আমার ডেটাতে উপ-গোষ্ঠীর রূপগুলি অসম (লেভেনের পরীক্ষা অনুসারে) তাই আমি এগুলি হেটেরোসেসটাস্টিক হিসাবে বর্ণনা করেছি। এটা কি ঠিক না?
জেস সর্বাধিক

1
আমি আসলে যা আলোচনা করার চেষ্টা করছি তা হ'ল পাঠ্যপুস্তকের পরিসংখ্যান এবং বাস্তব বিশ্বের মধ্যে ব্যবধান। প্রতিটি পাঠ্যপুস্তক বলছে "আনোভা-র ক্ষেত্রে অবশ্যই বৈচিত্রগুলি সমান হতে হবে" তবে অবশ্যই সেগুলি কখনই নয়। সুতরাং, আমরা কি নির্বিচারে একটি নির্দিষ্ট বিন্দুতে কাট অফ এবং একটি ভিন্ন পরীক্ষায় স্যুইচ করি - যদি তাই হয় তবে কোন পর্যায়ে? আমার ক্ষেত্রে (উদ্ভিদ জীববিজ্ঞান) বেশিরভাগ লোকেরা তাদের চিন্তাভাবনা না করে ব্যবহার করার জন্য প্রশিক্ষণ প্রাপ্ত যা কিছু পরীক্ষা করে থাকেন। আমি তাতে সত্যই সন্তুষ্ট নই। আমি পরিসংখ্যানগুলির ব্যবহারিক 'ব্যবহার সম্পর্কে আলোচনা করা বই / ওয়েবসাইটগুলির জন্য এমন কোনও পরামর্শ পছন্দ করবো - কখন কোন পরীক্ষাটি কখন ব্যবহার করতে হবে এবং কেন। ডান এর পরামর্শের জন্য ধন্যবাদ, যে সাহায্য করে।
জেস ম্যাক্স

2
আহ, সমান পরিবর্তনের অনুমান হ'ল জনসংখ্যার বৈচিত্রগুলি নমুনার বৈকল্পগুলি নয়। আপনি অনুমান করতে পারেন যে জনসংখ্যার বৈচিত্রগুলি সমান ... চোখের বল পরীক্ষার মাধ্যমে বা অন্য কেউ বলে, স্ট্যাটিস্টিকাল টেস্টের মাধ্যমে।
অ্যালেক্সিস

1
নমুনা বৈকল্পিকতা মূল্যায়ন না করে আপনি জনসংখ্যার প্রকরণ সম্পর্কে কীভাবে কিছু জানেন? আমি কোনও লেভেনের পরীক্ষার পি-ভ্যালকে ব্যাখ্যা করি "জনসংখ্যার বৈধতা সমান বলে ধরে নিচ্ছি, আপনার নমুনার বৈচিত্রগুলি এর চেয়ে আরও কতটা পৃথক হতে পারে তার প্রতিক্রিয়াগুলি কী" " যদি আমি কম পি-ভাল পাই তবে জনসংখ্যার বৈচিত্রগুলি সমান এবং আনোভা ব্যবহার করতে পারছে না এমন অনুমানটি আমি প্রত্যাখ্যান করি। কৃষকল-ওয়ালেস একটি ভাল বিকল্প বলে মনে হচ্ছে, তবে আনোভা অনুমানগুলি পূরণের জন্য ডেটা রুপান্তর করা আরও ভাল এবং যদি তাই হয় কেন?
জেস ম্যাক্স

1
এছাড়াও, লেভেনের পরীক্ষা, পি <.05 এই সিদ্ধান্তের জন্য উপযুক্ত পরীক্ষা এবং কাট অফ? ওব্রায়নের কী, বার্টলেট-এর ... এই পরীক্ষার ফলাফলগুলি যথেষ্ট পরিমাণে পৃথক হতে পারে এবং কোনটি ব্যবহার করতে হবে তা আমি সত্যিই জানি না - তাই আমি লেভেনের সাথে যাচ্ছি কারণ এটি মনে হয় এটি সবচেয়ে রক্ষণশীল। তবে সম্ভবত এটি অত্যধিক দক্ষতা - সম্ভবত আনোভা ত্যাগ করার পক্ষে খুব তাড়াতাড়ি হয়ে, আমি এমন একটি পরীক্ষায় যাচ্ছি যা অকারণে আমার বিশ্লেষণের পরিসংখ্যানিক শক্তি হ্রাস করে।
জেস সর্বাধিক

1

এটি আমার কাছে মনে হচ্ছে যেন আপনি পদক্ষেপটি করছেন এবং আপনার যথাসাধ্য চেষ্টা করছেন তবে আপনার উদ্বেগগুলি অতীতের আপনার কাগজটি পেতে যথেষ্ট চেষ্টা করবে না বলে শঙ্কিত are খুব বাস্তব সমস্যা। আমি মনে করি যে সমস্ত গবেষকরা এমন বিশ্লেষণগুলির সাথে লড়াই করে যা সময়ে সময়ে সীমান্তরেখা বা এমনকি খোলামেলা ভাঙা অনুমান হিসাবে উপস্থিত হয়। সর্বোপরি লক্ষ লক্ষ নিবন্ধ রয়েছে যেমন প্রতিটি গ্রুপে 6 - 7 ইঁদুর জাতীয় কিছু দিয়ে ইঁদুর 3 টি ছোট গ্রুপে চিকিত্সার প্রভাবগুলির মূল্যায়ন করে। আনোভা অনুমানগুলি যেমন একটি কাগজে সন্তুষ্ট কিনা তা কীভাবে জানবেন!

আমি বিশেষত কার্ডিওভাসকুলার প্যাথোফিজিওলজি ক্ষেত্রে প্রচুর পরিমাণে কাগজপত্র পর্যালোচনা করেছি এবং আমি যে নিবন্ধটি পড়েছি তাতে ডেটাতে বিশ্বাস রাখতে পারি কিনা তা আমি কখনই নিশ্চিত মনে করি না। কিন্তু আমার জন্য একটি সমালোচক হিসেবে আমি আসলে মনে করেন যে বিষয় এ arise তে পারে ঝোঁক তাই সব পরে, পুরো ডেটা সেটটি গড়া হতে পারে এবং আমি কখনোই would - বিজ্ঞান অনেক মাত্রা পরিসংখ্যান গভীরে খুব খনন সম্ভবত সামান্য বিন্দু নেই এক মিলিয়ন বছরে বলতে সক্ষম হতে। তদনুসারে, কাজের ক্ষেত্রে এই ক্ষেত্রে সর্বদা আস্থার একটি উপাদান থাকবে, যা গবেষকদের কখনই অপব্যবহার করতে হবে না।

আমি সবচেয়ে বাস্তব পরামর্শ দিচ্ছি যে আপনি জমা দেওয়ার আগে আপনাকে খুব মনোযোগ সহকারে সমস্ত কিছু চিন্তা করা দরকার এবং নিশ্চিত হয়ে নিন যে আপনি পর্যালোচকদের জিজ্ঞাসা করা কোনও প্রশ্নের সত্য উত্তর দিতে সক্ষম হবেন। যতক্ষণ আপনি আপনার যথাসাধ্য চেষ্টা করেছেন ততক্ষণ আপনার উদ্দেশ্য সৎ এবং আপনি রাতে ভাল ঘুমান আমার মনে হয় আপনার ভাল হওয়া উচিত।


2
আমি নিশ্চিত নই যে মিথ্যা বানোয়াট স্পট করতে না পারায় আমি একমত: আমি এর আগেও এরকম স্পট করেছি।
অ্যালেক্সিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.