টি-পরীক্ষার পরিবর্তে আর-তে কোন ক্রোমুটেশন পরীক্ষার প্রয়োগকরণ (জোড়যুক্ত এবং অ-জোড়যুক্ত)?


56

টি-টেস্ট ব্যবহার করে বিশ্লেষণ করেছি এমন একটি পরীক্ষা থেকে আমার কাছে ডেটা রয়েছে। নির্ভরশীল ভেরিয়েবলটি অন্তরকৃত আকারযুক্ত এবং ডেটা হয় অবিযুক্ত (অর্থাত্, 2 গোষ্ঠী) বা জোড়যুক্ত (অর্থাত্-বিষয়গুলির মধ্যে)। যেমন (বিষয়গুলির মধ্যে):

x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5, 57, 100, 99.5, 
        99.5, 99, 99, 99.5, 89.5, 99.5, 100, 99.5)
y1 <- c(99, 99.5, 99.5, 0, 50, 100, 99.5, 99.5, 0, 99.5, 99.5, 90, 
        80, 0, 99, 0, 74.5, 0, 100, 49.5)

তবে ডেটা স্বাভাবিক নয় তাই একজন পর্যালোচক আমাদের টি-টেস্ট বাদে অন্য কিছু ব্যবহার করতে বলেছিলেন। তবে, যেহেতু সহজেই দেখা যায়, ডেটা কেবলমাত্র সাধারণত বিতরণ করা হয় না, তবে বিতরণগুলি শর্তগুলির মধ্যে সমান নয়: বিকল্প পাঠ

সুতরাং, সাধারণ ননপ্যারামেট্রিক টেস্টগুলি, মান-হুইটনি-ইউ-টেস্ট (অবিবাহিত) এবং উইলকক্সন টেস্ট (জোড়যুক্ত) ব্যবহার করা যাবে না কারণ তাদের অবস্থার মধ্যে সমান বিতরণ প্রয়োজন। অতএব, আমি সিদ্ধান্ত নিয়েছি যে কিছু পুনর্নির্মাণ বা ক্রমশক্তি পরীক্ষা সেরা হবে।

এখন, আমি টি-টেস্টের পারমুটেশন-ভিত্তিক সমতুল্য, বা ডেটা দিয়ে কী করবেন সে সম্পর্কিত কোনও পরামর্শের জন্য আর বাস্তবায়ন খুঁজছি।

আমি জানি যে কিছু আর-প্যাকেজ রয়েছে যা আমার জন্য এটি করতে পারে (যেমন, মুদ্রা, পেরম, হুবহু র‌্যাঙ্কটেষ্ট, ইত্যাদি), তবে কোনটি বেছে নেবে তা আমি জানি না। সুতরাং, যদি এই পরীক্ষাগুলি ব্যবহারের সাথে কারও কারও অভিজ্ঞতা আমাকে কিক-স্টার্ট দিতে পারে তবে তা হবে উবারকুল।

আপডেট: আপনি যদি এই পরীক্ষা থেকে ফলাফলগুলি কীভাবে রিপোর্ট করবেন তার একটি উদাহরণ প্রদান করতে পারলে এটি আদর্শ হবে।

উত্তর:


43

টেস্টের পরিসংখ্যান সবসময় অর্থ (বা সমতুল্য কিছু) এর মধ্যে পার্থক্য থেকে যেহেতু এটি গুরুত্বপূর্ণ নয়। মন্টে-কার্লো পদ্ধতির প্রয়োগ থেকে ছোট পার্থক্য আসতে পারে। দুটি স্বতন্ত্র ভেরিয়েবলের জন্য একতরফা পরীক্ষা দিয়ে আপনার ডেটা দিয়ে তিনটি প্যাকেজ ব্যবহার করে:

DV <- c(x1, y1)
IV <- factor(rep(c("A", "B"), c(length(x1), length(y1))))
library(coin)                    # for oneway_test(), pvalue()
pvalue(oneway_test(DV ~ IV, alternative="greater", 
                   distribution=approximate(B=9999)))
[1] 0.00330033

library(perm)                    # for permTS()
permTS(DV ~ IV, alternative="greater", method="exact.mc", 
       control=permControl(nmc=10^4-1))$p.value
[1] 0.003

library(exactRankTests)          # for perm.test()
perm.test(DV ~ IV, paired=FALSE, alternative="greater", exact=TRUE)$p.value
[1] 0.003171822

সমস্ত আদেশের ম্যানুয়াল গণনা সহ সঠিক পি-মানটি পরীক্ষা করতে, আমি প্রথম 9 টি মানগুলিতে ডেটা সীমাবদ্ধ করব।

x1 <- x1[1:9]
y1 <- y1[1:9]
DV <- c(x1, y1)
IV <- factor(rep(c("A", "B"), c(length(x1), length(y1))))
pvalue(oneway_test(DV ~ IV, alternative="greater", distribution="exact"))
[1] 0.0945907

permTS(DV ~ IV, alternative="greater", exact=TRUE)$p.value
[1] 0.0945907

# perm.test() gives different result due to rounding of input values
perm.test(DV ~ IV, paired=FALSE, alternative="greater", exact=TRUE)$p.value
[1] 0.1029412

# manual exact permutation test
idx  <- seq(along=DV)                 # indices to permute
idxA <- combn(idx, length(x1))        # all possibilities for different groups

# function to calculate difference in group means given index vector for group A
getDiffM <- function(x) { mean(DV[x]) - mean(DV[!(idx %in% x)]) }
resDM    <- apply(idxA, 2, getDiffM)  # difference in means for all permutations
diffM    <- mean(x1) - mean(y1)       # empirical differencen in group means

# p-value: proportion of group means at least as extreme as observed one
(pVal <- sum(resDM >= diffM) / length(resDM))
[1] 0.0945907

coinএবং exactRankTestsউভয়ই একই লেখকের কাছ থেকে, তবে coinডকুমেন্টেশনের ক্ষেত্রেও এটি আরও সাধারণ এবং বিস্তৃত বলে মনে হয়। exactRankTestsসক্রিয়ভাবে আর বিকাশ হয় না। আমি তাই বেছে নেব coin(যেমন তথ্যমূলক ফাংশনগুলির কারণেও support()), যদি না আপনি এস 4 বিষয়গুলির সাথে ডিল করতে পছন্দ করেন।

সম্পাদনা: দুটি নির্ভরশীল ভেরিয়েবলের জন্য সিনট্যাক্সটি

id <- factor(rep(1:length(x1), 2))    # factor for participant
pvalue(oneway_test(DV ~ IV | id, alternative="greater",
                   distribution=approximate(B=9999)))
[1] 0.00810081

আপনার দুর্দান্ত উত্তরের জন্য ধন্যবাদ! আরও 2 টি প্রশ্ন: আপনার দ্বিতীয় উদাহরণটির অর্থ কী, সেই মুদ্রাটি আসলে সমস্ত সম্ভাব্য ক্রম সরবরাহ সরবরাহ করে এবং এটি একটি সঠিক পরীক্ষা? আমার ক্ষেত্রে সঠিক পরীক্ষা না দেওয়ার কোনও সুবিধা আছে কি?
হেনরিক

10
(+1) এতে অবাক হওয়ার কিছু নেই যে (আনকিয়ারড) টি-টেস্টের ফলস্বরূপ একই পি-মান, 0.000349 পাওয়া যায়। কি সমালোচক বলেন সত্ত্বেও, t-test এর হয় এই তথ্য প্রযোজ্য। কারণটি হ'ল উপায়গুলির নমুনা বিতরণগুলি প্রায় সাধারণ, যদিও ডেটা বিতরণ হয় না। তদ্ব্যতীত, আপনি ফলাফলগুলি থেকে দেখতে পাচ্ছেন যে টি-টেস্টটি ক্রমুয়েশন পরীক্ষার চেয়ে বেশি রক্ষণশীল। (এর অর্থ এই যে টি-টেস্টের সাথে একটি উল্লেখযোগ্য ফলাফল ইঙ্গিত দেয় যে
পারমিটেশন পরীক্ষাটিও

2
@ হেনরিক কিছু পরিস্থিতিতে (নির্বাচিত পরীক্ষা এবং সংখ্যার জটিলতা) coinজন্য সঠিক ক্রমবন্টন বিতরণ গণনা করতে পারে (আসলে সমস্ত আদেশের মধ্য দিয়ে না গিয়ে, এর চেয়ে আরও মার্জিত অ্যালগরিদম রয়েছে)। পছন্দটি দেওয়া হলেও, সঠিক বিতরণটি পছন্দনীয় বলে মনে হয়, তবে উচ্চ সংখ্যার প্রতিলিপিগুলির সাথে একটি মন্টে-কার্লো অনুমানের পার্থক্যটি কম হওয়া উচিত।
কারাকাল

1
@ কারাকাল স্পষ্টতার জন্য ধন্যবাদ। একটি প্রশ্ন রয়ে গেছে: আমি উপস্থাপিত ডেটা জোড়া হয়েছে। অতএব, জোড়যুক্ত টি-টেস্টের সমতুল্য আমার দরকার। কি oneway_testসঠিক ফাংশন আছে? এবং যদি তাই হয় তবে জোড়যুক্ত ডেটার জন্য কোনটি সঠিক?
হেনরিক

2
@ হেনরিক coinলেখক আমাকে লিখেছেন যে oneway_test()নির্ভরশীল মামলার জন্য সঠিক বিতরণ গণনা করতে পারে না, আপনাকে এমসির কাছাকাছি যেতে হবে (কেবল wilcoxsign_test()সঠিক পরীক্ষার জন্য উপযুক্ত)। আমি এটি জানতাম না এবং এই ক্ষেত্রে একটি ত্রুটি পছন্দ করতাম, তবে এমসির উচ্চ সংখ্যার প্রতিলিপি সহ যথেষ্ট সঠিক হওয়া উচিত।
কারাকাল

29

আমি বিশ্বাস করি, কিছু মন্তব্য রয়েছে।

1) আমি আপনাকে আপনার ডেটার একাধিক ভিজ্যুয়াল ডিসপ্লে চেষ্টা করার জন্য উত্সাহিত করব, কারণ তারা হিস্টোগ্রামগুলি দ্বারা হারিয়ে যাওয়া জিনিসগুলি ক্যাপচার করতে পারে এবং আমি পাশাপাশি দৃ .় অক্ষগুলিতে প্লট করারও দৃ strongly় পরামর্শ দিচ্ছি। এই ক্ষেত্রে, আমি বিশ্বাস করি না যে হিস্টোগ্রামগুলি আপনার ডেটার বিশিষ্ট বৈশিষ্ট্যগুলি যোগাযোগের জন্য খুব ভাল কাজ করে। উদাহরণস্বরূপ, পাশাপাশি বক্সপ্লটগুলি একবার দেখুন:

boxplot(x1, y1, names = c("x1", "y1"))

বিকল্প পাঠ

অথবা পাশাপাশি পাশাপাশি স্ট্রিপচার্টগুলি:

stripchart(c(x1,y1) ~ rep(1:2, each = 20), method = "jitter", group.names = c("x1","y1"), xlab = "")

বিকল্প পাঠ

এগুলির কেন্দ্রগুলি, স্প্রেড এবং আকারগুলি দেখুন! ডেটার প্রায় তিন-চতুর্থাংশ ডেটার মধ্যম থেকে ভাল পড়ে । ছড়িয়ে , ছোট থাকে তখন এটি ছড়িয়ে বিশাল। উভয় এবং অত্যন্ত বাঁ-স্কিউ কিন্তু বিভিন্ন উপায়ে হয়। উদাহরণস্বরূপ, এর পাঁচটি (!) শূন্যের পুনরাবৃত্তি মান রয়েছে।y 1 x 1 y 1 x 1 y 1 y 1x1y1x1y1x1y1y1

2) আপনি কোথা থেকে আপনার ডেটা আসে এবং কীভাবে সেগুলি পরিমাপ করা হয় সে সম্পর্কে আপনি খুব বেশি বিশদ ব্যাখ্যা করেন নি, তবে একটি পরিসংখ্যান পদ্ধতি নির্বাচন করার সময় আসে যখন এই তথ্যটি খুব গুরুত্বপূর্ণ। আপনার দুটি নমুনা কি স্বাধীন? দুটি নমুনার প্রান্তিক বিতরণ একই হওয়া উচিত বলে বিশ্বাস করার কোনও কারণ আছে (উদাহরণস্বরূপ অবস্থানের পার্থক্য বাদে)? অধ্যয়নের আগে কী বিবেচনাগুলি আপনাকে দুটি গ্রুপের মধ্যে পার্থক্যের প্রমাণ সন্ধান করতে পরিচালিত করেছিল?

৩) এই ডেটাগুলির জন্য টি-টেস্ট উপযুক্ত নয় কারণ প্রান্তিক বিতরণ উভয় নমুনায় চূড়ান্ত মান সহ, সাধারণভাবে অস্বাভাবিক। যদি আপনি চান, আপনি (আপনার পরিমিতরূপে মাপের নমুনা কারণে) ব্যবহার করতে CLT আপীল পারে -test (যা বৃহৎ নমুনার জন্য z- পরীক্ষার মতোই হবে), কিন্তু স্কিউনেস (উভয় ভেরিয়েবল মধ্যে) দেওয়া আপনার ডেটা আমি এই ধরনের একটি আবেদন খুব দৃinc়ভাবে বিচার করব না। অবশ্যই, আপনি এটি ভ্যালু গণনা করতে যাইহোক ব্যবহার করতে পারেন , তবে এটি আপনার জন্য কী করে? যদি অনুমানগুলি সন্তুষ্ট না হয় তবে -মূল্য কেবল একটি পরিসংখ্যান; এটি আপনি (সম্ভবত) জানতে চান তা জানায় না: দুটি নমুনা বিভিন্ন বিতরণ থেকে এসেছে কিনা তার কোনও প্রমাণ রয়েছে কিনা whetherপি পিzpp

4) একটি ক্রমবর্ধমান পরীক্ষাও এই ডেটাগুলির জন্য অনুপযুক্ত। পারমিটেশন পরীক্ষার জন্য একক এবং প্রায়শই অবহেলিত ধারণাটি হল যে দুটি নমুনা নাল অনুমানের অধীনে বিনিময়যোগ্য । এর অর্থ হ'ল তাদের সমান প্রান্তিক বিতরণ রয়েছে (শূন্যের নীচে)। তবে আপনি সমস্যায় পড়েছেন, কারণ গ্রাফগুলি নির্দেশ করে যে বিতরণগুলি অবস্থান এবং স্কেল (এবং আকারেও) উভয়ই আলাদা। সুতরাং, আপনি অবস্থানের পার্থক্যের জন্য পরীক্ষা করতে পারেন (বৈধভাবে) কারণ স্কেলগুলি পৃথক, এবং স্কেলগুলির মধ্যে পার্থক্যের জন্য আপনি পরীক্ষা করতে পারবেন না (কারণ বৈধভাবে) কারণ অবস্থানগুলি পৃথক। উফ। আবার, আপনি যাইহোক পরীক্ষা করতে পারেন এবং একটি ভ্যালু পেতে পারেন, তবে তাই কি? আপনি সত্যিই কি অর্জন করেছেন?p

5) আমার মতে, এই ডেটাগুলি একটি নিখুঁত (?) উদাহরণ যে একটি ভালভাবে নির্বাচিত ছবিটি 1000 অনুমান পরীক্ষার জন্য মূল্যবান। পেন্সিল এবং শস্যাগার মধ্যে পার্থক্য বলতে আমাদের কোনও পরিসংখ্যানের প্রয়োজন নেই। এই ডেটাগুলির জন্য আমার দৃষ্টিতে উপযুক্ত বক্তব্যটি হবে "এই ডেটা অবস্থান, স্কেল এবং আকারের ক্ষেত্রে চিহ্নিত পার্থক্য প্রদর্শন করে।" পার্থক্যগুলির পরিমাণ নির্ধারণের জন্য আপনি প্রত্যেকের জন্য (শক্তিশালী) বর্ণনামূলক পরিসংখ্যান অনুসরণ করতে এবং আপনার মূল অধ্যয়নের প্রসঙ্গে পার্থক্যের অর্থ কী তা ব্যাখ্যা করতে পারেন।

)) আপনার পর্যালোচক সম্ভবত (এবং দুঃখের সাথে) প্রকাশের পূর্ব শর্ত হিসাবে কোনও ধরণের মূল্যকে জোর দিতে চলেছেন। দীর্ঘশ্বাস! যদি এটিই আমি হয়ে থাকি তবে প্রত্যেকটি বিষয়ে সম্মতি সহকারে পার্থক্য দেখলে আমি সম্ভবত একটি ননপ্রেমেট্রিক কলমোগোরভ-স্মারনভ পরীক্ষা ব্যবহার করতাম যে ভ্যালুটি দেখায় যে বিতরণগুলি আলাদা, এবং তারপরে উপরের মত বর্ণনামূলক পরিসংখ্যান নিয়ে এগিয়ে যেতে হবে। বন্ধন থেকে মুক্তি পেতে আপনাকে দুটি নমুনায় কিছু শব্দ যোগ করতে হবে। (এবং অবশ্যই, এটি সমস্তই ধরে নেয় যে আপনার নমুনাগুলি স্বতন্ত্র যা আপনি স্পষ্টভাবে বর্ণনা করেন নি))পিpp

আমি এই উত্তরটি মূলত যা চেয়েছিলাম তার চেয়ে অনেক বেশি দীর্ঘ। এর জন্যে দুঃখিত.


আমি আগ্রহী যদি আপনি নিম্নলিখিতটি যথাযথ অর্ধ-ভিজ্যুয়ালাইজড পদ্ধতির বিবেচনা করতে চান: দুটি গ্রুপের মুহুর্তের জন্য বুটস্ট্র্যাপের প্রাক্কলন (অর্থ, রূপ এবং উচ্চতর মুহূর্তগুলি যদি আপনি চান) তবে এই অনুমানগুলি এবং তাদের আত্মবিশ্বাসের অন্তরগুলি সন্ধান করুন, প্রতিটি মুহুর্তে গ্রুপগুলির মধ্যে ওভারল্যাপের ডিগ্রির জন্য। এটি আপনাকে বিতরণের বৈশিষ্ট্যগুলির বিভিন্ন জুড়ে সম্ভাব্য পার্থক্য সম্পর্কে কথা বলতে দেয়। যদি ডেটা যুক্ত করা হয় তবে পার্থক্য স্কোরগুলি গণনা করুন এবং এই একক বিতরণের মুহুর্তগুলিকে বুটস্ট্র্যাপ করুন। থটস?
মাইক লরেন্স

2
(+1) ভাল বিশ্লেষণ। আপনি পুরোপুরি ঠিক বলেছেন যে ফলাফলগুলি সুস্পষ্ট এবং পয়েন্টের সাথে একটিকে পয়েন্টটি চাপতে হবে না। আপনার (3) এর বিবৃতিতে আপনি কিছুটা চরম হতে পারেন, কারণ টি-পরীক্ষার জন্য সাধারণত বিতরণ করা ডেটার প্রয়োজন হয় না। আপনি যদি উদ্বিগ্ন হন তবে স্কিউনেসের জন্য সামঞ্জস্য রয়েছে (যেমন, চেনের রূপ): আপনি দেখতে পেলেন যে সামঞ্জস্য পরীক্ষার জন্য পি-মান উত্তর পরিবর্তন করে। যদি না হয়, আপনি সম্ভবত ঠিক আছেন। এই নির্দিষ্ট পরিস্থিতিতে, এই (অত্যন্ত স্কিউড) ডেটা সহ, টি-টেস্টটি দুর্দান্ত কাজ করে।
হোয়বার

(+1) চমৎকার ধরা! এবং খুব ভাল মন্তব্য।
chl

আমরা মনে করি যে অন্তর্নিহিত বিতরণটি এলোমেলো ইনস্ট্যান্টেশনের সাথে "অনুরূপ"। সুতরাং কেউ প্রশ্ন উত্থাপন করতে পারেনি: এই দুটিই কি বিটা (0.25, 0.25) থেকে এসেছে এবং তারপরে পরীক্ষা হবে তাদের একই (নন-) কেন্দ্রিয়তার প্যারামিটার আছে কিনা। এবং এটি কোনও পারমিটেশন পরীক্ষা বা উইলকক্সন ব্যবহার করে ন্যায়সঙ্গত হবে না?
ডিভিউন

4
এখানে প্রচুর ভাল তথ্য রয়েছে তবে এটি খুব দৃ strongly়তার সাথে শব্দযুক্ত এবং মিশ্রিত ডাব্লু / কিছু জিনিস যা আমার কাছে খুব একটা বোঝায় না। উদাহরণস্বরূপ, আবার # 3, জেড-টেস্ট এবং টি-টেস্টের সম্পর্কের সম্পর্কে আমার বুঝতে হবে যে তারা মূলত একই রকম হয়, তবে এসডি যখন অগ্রাধিকার হিসাবে পরিচিত হয় তখন z ব্যবহার করা হয় এবং যখন টি ব্যবহৃত হয় ডেটা থেকে এসডি অনুমান করা হয়। আমি দেখতে পাচ্ছি না কীভাবে সিএলটি টি-টেস্টকে অবৈধ রেখে এই জেড-টেস্টকে লাইসেন্স লাইসেন্সগুলি স্যাম্পলিংয়ের স্বাভাবিকতার গ্যারান্টি দেয়। আমিও মনে করি না যে সিএলটি আপনাকে coversেকে রাখে, এতদিনে অ্যাডজাস্টমেন্ট (যেমন, ওয়েলচ – স্যাটারথওয়েট) ব্যবহার করা হলে এসডি'র অকার্যকর টি।
গুং - মনিকা পুনরায়

5

আমার মন্তব্যগুলি পারমিটেশন পরীক্ষা বাস্তবায়নের বিষয়ে নয় তবে এই তথ্যগুলি দ্বারা উত্থিত আরও সাধারণ সমস্যা এবং এটি নিয়ে আলোচনা, বিশেষত জি জে কার্নসের পোস্টটি।

দুটি ডিস্ট্রিবিউশনগুলি আমার কাছে ওয়াই 1 এর 0 টি গ্রুপের জন্য একেবারে সমান দেখায়, যা সেই নমুনার অন্যান্য পর্যবেক্ষণগুলির থেকে অনেক আলাদা (পরবর্তী ছোটটি 0-100 স্কেলে প্রায় 50 হয়) পাশাপাশি এক্স 1 এর সমস্ত। এই পর্যবেক্ষণগুলির মধ্যে কিছু আলাদা ছিল কিনা তা আমি প্রথমে তদন্ত করব।

দ্বিতীয়ত, এই 0 টি বিশ্লেষণের সাথে জড়িত বলে ধরে নিলাম, অনুমানের পরীক্ষাটি বৈধ নয় কারণ বিতরণগুলি পৃথক বলে মনে হয় প্রশ্নটি শুরু করে। যদি নালটি সত্য হয় (বিতরণগুলি অভিন্ন) তবে আপনি কি (যুক্তিসঙ্গত সম্ভাবনার সাথে) এই দুটিয়ের মতোই আলাদা বিতরণ পেতে পারেন? পরীক্ষার পুরো পয়েন্টটির উত্তর দেওয়া, তাই না? সম্ভবত এই ক্ষেত্রে কেউ পরীক্ষাটি না চালিয়ে উত্তরটি সুস্পষ্টভাবে বিবেচনা করবে, তবে এই ছোট্ট, অদ্ভুত বিতরণগুলির সাথে, আমি মনে করি না আমি তা করি।


দেখা যাচ্ছে এটি একটি বা একাধিক মন্তব্য হওয়া উচিত, উত্তর নয়। আপনি যদি ধূসর ধূসর "মন্তব্য যুক্ত করুন" ক্লিক করেন তবে আপনি প্রশ্নটি বা কোনও নির্দিষ্ট উত্তরের নীচে কথোপকথনে আপনার চিন্তাভাবনা রাখতে পারেন, যেখানে সেগুলি belong আপনি এখানে মূল বিষয়গুলি তৈরি করেন তবে এটি স্পষ্ট নয় যে এটি তাদের জন্য উপযুক্ত জায়গা নয়।
গুং - মনিকা পুনরায়

1
@ গুং একটি মন্তব্য পোস্ট করতে সক্ষম হতে সামান্য খ্যাতি লাগে ;-)।
হোবার

4
এটি পারমিটেশন পরীক্ষার প্রয়োগযোগ্যতা সম্পর্কে একটি ভাল বিষয়। গ্রুপগুলির মধ্যে পার্থক্যটির স্পষ্টতা হিসাবে, সম্ভবত এটি অভিজ্ঞতার বিষয় :-)। অন্তর্দৃষ্টি জন্য, যেহেতু স্পষ্টতই মূল পার্থক্যটি ছোট মানগুলির মধ্যে রয়েছে, আমরা 40 টি মানের একটি সেটের মধ্যে সাতটি ক্ষুদ্রতমটি 20 এর একটি এলোমেলো উপসেটে পড়ে যাওয়ার সম্ভাবনা সম্পর্কে অনুসন্ধান করতে পারি ough মোটামুটিভাবে, প্রতিটিটির প্রায় 1/2 রয়েছে সাবসেটে বা তার পরিপূরক হওয়ার সম্ভাবনা রয়েছে, সুতরাং সমস্ত সাতটি একই গ্রুপে প্রায় সহ সম্ভাবনা থাকবে । এই মানসিক গাণিতিক দ্রুত প্রাথমিক গাইডেন্স সরবরাহ করে। 2(1/2)7.01
হোয়াট

4

এই প্রশ্নটি আবার পপ আপ হওয়ার সাথে সাথে প্যাকেজটি ব্যবহার করে কুইক-আর এবং আর ইন অ্যাকশনের লেখক রবার্ট কাবাকফের আর-ব্লগারদের মাধ্যমে সাম্প্রতিক ব্লগ পোস্টের দ্বারা অনুপ্রাণিত আমি আরও একটি উত্তর যুক্ত করতে পারি ।lmPerm

যাইহোক, এই পদ্ধতিগুলি coin@ কারাকাকল এর উত্তরে প্যাকেজটির দ্বারা উত্পাদিত একের জন্য তীব্র বিপরীত (এবং খুব অস্থির) ফলাফল উত্পন্ন করে (বিষয়গুলির মধ্যে বিশ্লেষণের পি-মানটি 0.008)। বিশ্লেষণটি @ কারাকালের উত্তর থেকেও ডেটা প্রস্তুতি গ্রহণ করে:

x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5, 57, 100, 99.5, 
        99.5, 99, 99, 99.5, 89.5, 99.5, 100, 99.5)
y1 <- c(99, 99.5, 99.5, 0, 50, 100, 99.5, 99.5, 0, 99.5, 99.5, 90, 
        80, 0, 99, 0, 74.5, 0, 100, 49.5)

DV <- c(x1, y1)
IV <- factor(rep(c("A", "B"), c(length(x1), length(y1))))
id <- factor(rep(1:length(x1), 2)) 

library(lmPerm)

summary(aovp( DV ~ IV + Error(id)))

সৃষ্টি করে:

> summary(aovp( DV ~ IV + Error(id)))
[1] "Settings:  unique SS "

Error: id
Component 1 :
          Df R Sum Sq R Mean Sq
Residuals 19    15946       839


Error: Within
Component 1 :
          Df R Sum Sq R Mean Sq Iter Pr(Prob)  
IV         1     7924      7924 1004    0.091 .
Residuals 19    21124      1112                
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

আপনি যদি এই একাধিক বার চালনা করেন তবে পি-মানগুলি ~ .05 এবং ~ .1 এর মধ্যে প্রায় লাফ দেয়।

যদিও এটি প্রশ্নের উত্তর হলেও আমাকে শেষ পর্যন্ত একটি প্রশ্ন উত্থাপন করতে দিন (আমি চাইলে এটি একটি নতুন প্রশ্নে সরিয়ে নিতে পারি):
কেন এই বিশ্লেষণটি এত অস্থির এবং এর ফলে পি-ভ্যালুগুলি এত বেশি বিচ্যুত হওয়ার কোনও ধারণা নেই? মুদ্রা বিশ্লেষণ? আমি কি কিছু ভুল করবেন?


2
এটিকে আলাদা প্রশ্ন হিসাবে জিজ্ঞাসা করা ভাল, যদি আপনি যদি ডাব্লু / বাকী অংশের তালিকা করতে চান তবে অন্য কোনও সম্ভাব্য সমাধানের চেয়ে সত্যই যদি আপনি উত্তর চান এমন একটি প্রশ্ন হয়। আমি লক্ষ্য করেছি যে আপনি একটি ত্রুটি স্তরটি নির্দিষ্ট করেছেন তবে @ ক্যারাকাল তা করে না; এই আউটপুটটি বি / টি-এর পার্থক্যে এটি আমার প্রথম অনুমান হবে his এছাড়াও, সিমুলেট করার সময়, মানগুলি প্রায় চারপাশে লাফ দেয়; পুনরুত্পাদনযোগ্যতার জন্য, আপনি বীজ নির্দিষ্ট করুন, যেমন set.seed(1); এমসির প্রাক্কলনটিতে আরও নির্ভুলতার জন্য আপনি পুনরাবৃত্তির সংখ্যা বাড়িয়েছেন; আমি নিশ্চিত নই যে এগুলির মধ্যে দুটিই যদি আপনার প্রশ্নের 'সঠিক' উত্তর হয় তবে তারা সম্ভবত প্রাসঙ্গিক।
গুং - মনিকা পুনরায়

2
আবার, আমি পুরো অনুচ্ছেদ (পুনরায় র্যান্ডমাইজেশন) পরীক্ষা ব্যবহার করে ম্যানুয়াল গণনার বিরুদ্ধে এমসির ফলাফলগুলিকে বেঞ্চমার্ক করার পরামর্শ দিচ্ছি। (সর্বদা সঠিক ফলাফলের নিকটে) এবং (সাধারণত সঠিক ফলাফল থেকে দূরে ) এর তুলনা করার জন্য আপনার উদাহরণের জন্য কোডটি দেখুন । আমি জানি না কেন বন্যভাবে বিভিন্ন ফলাফল দেয়, তবে কমপক্ষে এখানে এই ক্ষেত্রে তারা দুর্গম। আমার আসল উত্তরে @ শেষ কলটিতে নির্ভরশীল ক্ষেত্রে ( ততোধিক ভিন্ন সিনট্যাক্স ব্যবহারের জন্য ) ত্রুটি স্তরটি নির্দিষ্ট করেছে । oneway_anova()aovp()aovp()oneway_test(DV ~ IV | id, ...)aov()
কারাকাল

@ কারাকাল, আপনি ঠিক বলেছেন। আমি সম্পাদনার পরে শেষ কোড ব্লকের দিকে তাকাইনি। আমি উপরের কোড ব্লকটির দিকে চেয়ে ছিলাম - আমার দিক থেকে opালু।
গুং - মনিকা পুনরায়

আমার আসলে উত্তরটির দরকার নেই। এটি এখানে আরও উল্লেখযোগ্য another দুর্ভাগ্যক্রমে এটি অন্যান্য ফলাফলগুলি থেকে অনেক দূরে যা আমি লক্ষ্য করার মতোও।
হেনরিক

1
@ হেনরিক ম্যাকেক্সেক্সট = 1000 দিয়ে অ্যাওপিপি চালান। যদি এটি খুব দীর্ঘ সময় নেয় তবে এটির = 1000000 এবং Ca = 0.001 সেট করুন। গণনাটি সমাপ্ত হয় যখন পি এর আনুমানিক মান ত্রুটি Ca * পি এর চেয়ে কম হয়। (নিম্ন মানের আরও স্থিতিশীল ফলাফল দেয়))
xmjx

1

এই স্কোর অনুপাত হয়? যদি তা হয় তবে আপনার অবশ্যই গাউসী প্যারামিমেট্রিক পরীক্ষা করা উচিত নয় এবং আপনি যখন কোনও পেরমিতিট পরীক্ষা বা উপায়গুলির বুটস্ট্র্যাপের মতো নন-প্যারাম্যাট্রিক পদ্ধতির সাথে এগিয়ে যেতে পারতেন, আমি প্রস্তাব দিয়েছিলাম যে আপনি আরও পরিসংখ্যানগত ক্ষমতা পাবেন উপযুক্ত নন-গাউসীয় প্যারামেট্রিক পদ্ধতির নিয়োগ। বিশেষত, যে কোনও সময় আপনি আগ্রহের ইউনিটের মধ্যে একটি অনুপাতের পরিমাপের গণনা করতে পারেন (যেমন একটি পরীক্ষায় অংশগ্রহণকারী), আপনি সম্ভবত এবং সম্ভবত একটি মিশ্র প্রভাবগুলির মডেল ব্যবহার করতে পারেন যা দ্বি দ্বি বিতরণ ত্রুটির সাথে পর্যবেক্ষণগুলি নির্দিষ্ট করে। ডিকসন 2004 দেখুন ।


স্কোরগুলি অনুপাত নয় তবে 0 থেকে 100 স্কেলের অংশগ্রহণকারীদের দ্বারা অনুমান (উপস্থাপিত ডেটা সেই স্কেল সহ কয়েকটি আইটেমের অনুমানের মাধ্যম)।
হেনরিক

তারপরে নন-প্যারাম্যাট্রিকগুলি traditionalতিহ্যবাহী পথে যেতে হবে। এটি বলেছিল, আমি ভাবলাম যে দ্বিপদী প্রক্রিয়া থেকে এই জাতীয় স্কেল ডেটা কার্যকরভাবে অনুমান করা যেতে পারে এবং এর মাধ্যমে সেগুলি বিশ্লেষণ করা যেতে পারে। এটি হ'ল, আপনি বলছেন যে প্রতিটি স্কোর বেশ কয়েকটি আইটেমের গড়, এবং আসুন প্রতিটি আইটেমটি 10 ​​পয়েন্টের স্কেল বলে, সেই ক্ষেত্রে আমি একটি প্রতিক্রিয়া উপস্থাপন করব, বলি, "8" ট্রায়ালগুলির একটি সিরিজ হিসাবে, 8 এর যার মান 1 এবং দুটির মধ্যে মান 0 রয়েছে, সমস্ত একটি "আইটেম" ভেরিয়েবলের একই লেবেলযুক্ত। এই প্রসারিত / দ্বিপদী-আইজড ডেটা সহ, আপনি তারপরে দ্বিপদী মিশ্র প্রভাবগুলির মডেলটি গণনা করতে পারেন।
মাইক লরেন্স

আমার পূর্ববর্তী মন্তব্য অনুসরণ করে, আমার নোট করা উচিত যে প্রসারিত / দ্বিপদী-আইজড ডেটাতে আপনি "আইটেম" ভেরিয়েবলটিকে স্থির বা এলোমেলো প্রভাব হিসাবে মডেল করতে পারেন। আমি মনে করি আমি এটির একটি নির্দিষ্ট প্রভাব হিসাবে মডেলিংয়ের দিকে ঝুঁকছি কারণ সম্ভবত আপনি কেবল অ্যাকাউন্টিংয়ের ক্ষেত্রেই আগ্রহী না হয়ে আইটেমের পার্থক্য এবং আইটেম এবং অন্যান্য ভবিষ্যদ্বাণী ভেরিয়েবলের মধ্যে যে কোনও সম্ভাব্য মিথস্ক্রিয়া মূল্যায়ন করতে আগ্রহী হতে পারেন।
মাইক লরেন্স

0

শুধু আরেকটি পন্থা যোগ ezPermএর ezপ্যাকেজ:

> # preparing the data
> DV <- c(x1, y1)
> IV <- factor(rep(c("A", "B"), c(length(x1), length(y1))))
> id <- factor(rep(1:length(x1), 2))
> df <- data.frame(id=id,DV=DV,IV=IV)
>
> library(ez)
> ezPerm( data = df, dv = DV, wid = id, within = IV, perms = 1000)
|=========================|100%              Completed after 17 s 
  Effect     p p<.05
1     IV 0.016     *

এই সামঞ্জস্যপূর্ণ হবে বলে মনে হয় oneway_testএর coinপ্যাকেজ:

> library(coin)
> pvalue(oneway_test(DV ~ IV | id,  distribution=approximate(B=999999)))
[1] 0.01608002
99 percent confidence interval:
 0.01575782 0.01640682

তবে খেয়াল করুন যে এটি @ কারাকাল দ্বারা সরবরাহ করা একই উদাহরণ নয় । তার উদাহরণে তিনি অন্তর্ভুক্ত করেছেন alternative="greater", সুতরাং পি-মান ~0.008বনামের পার্থক্য ~0.016

aovpপ্যাকেজ প্রস্তাব উত্তর এক সন্দেহের নিম্ন P-মান উত্পাদন, এবং সন্দেহের ফাস্ট এমনকি যখন আমি জন্য উচ্চ মান চেষ্টা চালায় Iter, Caএবং maxIterআর্গুমেন্ট:

library(lmPerm)
summary(aovp(DV ~ IV + Error(id/IV), data=df,  maxIter = 1000000000))
summary(aovp(DV ~ IV + Error(id/IV), data=df,  Iter = 1000000000))
summary(aovp(DV ~ IV + Error(id/IV), data=df,  Ca = 0.00000000001))

এটি বলেছিল, যুক্তিগুলি পি-মানগুলির পরিবর্তনের থেকে কিছুটা হ্রাস পাচ্ছে ~.03এবং ~.1(@ হেনরিকের রিপোর্টে আমি আরও একটি বড় পরিসীমা পেয়েছি), 0.03এবং থেকে 0.07

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.