আপনি কি আর-তে কোনও কলমোগোরভ-স্মারনভ পরীক্ষার শক্তি গণনা করতে পারেন?


10

আর-তে দ্বি-পার্শ্বযুক্ত কোলমোগোরভ স্মারনভ পরীক্ষার জন্য কী শক্তি বিশ্লেষণ করা সম্ভব?

আমি পরীক্ষা করছি যে দুটি পরীক্ষামূলক বিতরণ কেএস.টেস্ট () ব্যবহার করে আলাদা হয় কিনা এবং আমি একটি পাওয়ার বিশ্লেষণ যুক্ত করতে চাইছি।

আমি আরএসে কেএস পরীক্ষার জন্য কোনও বিল্ট-ইন পাওয়ার বিশ্লেষণগুলি খুঁজে পাইনি? কোনও পরামর্শ?

সম্পাদনা করুন : এগুলি এলোমেলোভাবে উত্পন্ন বিতরণগুলি যা আমার ডেটাটিকে ঘনিষ্ঠভাবে অনুমান করে (সত্য নমুনার আকার এবং তাত্পর্যপূর্ণ বিতরণের জন্য অনুমিত ক্ষয়ের হার সহ)

set.seed(100)
x <- rexp(64, rate=0.34)
y <- rexp(54,rate=0.37)

#K-S test: Do x and y come from same distribution?
ks.test(x,y)

এই ডেটা দুটি পৃথক গ্রুপের শরীরের আকারের পরিমাপ। আমি এটি দেখাতে চাই যে দুটি গ্রুপের মূলত একই বন্টন রয়েছে তবে নমুনা আকারের ভিত্তিতে আমার বলার ক্ষমতা আছে কিনা কোনও সহযোগী তাকে জিজ্ঞাসা করেছিলেন। আমি এলোমেলোভাবে এখানে একটি ক্ষতিকারক বিতরণ থেকে আঁকা করেছি, কিন্তু এগুলি প্রকৃত তথ্যের কাছাকাছি।

এখনও অবধি, আমি বলেছি যে দ্বি-পক্ষীয় কেএস পরীক্ষার ভিত্তিতে এই বিতরণগুলিতে কোনও উল্লেখযোগ্য পার্থক্য নেই। আমি দুটি বিতরণের পরিকল্পনাও করেছি। আমি কীভাবে দেখাব যে এক্স এবং ওয়াইয়ের জন্য নমুনার আকার এবং ক্ষয় হারের ভিত্তিতে আমি এই জাতীয় বিবৃতি দেওয়ার ক্ষমতা রাখি?


4
শক্তি অনেকগুলি বিষয়ের উপর নির্ভর করবে যে কারণে দুটি নমুনা পরীক্ষার জন্য কোনও বিল্ট ইন থাকবে না। আপনি প্রদত্ত পরিস্থিতিতে জন্য অনুকরণ করতে পারেন। সুতরাং: বিদ্যুৎ পরিস্থিতি সম্পর্কে কি অনুমান? এর বিপরীতে বা বিকল্পের ক্রম? উদাহরণস্বরূপ, আপনি স্কেল শিফট বিকল্পগুলির সেটগুলির বিপরীতে ঘনিষ্ঠভাবে বিতরণ করা ডেটার জন্য একটি পাওয়ার কার্ভ গণনা (সিমুলেট) করতে পারেন। অথবা আপনি কোনও অবস্থান-শিফ্টের বিরুদ্ধে সাধারণের জন্য শক্তি গণনা করতে পারেন। অথবা আপনি আকারের প্যারামিটারের পরিবর্তনের কারণে আপনি কোনও ওয়েইবুলের মধ্যে শক্তি গণনা করতে পারেন could আপনার কিছু অতিরিক্ত বিবরণ আছে?
গ্লেন_বি -রাইনস্টেট মনিকা

প্রকৃতপক্ষে শক্তি গণনা করতে আপনার পাশাপাশি নমুনা আকারের প্রয়োজন। যদি আপনি কোনও নির্দিষ্ট বিকল্পের বিপরীতে নির্দিষ্ট ক্ষমতা প্রদত্ত নমুনা আকার সনাক্ত করার চেষ্টা করছেন, এটি মূল-অনুসন্ধানের মাধ্যমে করা যেতে পারে তবে প্রায়শই আপনি সহজ পদ্ধতির মাধ্যমে বিন্দুটি সন্ধান করতে পারেন (নমুনা আকারের কয়েকটি চেষ্টা করা খুব ঘনিষ্ঠ হওয়ার জন্য যথেষ্ট) )।
গ্লেন_বি -রাইনস্টেট মনিকা

কি পরিবর্তনশীল পরিমাপ করা হচ্ছে? এই সময়গুলি হয়?
গ্লেন_বি

@ Glen_b এই সময় নয়। এগুলি দুটি পৃথক গ্রুপের দেহের আকারের পরিমাপ। আমি এটি দেখাতে চাই যে দুটি গ্রুপের মূলত একই বন্টন রয়েছে, তবে আমার কাছে নমুনা আকারের ভিত্তিতে এটি বলার ক্ষমতা ছিল কিনা তা জিজ্ঞাসা করা হয়েছিল।
সারাহ

1
আহ! এটি দরকারী প্রসঙ্গে দুটি অংশ যা আপনার প্রশ্নে থাকতে সহায়তা করতে পারে। সুতরাং ধারণাটি হ'ল যদি আপনি দেখেন যে কিছু সংখ্যক পরিমিতরূপে পার্থক্য চিহ্নিত করার ক্ষমতা যুক্তিসঙ্গত ছিল, তবে পার্থক্যটি সামান্য ছিল এমন ইঙ্গিত হিসাবে প্রত্যাখ্যান করতে ব্যর্থ হতে পারে। হ্যাঁ, পূর্বের শক্তি বিশ্লেষণ সেই যুক্তি তৈরিতে সহায়তা করতে পারে। সত্যতা হওয়ার পরে আমি সম্ভবত স্কেল পরিবর্তনের একটি অনুমানের (এবং আত্মবিশ্বাসের ব্যবধান) এর মতো কিছু বিষয়ে আরও বেশি মনোনিবেশ করবো যে ইঙ্গিত হিসাবে পার্থক্যটি আকারে ছোট ছিল, পাশাপাশি দুটি নমুনা সিডিএফ-র একটি প্লট ছিল।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


16

তাত্পর্যপূর্ণ স্কেল-শিফ্ট বিকল্পগুলির বিরুদ্ধে শক্তি সন্ধান করা যুক্তিসঙ্গতভাবে সহজ ward

তবে, আমি জানি না যে শক্তিটি কী হতে পারে তা কাজ করার জন্য আপনার ডেটা থেকে গণনা করা মানগুলি ব্যবহার করা উচিত । এই ধরণের পোস্ট হকের শক্তি গণনার ফলাফল পাল্টা-স্বজ্ঞাত (এবং সম্ভবত বিভ্রান্তিমূলক) উপসংহারে ঝোঁক।

শক্তি, তাত্পর্য স্তরের মতো, ঘটনাটির আগে আপনি যে ঘটনাটি মোকাবেলা করেছেন; বিবেচনার জন্য বিকল্পগুলির একটি যুক্তিসঙ্গত সেট এবং পছন্দসই প্রভাবের আকারের বিষয়ে সিদ্ধান্ত নিতে আপনি অগ্রাধিকার বোঝার (তত্ত্ব, যুক্তি বা কোনও পূর্ববর্তী অধ্যয়ন সহ) ব্যবহার করবেন

আপনি বিভিন্ন অন্যান্য বিকল্পের জন্যও বিবেচনা করতে পারেন (উদাহরণস্বরূপ আপনি গামা পরিবারের অভ্যন্তরে ক্ষতিকারককে আরও কম সংখ্যক স্কিউ ক্ষেত্রে প্রভাব বিবেচনা করতে এম্বেড করতে পারেন)।

বিদ্যুত বিশ্লেষণের মাধ্যমে যে সাধারণ প্রশ্নগুলির উত্তর দেওয়ার চেষ্টা করা যেতে পারে তা হ'ল:

1) কোনও প্রভাব আকার বা এফেক্ট মাপের সেট * প্রদত্ত নমুনা আকারের জন্য শক্তিটি কী?

2) একটি নমুনা আকার এবং শক্তি দেওয়া, একটি প্রভাব সনাক্তকরণযোগ্য কত বড়?

3) একটি নির্দিষ্ট প্রভাব আকারের জন্য একটি কাঙ্ক্ষিত শক্তি দেওয়া, কোন নমুনা আকার প্রয়োজন হবে?

* (এখানে 'এফেক্ট সাইজ' জেনারিকভাবে উদ্দেশ্যে করা হয়েছে, এবং উদাহরণস্বরূপ, উপায়গুলির একটি নির্দিষ্ট অনুপাত, বা উপায়ের পার্থক্য, অগত্যা মানসম্মত নয়)।

স্পষ্টতই আপনার কাছে ইতিমধ্যে একটি নমুনা আকার রয়েছে, সুতরাং আপনি ক্ষেত্রে (3) নন। আপনি যুক্তিসঙ্গতভাবে কেস (2) বা কেস (1) বিবেচনা করতে পারেন।

আমি কেস (1) (যা কেস (2)) এর সাথে ডিল করার জন্য একটি উপায়ও প্রস্তাব দেব।

কেসের (1) পদ্ধতির চিত্রিত করার জন্য এবং এটি কেস (2) এর সাথে কীভাবে সম্পর্কিত, তা দেখার জন্য আসুন একটি নির্দিষ্ট উদাহরণ বিবেচনা করুন:

  • স্কেল শিফট বিকল্প

  • ঘনিষ্ঠ জনসংখ্যা

  • 64 এবং 54 দুটি নমুনায় নমুনার আকার

নমুনার আকারগুলি পৃথক হওয়ার কারণে, আমাদের কেসটি বিবেচনা করতে হবে যেখানে নমুনাগুলির একটিতে প্রাসঙ্গিক ছড়িয়ে থাকা 1 টির চেয়ে ছোট এবং বড় উভয় (যদি সেগুলি একই আকারের হয়, তবে প্রতিসম বিবেচনার ফলে কেবল একটি পক্ষ বিবেচনা করা সম্ভব হয়েছিল)। তবে, তারা একই আকারের খুব কাছাকাছি থাকার কারণে, প্রভাবটি খুব কম small যাই হোক না কেন, নমুনাগুলির একটির জন্য প্যারামিটারটি ঠিক করুন এবং অন্যটিতে পৃথক করুন।

সুতরাং এক যা করে তা হ'ল:

পূর্বেই:

choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1

গণনা করতে:

for each possible scale multiplier, kappa 
  repeat nsim times
    generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
    perform the test
  compute the rejection rate across nsim tests at this kappa

আর-তে, আমি এটি করেছি:

alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s)        #  also below and at 1
rr = array(NA,length(s))   # to hold rejection rates

for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
                                    ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
                                 )

plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last 
abline(h=alpha,col=8,lty=2) # draw in alpha

যা নিম্নলিখিত শক্তিটিকে "বক্ররেখা" দেয়

এখানে চিত্র বর্ণনা লিখুন

এক্স-অক্ষটি লগ-স্কেলে রয়েছে, y- অক্ষটি প্রত্যাখ্যান হার।

এটি এখানে বলা শক্ত, তবে কালো পয়েন্টগুলি ডানদিকের চেয়ে বাম দিকে কিছুটা বেশি (অর্থাত্ বৃহত্তর নমুনাটি যখন ছোট স্কেল করে তখন ভগ্নাংশে আরও বেশি শক্তি থাকে)।

প্রত্যাখ্যান হারের রূপান্তর হিসাবে বিপরীত সাধারণ সিডিএফ ব্যবহার করে, আমরা রূপান্তরিত প্রত্যাখ্যান হার এবং লগ কাপা (কাপা sপ্লটে রয়েছি , তবে এক্স-অক্ষটি লগ-স্কেলড) এর মধ্যে প্রায় লিনিয়ার (প্রায় 0 টি বাদে) সম্পর্ক স্থাপন করতে পারি ), এবং সিমুলেশনগুলির সংখ্যা যথেষ্ট বেশি ছিল যে শব্দটি খুব কম - আমরা কেবলমাত্র বর্তমান উদ্দেশ্যে এটি উপেক্ষা করতে পারি।

সুতরাং আমরা কেবল লিনিয়ার ইন্টারপোলেশন ব্যবহার করতে পারি। আপনার নমুনা আকারে 50% এবং 80% পাওয়ারের জন্য আনুমানিক প্রভাব আকারগুলি নীচে দেখানো হয়েছে:

এখানে চিত্র বর্ণনা লিখুন

অন্যদিকে প্রভাব আকারগুলি (বৃহত্তর গোষ্ঠীর আরও ছোট স্কেল রয়েছে) কেবল এটি থেকে সামান্য স্থানান্তরিত হয় (ভগ্নাংশের চেয়ে ছোট প্রভাবের আকার তুলতে পারে) তবে এতে কিছুটা পার্থক্য আসে, সুতরাং আমি বিন্দুটি পরিশ্রম করব না।

সুতরাং পরীক্ষাটি যথেষ্ট পার্থক্য গ্রহণ করবে (1 এর স্কেলগুলির অনুপাত থেকে), তবে একটি ছোট নয়।


এখন কিছু মন্তব্যের জন্য: আমি মনে করি না অনুমানের পরীক্ষাগুলি আগ্রহের অন্তর্নিহিত প্রশ্নের সাথে বিশেষভাবে প্রাসঙ্গিক ( তারা কি যথেষ্ট মিল? ) এবং ফলস্বরূপ এই শক্তি গণনাগুলি আমাদের সেই প্রশ্নের সাথে সরাসরি প্রাসঙ্গিক কিছু বলে না।

আমি মনে করি আপনি "মূলত একই" হিসাবে কী বোঝেন তার পূর্বনির্ধারনের মাধ্যমে আপনি আরও কার্যকর প্রশ্নটির সমাধান করেছেন যা কার্যত কার্যকর হয়। এটি - একটি পরিসংখ্যানগত ক্রিয়াকলাপের জন্য যৌক্তিকভাবে অনুসরণ করা - এর ফলে ডেটাগুলির অর্থপূর্ণ বিশ্লেষণের দিকে নিয়ে যাওয়া উচিত।


তোমাকে অনেক ধন্যবাদ! এটি সত্যই সহায়ক, অনেক প্রশংসিত।
সারা

0

যেহেতু কোলমোগোরভ-স্মারনভ প্যারামিমেট্রিক নয় তাই সংজ্ঞা অনুসারে কোনও প্রয়োগযোগ্য শক্তি বিশ্লেষণ হতে পারে না। কিছুটা অনুমানের জন্য, আপনাকে একটি ব্যাকগ্রাউন্ড মডেল ধরে নিতে হবে (এবং এটি নন-প্যারামিমেট্রিক ওয়ার্ল্ড থেকে সরিয়ে নেওয়া হবে ...) এবং নীচেরগুলির একটি গণনা করতে এটি ব্যবহার করুন: নমুনা-আকার, এমডিই বা শক্তি (যেমন, আপনি দু'টি ঠিক করুন / বেছে নিন এবং তৃতীয়টি গণনা করুন)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.