বিভিন্ন নমুনা আকার থেকে কোনওটির সাথে তুলনা করার কীভাবে ব্যাখ্যা করা উচিত?


49

কোনও ওয়েবসাইটে বইয়ের রেটিংয়ের বিষয়টি বিবেচনা করুন। বুক এ এর গড় রেটিং ৪.২৫ এবং বৈচিত্র সাথে 10,000 জন লোক রেট করেছে । একইভাবে বুক বি 100 জন দ্বারা রেট করা হয়েছে এবং এর রেটিংটি 4.5 σ = 0.25 দিয়ে থাকেσ=0.5σ=0.25

এখন বুক এ এর ​​বড় নমুনার আকারের কারণে 'গড় স্থিতিশীল' থেকে 4.25 হয়ে গেছে। এখন ১০০ জনের পক্ষে এটি হতে পারে যে আরও বেশি লোক যদি বুক বি পড়েন তবে গড় রেটিং 4 বা 4.25 এ নেমে যেতে পারে।

  • কীভাবে একজনকে বিভিন্ন নমুনা থেকে অর্থের তুলনাটি ব্যাখ্যা করা উচিত এবং কোনটি সেরা সিদ্ধান্তগুলি আঁকতে পারে / তা আঁকতে পারে?

উদাহরণস্বরূপ - আমরা কি সত্যই বলতে পারি যে বুক বি বই-এর চেয়ে ভাল than


আপনি রেটিং প্রসঙ্গে বিশেষভাবে আগ্রহী?
জেরোমি অ্যাংলিম

@ জারোমি অংলিম - হুম ... সম্ভবত। নিশ্চিত না. এটি সবচেয়ে সাধারণ উদাহরণ। তোমার মনে কি ছিল?
পিএইচডি

2
নীচে বায়সিয়ান রেটিং সিস্টেম সম্পর্কিত আমার উত্তর দেখুন। প্রয়োগ করা রেটিং প্রসঙ্গে সাধারণত শত বা হাজার হাজার বস্তু রেট করা হয় এবং উপলভ্য তথ্যের ভিত্তিতে অবজেক্টের জন্য রেটিংয়ের সর্বোত্তম অনুমান করা প্রায়শই লক্ষ্য। এটি একটি সাধারণ দুটি গ্রুপ তুলনার তুলনায় খুব আলাদা কারণ আপনি দুটি গ্রুপের সাথে চিকিত্সা পরীক্ষায় বলতে পারেন।
জেরোমি অ্যাংলিম

উত্তর:


57

Nn

শক্তি সম্পর্কে আমার বক্তব্য পরিষ্কার করতে, এখানে একটি খুব সহজ সিমুলেশন র জন্য লেখা হয়েছে:

set.seed(9)                            # this makes the simulation exactly reproducible

power5050 = vector(length=10000)       # these will store the p-values from each 
power7525 = vector(length=10000)       # simulated test to keep track of how many 
power9010 = vector(length=10000)       # are 'significant'

for(i in 1:10000){                     # I run the following procedure 10k times

  n1a = rnorm(50, mean=0,  sd=1)       # I'm drawing 2 samples of size 50 from 2 normal
  n2a = rnorm(50, mean=.5, sd=1)       # distributions w/ dif means, but equal SDs

  n1b = rnorm(75, mean=0,  sd=1)       # this version has group sizes of 75 & 25
  n2b = rnorm(25, mean=.5, sd=1)

  n1c = rnorm(90, mean=0,  sd=1)       # this one has 90 & 10
  n2c = rnorm(10, mean=.5, sd=1)

  power5050[i] = t.test(n1a, n2a, var.equal=T)$p.value         # here t-tests are run &
  power7525[i] = t.test(n1b, n2b, var.equal=T)$p.value         # the p-values are stored
  power9010[i] = t.test(n1c, n2c, var.equal=T)$p.value         # for each version
}

mean(power5050<.05)                # this code counts how many of the p-values for
[1] 0.7019                         # each of the versions are less than .05 &
mean(power7525<.05)                # divides the number by 10k to compute the % 
[1] 0.5648                         # of times the results were 'significant'. That 
mean(power9010<.05)                # gives an estimate of the power
[1] 0.3261

N=100n1=50n2=50n1=75n2=25n1=90n2=10। আরও দ্রষ্টব্য যে স্ট্যান্ডার্ডাইজড গড় পার্থক্য / ডেটা উত্পন্নকরণ প্রক্রিয়া সমস্ত ক্ষেত্রে একই ছিল। তবে, পরীক্ষাটি 50-50 নমুনার জন্য 70% সময় ছিল 'উল্লেখযোগ্য', যখন গ্রুপের আকার 90-10 ছিল তখন শক্তি ছিল 75% এবং কেবলমাত্র 33% ছিল।

আমি এটি সাদৃশ্য দিয়ে মনে করি। যদি আপনি একটি আয়তক্ষেত্রের ক্ষেত্রের ক্ষেত্রটি জানতে চান, এবং ঘেরটি ঠিক করা হয়েছে, তবে দৈর্ঘ্য এবং প্রস্থ সমান হলে (ক্ষেত্রফলটি যদি আয়তক্ষেত্রটি একটি বর্গক্ষেত্র ) হয় তবে অঞ্চলটি সর্বাধিক করা হবে । অন্যদিকে, দৈর্ঘ্য এবং প্রস্থের বিভাজন (আয়তক্ষেত্রটি প্রসারিত হওয়ার সাথে সাথে) অঞ্চল সঙ্কুচিত হয়।


ক্ষমতা সর্বোচ্চ হয় ?? আমি বুঝতে পারছি না নিশ্চিত। আপনি যদি দয়া করে একটি উদাহরণ প্রদান করতে পারেন?
পিএইচডি

5
টি টেস্টটি অসম নমুনা আকারগুলি পরিচালনা করতে পারে তার কারণ এটি প্রতিটি গোষ্ঠীর জন্য অর্থের অনুমানের স্ট্যান্ডার্ড ত্রুটির অ্যাকাউন্ট নেয়। এটি গ্রুপের নমুনা আকারের বর্গমূল দিয়ে বিভক্ত গ্রুপের বিতরণের মানক বিচ্যুতি। জনসংখ্যার মানক বিচ্যুতির পরিমাণ যদি প্রায় সমান বা প্রায় হয় তবে অনেক বড় স্যাম্পেল আকারের গাপটিতে ছোট স্ট্যান্ডার্ড ত্রুটি থাকবে।
মাইকেল চেরনিক

@ গুং - আমি নিশ্চিত নই যে এই সিমুলেশনটি কোন 'ভাষায়' রচিত really আমি 'আর' অনুমান করছি? এবং আমি এখনও এটি বোঝার চেষ্টা করছি :)
পিএইচডি

2
কোডটি আর এর জন্য I আমি এটি অনুসরণ করা আরও সহজ করার জন্য মন্তব্য করেছি। আপনি কেবল অনুলিপি করে এটিকে আর-তে আটকান এবং নিজে চালাতে পারেন, যদি আপনার আর থাকে; set.seed()ফাংশন আপনি অভিন্ন আউটপুট পেতে নিশ্চিত হবে। এটি অনুসরণ করা এখনও খুব কঠিন কিনা তা আমাকে জানান।
গুং - মনিকা পুনরায়

8
N=n1+n2n1×n2n1n2

10

@ গুং আপনাকে টি-টেস্টের উল্লেখ করে উল্লিখিত উত্তর ছাড়াও, মনে হচ্ছে আপনি বায়েশিয়ান রেটিং সিস্টেমগুলিতে আগ্রহী (যেমন, এখানে একটি আলোচনা )। অর্ডার আইটেমগুলিতে প্রাপ্ত ভোটের সংখ্যার চেয়ে পৃথক হয়ে ওঠার জন্য ওয়েবসাইটগুলি এই জাতীয় সিস্টেমগুলি ব্যবহার করতে পারে। মূলত, এই জাতীয় সিস্টেমগুলি এমন রেটিং নির্ধারণ করে যা সমস্ত আইটেমের গড় রেটিং এবং নির্দিষ্ট বস্তুর রেটিংয়ের নমুনার গড়ের সংমিশ্রণকে সংযুক্ত করে কাজ করে। রেটিংয়ের সংখ্যা বৃদ্ধির সাথে সাথে, অবজেক্টটির জন্য গড়কে দেওয়া ওজন বৃদ্ধি পায় এবং সমস্ত আইটেমের রেটিং বোঝায় ওজন হ্রাস পায়। সম্ভবত বেয়েসিয়ান গড় পরীক্ষা করে দেখুন ।

ভোটদান জালিয়াতি, সময়ের সাথে সাথে পরিবর্তন ইত্যাদির মতো বিস্তৃত বিষয়গুলির সাথে আপনার সমস্যা সমাধান হওয়ার সাথে অবশ্যই জিনিসগুলি আরও জটিল হয়ে উঠতে পারে things


মিষ্টি। কখনো শুনি নি. আমি অবশ্যই এটি দেখতে হবে। হয়তো আমি পরে আছি, পরে :) এর
পিএইচডি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.