R তে সঠিক দুটি নমুনা অনুপাত দ্বি-দ্বি পরীক্ষা (এবং কিছু অদ্ভুত পি-মান)


23

আমি নিম্নলিখিত প্রশ্নটি সমাধান করার চেষ্টা করছি:

প্লেয়ার এ 25 টির মধ্যে 17 টি জিতেছে এবং খেলোয়াড় বি 20 এর মধ্যে 8 জিতেছে - উভয় অনুপাতের মধ্যে কি উল্লেখযোগ্য পার্থক্য রয়েছে?

আরে যা করার কথা মনে আসে তা হ'ল:

> prop.test(c(17,8),c(25,20),correct=FALSE)

    2-sample test for equality of proportions without continuity correction

data:  c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
 -0.002016956  0.562016956
sample estimates:
prop 1 prop 2 
  0.68   0.40 

সুতরাং এই পরীক্ষা বলছে যে 95% আত্মবিশ্বাসের স্তরে পার্থক্যটি উল্লেখযোগ্য নয়।

কারণ আমরা জানি যে prop.test()কেবলমাত্র একটি আনুমানিক ব্যবহার করছি আমি একটি সঠিক দ্বিপদী পরীক্ষা ব্যবহার করে জিনিসগুলিকে আরও নির্ভুল করতে চাই - এবং আমি এটি উভয় উপায়েই করি:

> binom.test(x=17,n=25,p=8/20)

    Exact binomial test

data:  17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
 0.4649993 0.8505046
sample estimates:
probability of success 
                  0.68 

> binom.test(x=8,n=20,p=17/25)

    Exact binomial test

data:  8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
 0.1911901 0.6394574
sample estimates:
probability of success 
                   0.4 

এখন এটা আজব, তাই না? পি-মানগুলি প্রতিটি সময় সম্পূর্ণ আলাদা! উভয় ক্ষেত্রেই এখন ফলাফলগুলি (অত্যন্ত) তাৎপর্যপূর্ণ তবে পি-মানগুলি অদম্যভাবে লাফিয়ে উঠবে বলে মনে হয়।

আমার প্রশ্নগুলো

  1. কেন P-মান যে বিভিন্ন প্রতিটি সময়?
  2. আর-তে সঠিক দুটি নমুনা অনুপাত দ্বিপদী পরীক্ষা কীভাবে সম্পাদন করবেন?

3
যদিও আর ফাংশনটি ভিন্ন ( prop.testবনাম chisq.test), একই অন্তর্নিহিত ধারণাটি এই প্রশ্নে । আপনি আপনার তিনটি উদাহরণের প্রত্যেকটিতে পৃথক "নাল হাইপোথিসিস" দিয়ে তিনটি পৃথক পরীক্ষা চালাচ্ছেন।
এফাইন

উত্তর:


26

আপনি যদি দুটি দ্বিপদী অনুপাতের জন্য 'নির্ভুল' পরীক্ষা খুঁজছেন, আমি বিশ্বাস করি আপনি ফিশারের নির্ভুল পরীক্ষাটি খুঁজছেন । আর-তে এটি প্রয়োগ করা হয়:

> fisher.test(matrix(c(17, 25-17, 8, 20-8), ncol=2))
    Fisher's Exact Test for Count Data
data:  matrix(c(17, 25 - 17, 8, 20 - 8), ncol = 2)
p-value = 0.07671
alternative hypothesis: true odds ratio is not equal to 1
95 percent confidence interval:
  0.7990888 13.0020065
sample estimates:
odds ratio 
  3.101466 

fisher.testফাংশন 'সফলতা' এবং 'ব্যর্থতা দুই দ্বিপদ অনুপাত একটি ম্যাট্রিক্স বস্তুর গ্রহণ করে। আপনি দেখতে পাচ্ছেন, তবে, দ্বিমুখী অনুমানটি এখনও তাত্পর্যপূর্ণ নয়, দুঃখের সাথে বলতে চাই। তবে, ফিশারের নির্ভুল পরীক্ষা সাধারণত তখনই প্রয়োগ করা হয় যখন কোনও ঘর গণনা কম থাকে (সাধারণত এটির অর্থ 5 বা এর চেয়ে কম তবে কেউ কেউ 10 বলে), সুতরাং আপনার প্রাথমিক ব্যবহারটি prop.testআরও উপযুক্ত।

আপনার binom.testকল সম্পর্কিত, আপনি কলটি ভুল বুঝছেন। যখন আপনি চালনা করেন binom.test(x=17,n=25,p=8/20)আপনি অনুপাতটি এমন জনসংখ্যার তুলনায় উল্লেখযোগ্যভাবে পৃথক কিনা যেখানে সাফল্যের সম্ভাবনা 8/20 হয় তা পরীক্ষা করে দেখছেন । অনুরূপভাবে সঙ্গে binom.test(x=8,n=20,p=17/25)বলছেন সাফল্যের সম্ভাবনা 17/25 হয় যার কারণে এই P-মান পৃথক। অতএব আপনি দুটি অনুপাতকে মোটেই তুলনা করছেন না।


2
ধন্যবাদ, আমি আপনার উত্তর গ্রহণ করেছি। যখন আপনি বলছেন প্রোপস্টেস্টটি "আরও উপযুক্ত" তবে আপনি ঠিক কী বোঝাতে চাইছেন? আরও সঠিক ফলাফলটি (আক্ষরিক) ফিশারের এক্সেক্ট টেস্ট দ্বারা দেওয়া হয়েছে, তাই না?
ভনজড

4
এটি আসলে এমন একটি বিষয় যা পরিসংখ্যানবিদদের মধ্যে বিতর্কিত এবং আমার কাছে এর কোনও প্রত্যুত্তর উত্তর নেই। .তিহাসিকভাবে, আপনি ফিশারকে এড়িয়ে গেছেন কারণ এটি খুব কম কম্পিউটেশনাল জটিল হয়ে পড়ে তবে কম্পিউটারটি এর চারপাশে get সাধারণভাবে বলতে গেলে, ফিশারের নির্ভুল পরীক্ষাটি রক্ষণশীল এবং যদি আপনার সংখ্যাগুলি যথেষ্ট পরিমাণে বড় হয় তবে চি-বর্গাকার পরিসংখ্যান (যা এটি prop.testগণনা করে) কোনও ধরণের দ্বিতীয় ত্রুটি না করার সম্ভাবনা বেশি।
সিডিটারম্যান

আমার কাছে গুরুত্বপূর্ণ বিষয়টি হ'ল এর বিভিন্ন শব্দার্থক শব্দসমূহ prop.testএবং fisher.test: পূর্ববর্তীটিকে বলা হয় prop.test(matrix(c(17, 8, 25, 20), ncol=2))(প্রথম কলামে সাফল্যের সংখ্যা এবং দ্বিতীয় কলামে বিচারের সংখ্যা দেওয়া ), তবে পরেরটিটিকে বলা হয় fisher.test(matrix(c(17, 25-17, 8, 20-8), ncol=2))(সাফল্যের সংখ্যা প্রদান করা) এবং ব্যর্থতা ); কারণ fisher.test, স্থানান্তরও ফল পরিবর্তন করে না বলে মনে হয়।
krlMLr

আরও শক্তিশালী বিকল্প 2x2 পরীক্ষার জন্যও পাওয়া যায় - en.wikedia.org/wiki/Barnard%27s_test
হামি

4

একটি পরিচিত অনুমানের তুলনায় দুটি নমুনা এবং একটি নমুনার মধ্যে পার্থক্য রয়েছে। সুতরাং যদি কেউ 100 বার একটি মুদ্রা উল্টায় এবং 55 বার মাথা পায় এবং অনুমানটি একটি ন্যায্য মুদ্রা, বনাম দু'জন লোক অজানা ন্যায্যতার একটি মুদ্রা উল্টায় এবং একজন 55 বার এবং অন্যটি 45 বার পেয়ে যায়। প্রাক্তন ক্ষেত্রে আপনি কেবল সনাক্ত করার চেষ্টা করছেন যে যদি ফ্লিপারটি কোনও ন্যায্য মুদ্রা উল্টায়। পরবর্তীকালে, আপনি দেখতে পাচ্ছেন যে তারা একই ন্যায্যতার মুদ্রা উল্টাচ্ছে কিনা। আপনি যদি দেখতে পাচ্ছেন যে আপনি যদি প্রতিটি খেলোয়াড়কে জ্ঞাত সম্ভাবনার (45 বনাম 50 এবং 55 বনাম 50) এর বিপরীতে দেখছেন তবে একে অপরের সাথে তুলনা করার চেয়ে আলাদা (45 বনাম 55)।


2

binom.testজনসংখ্যা বিন্দুর অনুমানের তুলনায় বেশ কয়েকটি পরীক্ষার মধ্যে এর সিনট্যাক্সটি আপনার সাফল্য । যদিও আপনি এটি পি = 8/20 হিসাবে প্রবেশ করেছেন, গণনাটি এমন যেন Godশ্বর প্রদত্ত পরম-সত্য 0.4 যার চারপাশে শূন্য প্রকরণ রয়েছে। অথবা এটি এমন হয় যে আপনি প্লেয়ার এ এর ​​সাথে তুলনা করছেন 25 এর মধ্যে 17 জয়ের সাথে খেলোয়াড় বি এর অনুমানমূলক 20 বিলিয়ন গেমগুলির মধ্যে 8 বিলিয়ন জয়ের যাইহোক, এর prop.testসমস্ত সম্ভাব্য প্রকরণের সাথে তার নিজস্ব বিবর্তনের সাথে 8/20 এর অনুপাতের সাথে 17/25 এর অনুপাতের তুলনা করে। অন্য কথায় প্রায় 0.7 (17/25 এর অনুমান) এবং বৈকল্পিক 0.4 এর আশেপাশে পি = 0.06 এর সাথে একে অপরের মধ্যে রক্তক্ষরণ হতে পারে ।


সুতরাং এর অর্থ হ'ল আসল প্রশ্নটি সমাধান করার সঠিক উপায় prop.test(c(17,8),c(25,20),correct=FALSE), তাই না?
ভনজড

1
হা এটা ঠিক. আপনি কিনা তোমার উচিত ছিল যেমন নির্দেশিকা চান correct = FALSEবনাম correct = TRUEতারপর আমি আপনি নিম্নলিখিত পড়া করার পরামর্শ দিই stats.stackexchange.com/questions/185433/...
Farrel

2

প্রথমে আমি আপনাকে পরামর্শ দেব যে আপনি একটি ধারাবাহিকতা সংশোধন করতে চান, যেহেতু আপনি অবিচ্ছিন্ন (চি-স্কোয়ার) বিতরণ দিয়ে একটি বিচ্ছিন্ন বিতরণ অনুমান করছেন।

দ্বিতীয়ত, "পরীক্ষা" কীভাবে পরিচালিত হয়েছিল তা কীভাবে পরিষ্কার হবে তা জরুরী। প্রতিটি ব্যক্তি খেলেছে এমন খেলাগুলির সংখ্যা কি আগে থেকেই নির্ধারিত ছিল (বা শিল্পের স্থানীয় ভাষায়, ডিজাইনের মাধ্যমে স্থির)? যদি তা হয়, এবং আরও ধরে নেওয়া হয় যে প্রতিটি খেলোয়াড়ের ফলাফল অপরটির তুলনায় স্বতন্ত্র, আপনি 2 বাইনোমিয়াল বিতরণের পণ্যটি নিয়ে কাজ করছেন। পরিবর্তে গেমের সংখ্যা পৃথক হয়ে থাকতে পারে (উদাহরণস্বরূপ বলুন, প্রতিটি ব্যক্তি যে খেলাগুলি খেলেছে তার পরিমাণগুলি ভেরিয়েবল ছিল, প্রতিটি গেমের সংখ্যার উপর ভিত্তি করে প্রতিটি নির্দিষ্ট সময়সীমার মধ্যে সম্পন্ন করতে সক্ষম হয়), তবে আপনি বহুজাতিক নিয়ে কাজ করছেন বা পোইসন বিতরণ।

দ্বিতীয় ক্ষেত্রে চি-বর্গ পরীক্ষা (বা একই জিনিসটি কী, অনুপাতের পার্থক্যের একটি z- পরীক্ষা) উপযুক্ত তবে পূর্বের ক্ষেত্রে এটি হয় না। প্রথম ক্ষেত্রে, আপনাকে অবশ্যই প্রতিটি খেলোয়াড়ের জন্য প্রতিটি সম্ভাব্য দ্বিপদী ফলাফলের সঠিক পণ্য গণনা করতে হবে, এবং যে ফলাফলগুলি দেখা গেছে তার যৌথ দ্বিপদী সম্ভাবনার চেয়ে সমান বা তার চেয়ে কম যে সমস্ত ঘটনার জন্য এই সম্ভাবনাগুলি যোগ করতে হবে (এটি সহজভাবে 2 বাইনোমিয়ালের পণ্য কারণ প্রতিটি প্লেয়ারের ফলাফল অন্য প্লেয়ারের ফলাফলের চেয়ে পৃথক থাকে)।

প্রথমে সনাক্ত করুন যে কোনও অনুমানের পরীক্ষার কেন্দ্রীয় উদ্দেশ্য হ'ল অন্যান্য সম্ভাব্য ফলাফলগুলির তুলনায়, আপনি যে নির্দিষ্ট ফলাফলটি লক্ষ্য করেছেন তা ঠিক "বিরল" বা অস্বাভাবিক কী তা গণনা করা। নাল অনুমানটি সত্য - এই ধারণাটি প্রদানের পরে যে সমান বা নিম্ন সম্ভাবনার সমস্ত অন্যান্য সম্ভাব্য ফলাফলের সাথে একত্রে সংক্ষিপ্তসার করা হয়েছে - এই ফলাফলটি আপনি যে ফলাফল দেখেছেন তার সম্ভাবনা গণনা করে এটি গণনা করা হয়।

এখন এটি পুনরাবৃত্তি করে যে আমাদের "কত বিরল" বলতে যা বোঝায় তা "অন্যান্য সমস্ত সম্ভাব্য ফলাফলের তুলনায় প্রাপ্ত ফলাফল পর্যবেক্ষণের সম্ভাবনা কতটা কম?" ঠিক আছে, আমরা যে নির্দিষ্ট ফলাফলটি পর্যবেক্ষণ করেছি তার সম্ভাবনা হ'ল 0.0679 * 0.0793 = 0.005115। এখন একটি নির্দিষ্ট বিকল্প ফলাফল বিবেচনা করুন: এটি সম্ভবত সম্ভাব্য যে প্লেয়ার এ তার 20 টি খেলায় 7 জিততে পারত এবং প্লেয়ার বি তার 25 খেলাগুলির মধ্যে 13 টিতে জিততে পারত। এই ফলাফলের সম্ভাবনা 0.004959। নোট করুন যে এটি আমাদের পর্যবেক্ষণের ফলাফলের সম্ভাবনার চেয়ে কম, সুতরাং এটি পি-মান অন্তর্ভুক্ত করা উচিত। তবে আবার দেখুন: আমাদের পর্যবেক্ষণের ফলাফলের অনুপাতের পার্থক্যের তুলনায় অনুপাতের পার্থক্য অতিক্রম করে কিনা তার ভিত্তিতে আপনি কী ফলাফলগুলি আপনার সমষ্টিতে অন্তর্ভুক্ত করবেন তা যদি সিদ্ধান্ত নিচ্ছেন তবে এই সম্ভাবনাটি বাদ দেওয়া হবে! কেন? কারণ এই নির্দিষ্ট ফলাফলের অনুপাতের পার্থক্য আমাদের পর্যবেক্ষণের ফলাফলের অনুপাতের পার্থক্যের চেয়ে কম। তবে এটি যথাযথ ফোকাস নয় - আমাদের অবশ্যই এই নির্দিষ্ট ফলাফলের সম্ভাব্যতা নিয়ে উদ্বিগ্ন হতে হবে এবং এটি যে ফলাফলটি আমরা লক্ষ্য করেছি তার সম্ভাবনার চেয়ে সমান বা কম কিনা!

এর একটি ভাল আনুষ্ঠানিক ব্যাখ্যা এখানে পাওয়া যাবে:

http://data.princeton.edu/wws509/notes/c5.pdf

দয়া করে 9 নং পৃষ্ঠায় বিশেষভাবে বিবৃতিটি নোট করুন যে "যদি সারি মার্জিন স্থির হয় এবং নমুনা স্কিম দ্বিপদী হয় তবে আমাদের অবশ্যই পণ্য দ্বিপদী মডেলটি ব্যবহার করতে হবে, কারণ আমরা আরও তথ্য ব্যতীত দুটি ভেরিয়েবলের জন্য যৌথ বন্টন অনুমান করতে পারি না।"


আর কোডের জন্য যা যৌথ দ্বিপদী সম্ভাবনার সমষ্টি গণনা করে যা পর্যবেক্ষণের ফলাফলের সম্ভাবনার তুলনায় সমান বা নিম্ন সম্ভাবনা রয়েছে, নিম্নলিখিত সম্পর্কিত পোস্টের উত্তরটি দেখুন: stats.stackexchange.com/questions/213295/…
ব্যবহারকারী221943
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.