সংক্ষিপ্তসার
ডেটা ছাড়িয়ে গেছে count 3.5 অজানা সম্ভাবনা সহ দ্বিপদী বিতরণ রয়েছে p। এর দ্বিপদী পরীক্ষা পরিচালনা করতে এটি ব্যবহার করুনp=1/2 বিকল্পের বিরুদ্ধে p≠1/2।
এই পোস্টের বাকি অংশগুলি অন্তর্নিহিত মডেলটি ব্যাখ্যা করে এবং গণনাগুলি কীভাবে সম্পাদন করবে তা দেখায়। এটি R
তাদের বহন করার জন্য ওয়ার্কিং কোড সরবরাহ করে। অন্তর্নিহিত হাইপোথিসিস টেস্টিং তত্ত্বের একটি বর্ধিত বিবরণ "পরিসংখ্যান পরীক্ষায় পি-ভ্যালু এবং টি-মানগুলির অর্থ কী?" এর উত্তরটিতে আমার জবাব দেওয়া আছে ? ।
পরিসংখ্যানের মডেল
মান ধরে নিলে যুক্তিসঙ্গতভাবে বৈচিত্র্য রয়েছে (কিছু সংযোগের সাথে) 3.5), তারপরে আপনার নাল অনুমানের অধীনে, যেকোন এলোমেলোভাবে নমুনা মানের একটি হয় value 1/2=50% অতিক্রম করার সুযোগ 3.5 (থেকে 3.5জনসংখ্যার মধ্যম মান হিসাবে চিহ্নিত করা হয়)। সব ধরে নিচ্ছি250 মানগুলি এলোমেলোভাবে এবং স্বাধীনভাবে নমুনাযুক্ত ছিল, তাদের সংখ্যা অতিক্রম করে 3.5 সুতরাং একটি দ্বিপদী থাকবে(250,1/2)বন্টন। আসুন এই নাম্বারটিকে "গণনা," বলিk।
অন্যদিকে, জনসংখ্যার মধ্যমা যদি পৃথক হয় 3.5, এলোমেলোভাবে নমুনাযুক্ত মানটি ছাড়িয়ে যাওয়ার সুযোগ 3.5 থেকে পৃথক হবে 1/2। এটি হ'ল বিকল্প অনুমান।
একটি উপযুক্ত পরীক্ষা সন্ধান করা
নাল পরিস্থিতিটিকে তার বিকল্পগুলি থেকে আলাদা করার সর্বোত্তম উপায় হ'ল মানগুলির দিকে নজর দেওয়া kএগুলি সম্ভবত নালীর নীচে এবং বিকল্পগুলির মধ্যে কম সম্ভাবনা রয়েছে। এই কাছাকাছি মান1/2 এর 250, সমান 125। সুতরাং, আপনার পরীক্ষার জন্য একটি সমালোচনামূলক অঞ্চল তুলনামূলকভাবে অনেক দূরের মানগুলি নিয়ে গঠিত125: কাছাকাছি 0 বা কাছাকাছি 250। তবে কতদূর125 তাদের অবশ্যই তাৎপর্যপূর্ণ প্রমাণ গঠন করতে হবে 3.5 জনসংখ্যার মাঝারি না?
আপনার তাত্পর্যটির মানের উপর নির্ভর করে: একে পরীক্ষার আকার বলা হয় , প্রায়শই বলা হয়α। নাল অনুমানের অধীনে, এর কাছাকাছি থাকা উচিত - তবে এর চেয়ে বেশি নয় - এα সুযোগ যে k সমালোচনামূলক অঞ্চলে হবে।
সাধারণত, যখন কোন বিকল্পটি প্রয়োগ হবে সে সম্পর্কে আমাদের কোনও পূর্ব ধারণা নেই - একটি মিডিয়ান এর চেয়ে বড় বা তার চেয়ে কম 3.5- আমরা সমালোচনামূলক অঞ্চলটি তৈরির চেষ্টা করি যাতে সেই সুযোগের অর্ধেক থাকে, α/2, যে k কম এবং অন্য অর্ধেক, α/2, যে kউচ্চ. কারণ আমরা এর বিতরণ জানিk নাল অনুমানের অধীনে, এই তথ্য সমালোচনামূলক অঞ্চল নির্ধারণ করার জন্য যথেষ্ট।
প্রযুক্তিগতভাবে, গণনাটি সম্পাদন করার দুটি সাধারণ উপায় রয়েছে: দ্বিপদী সম্ভাব্যতাগুলি গণনা করুন বা সাধারণ বন্টন দিয়ে তাদের আনুমানিক করুন।
দ্বিপদী সম্ভাব্যতার সাথে গণনা
শতাংশ পয়েন্ট (কোয়ান্টাইল) ফাংশনটি ব্যবহার করুন। ইন R
, উদাহরণস্বরূপ, এই বলা হয় qbinom
এবং মত প্রার্থনা করা হবে
alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)
জন্য আউটপুট α=0.05 হয়
109 141
এর অর্থ এই যে সমালোচনামূলক অঞ্চলটি নীচের সমস্ত নিম্ন মানের সমন্বিত k (এবং সহ) মধ্যে 0 এবং 109সমস্ত উচ্চ মানের সাথে একসাথে k (এবং সহ) মধ্যে 141 এবং 250। একটি পরীক্ষা হিসাবে, নাল সত্য হলে আমরা সেই অঞ্চলে যে R
সুযোগটি পড়ে আছে তা গণনা করতে বলতে পারি k
:
pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))
আউটপুট হয় 0.0497এর খুব কাছাকাছি - তবে এর চেয়ে বড় নয় -αনিজেই। কারণ সমালোচনামূলক অঞ্চলটি একটি সম্পূর্ণ সংখ্যায় শেষ হতে হবে, সাধারণত এই প্রকৃত পরীক্ষার আকারটি নামমাত্র পরীক্ষার আকারের ঠিক সমান করা সম্ভব হয় নাα, তবে এই ক্ষেত্রে দুটি মান সত্যই খুব কাছাকাছি।
সাধারণ আনুমানিক সহ গণনা
দ্বিপদী এর গড়(250,1/2) বিতরণ হয় 250×1/2=125 এবং তার বৈকল্পিক হয় 250×1/2×(1−1/2)=250/4এর মানক বিচ্যুতির সমান করে 250/4−−−−−√≈7.9। আমরা দ্বিপদী বিতরণকে একটি সাধারণ বিতরণ দিয়ে প্রতিস্থাপন করব। স্ট্যান্ডার্ড সাধারণ বিতরণ আছেα/2=0.05/2 এর সম্ভাবনা কম −1.95996R
কমান্ড দ্বারা গণিত
qnorm(alpha/2)
কারণ সাধারণ বিতরণগুলি প্রতিসম হয়, এটিরও রয়েছে 0.05/2 এর সম্ভাবনার চেয়ে বেশি +1.95996। অতএব সমালোচনামূলক অঞ্চলটি মানগুলির সমন্বয়ে গঠিতk এর চেয়েও বেশি 1.95996 স্ট্যান্ডার্ড বিচ্যুতি দূরে 125। এই থ্রেশহোল্ডগুলি গণনা করুন: তারা সমান125±7.9×1.96≈109.5,140.5। হিসাবটি একটি ঝাপটায় চালানো যেতে পারে
250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)
থেকে k পুরো সংখ্যাটি হতে হবে, আমরা দেখি এটি যখন সমালোচনামূলক অঞ্চলে পড়বে 109 বা কম বা 141বা আরও বড়। এই উত্তরটি সঠিক দ্বিপদী গণনা ব্যবহার করে পাওয়া প্রশ্নের অনুরূপ। সাধারণত যখন কেস হয়p কাছাকাছি 1/2 এটা তুলনায় 0 অথবা 1, নমুনার আকার মাঝারি থেকে বড় (দশক বা আরও বেশি) এবং α খুব ছোট নয় (কয়েক শতাংশ)।
এই পরীক্ষাটি, কারণ এটি জনসংখ্যার বিষয়ে কিছুই ধরে নেয় না (কেবলমাত্র এটির মাঝারিটির দিকে খুব বেশি মনোযোগ কেন্দ্রীভূত হয় না), জনগণের বিষয়ে নির্দিষ্ট অনুমান করা অন্যান্য পরীক্ষার মতো শক্তিশালী নয়। তবুও যদি পরীক্ষাটি নালাকে প্রত্যাখ্যান করে তবে পাওয়ারের অভাব নিয়ে উদ্বিগ্ন হওয়ার দরকার নেই। অন্যথায়, আপনি কী ধরে নিতে ইচ্ছুক এবং জনসংখ্যার বিষয়ে আপনি কী উপসংহারে পৌঁছাতে সক্ষম হচ্ছেন সেগুলির মধ্যে আপনাকে কিছু সূক্ষ্ম বাণিজ্য করতে হবে ।