কিভাবে একটি জনসংখ্যার মধ্যমা পরীক্ষা করতে হবে?


9

আমার 250 টি ইউনিটের নমুনা রয়েছে। বিতরণ অসম্পূর্ণ। আমি একটি অনুমান পরীক্ষা করতে চাই যে জনসংখ্যার মাঝারিটি 3.5 এর চেয়ে আলাদা, তাই আমি মনে করি একটি এক-নমুনা পরীক্ষা উপযুক্ত হবে। আমি জানি যে উইলকক্সন র‌্যাঙ্ক পরীক্ষাটি উপযুক্ত নয় কারণ বিতরণটি প্রতিসম নয়। সাইন টেস্ট ব্যবহার করা কি উপযুক্ত? তা না হলে কেউ কি অন্য কোনও পরীক্ষার সুপারিশ করতে পারে?


3
আপনি প্রথম কারণেই আমাকে হারিয়েছেন বেশ কয়েকটি কারণে। (1) কোনও নমুনায় গাউসীয় বিতরণ থাকতে পারে না (তবে এটির প্রায় একটি থাকতে পারে)। (২) সমস্ত গাউসীয় বিতরণের একটি বৈশিষ্ট্য (এবং তাই তাদের নিকটবর্তীকরণের ) প্রতিসাম্য । আপনি নিজেকে বিরোধিতা করেছেন। পরিসংখ্যানগত জারগনের পরিবর্তে আপনার নিজের ডেটাগুলি নিজের শর্তে বর্ণনা করে আপনার কাছে যা আছে তা ভালভাবে যোগাযোগ করবেন communicate আপনি কীভাবে যথাসম্ভব স্পষ্টভাবে ব্যাখ্যা করতে পারেন, আপনার ডেটা দিয়ে আপনি কী সম্পাদন করতে চান? "মিডিয়ানের উপর ভিত্তি করে নমুনা পরীক্ষা" কী ধরণের তথ্য আপনাকে দেওয়ার উদ্দেশ্যে?
whuber

1
নমুনার মাঝারি এটি যাই হোক না কেন; এটি পরীক্ষা করার প্রয়োজন হবে না। সম্ভবত আপনি পরীক্ষা করতে চান যে জনসংখ্যার মধ্যম (যেখান থেকে নমুনা প্রাপ্ত হয়) এর সমান ? যদি তা হয় তবে এটি কীভাবে এর মান বিকশিত হয়েছিল তা জানা গুরুত্বপূর্ণ । এটি সম্ভবত অন্য কিছু ডেটাসেটের সংক্ষিপ্তসার? বা এটি কি কোনও পূর্বনির্ধারিত সংখ্যা, যেমন মানের মানের? 3.53.5
whuber

1
এটি পূর্ব নির্ধারিত সংখ্যা
লিওনরুপনিক

2
" বন্টন অসম্পূর্ণ, তাই আমি যদি জনসংখ্যার মধ্যমা 3.5 থেকে পৃথক হয় তবে একটি হাইপোথিসিস পরীক্ষা করতে চাই ..." - কেন অনুমিতিটি আকর্ষণীয় বলে কোন নমুনায় অসম্পূর্ণ প্রভাব ফেলবে?" কোনও সাইন টেস্টটি কি ব্যবহারের জন্য উপযুক্ত? " - নিশ্চিত, তবে (কমপক্ষে মূল আকারে) এটি ধারাবাহিকতার উপর নির্ভর করে - আপনার ভেরিয়েবলটি যদি আলাদা হয় তবে আপনাকে এটি খাপ খাইয়ে নিতে হবে (আপনার ডেটা কী রয়েছে তা আপনি বলবেন না) ।
গ্লেন_বি -রিনস্টেট মনিকা

ডেটা অবিচ্ছিন্ন
লিওন রুপনিক

উত্তর:


8

সংক্ষিপ্তসার

ডেটা ছাড়িয়ে গেছে count 3.5 অজানা সম্ভাবনা সহ দ্বিপদী বিতরণ রয়েছে p। এর দ্বিপদী পরীক্ষা পরিচালনা করতে এটি ব্যবহার করুনp=1/2 বিকল্পের বিরুদ্ধে p1/2

এই পোস্টের বাকি অংশগুলি অন্তর্নিহিত মডেলটি ব্যাখ্যা করে এবং গণনাগুলি কীভাবে সম্পাদন করবে তা দেখায়। এটি Rতাদের বহন করার জন্য ওয়ার্কিং কোড সরবরাহ করে। অন্তর্নিহিত হাইপোথিসিস টেস্টিং তত্ত্বের একটি বর্ধিত বিবরণ "পরিসংখ্যান পরীক্ষায় পি-ভ্যালু এবং টি-মানগুলির অর্থ কী?" এর উত্তরটিতে আমার জবাব দেওয়া আছে ?

পরিসংখ্যানের মডেল

মান ধরে নিলে যুক্তিসঙ্গতভাবে বৈচিত্র্য রয়েছে (কিছু সংযোগের সাথে) 3.5), তারপরে আপনার নাল অনুমানের অধীনে, যেকোন এলোমেলোভাবে নমুনা মানের একটি হয় value 1/2=50% অতিক্রম করার সুযোগ 3.5 (থেকে 3.5জনসংখ্যার মধ্যম মান হিসাবে চিহ্নিত করা হয়)। সব ধরে নিচ্ছি250 মানগুলি এলোমেলোভাবে এবং স্বাধীনভাবে নমুনাযুক্ত ছিল, তাদের সংখ্যা অতিক্রম করে 3.5 সুতরাং একটি দ্বিপদী থাকবে(250,1/2)বন্টন। আসুন এই নাম্বারটিকে "গণনা," বলিk

অন্যদিকে, জনসংখ্যার মধ্যমা যদি পৃথক হয় 3.5, এলোমেলোভাবে নমুনাযুক্ত মানটি ছাড়িয়ে যাওয়ার সুযোগ 3.5 থেকে পৃথক হবে 1/2। এটি হ'ল বিকল্প অনুমান।

একটি উপযুক্ত পরীক্ষা সন্ধান করা

নাল পরিস্থিতিটিকে তার বিকল্পগুলি থেকে আলাদা করার সর্বোত্তম উপায় হ'ল মানগুলির দিকে নজর দেওয়া kএগুলি সম্ভবত নালীর নীচে এবং বিকল্পগুলির মধ্যে কম সম্ভাবনা রয়েছে। এই কাছাকাছি মান1/2 এর 250, সমান 125। সুতরাং, আপনার পরীক্ষার জন্য একটি সমালোচনামূলক অঞ্চল তুলনামূলকভাবে অনেক দূরের মানগুলি নিয়ে গঠিত125: কাছাকাছি 0 বা কাছাকাছি 250। তবে কতদূর125 তাদের অবশ্যই তাৎপর্যপূর্ণ প্রমাণ গঠন করতে হবে 3.5 জনসংখ্যার মাঝারি না?

আপনার তাত্পর্যটির মানের উপর নির্ভর করে: একে পরীক্ষার আকার বলা হয় , প্রায়শই বলা হয়α। নাল অনুমানের অধীনে, এর কাছাকাছি থাকা উচিত - তবে এর চেয়ে বেশি নয় - এα সুযোগ যে k সমালোচনামূলক অঞ্চলে হবে।

সাধারণত, যখন কোন বিকল্পটি প্রয়োগ হবে সে সম্পর্কে আমাদের কোনও পূর্ব ধারণা নেই - একটি মিডিয়ান এর চেয়ে বড় বা তার চেয়ে কম 3.5- আমরা সমালোচনামূলক অঞ্চলটি তৈরির চেষ্টা করি যাতে সেই সুযোগের অর্ধেক থাকে, α/2, যে k কম এবং অন্য অর্ধেক, α/2, যে kউচ্চ. কারণ আমরা এর বিতরণ জানিk নাল অনুমানের অধীনে, এই তথ্য সমালোচনামূলক অঞ্চল নির্ধারণ করার জন্য যথেষ্ট।

প্রযুক্তিগতভাবে, গণনাটি সম্পাদন করার দুটি সাধারণ উপায় রয়েছে: দ্বিপদী সম্ভাব্যতাগুলি গণনা করুন বা সাধারণ বন্টন দিয়ে তাদের আনুমানিক করুন।

দ্বিপদী সম্ভাব্যতার সাথে গণনা

শতাংশ পয়েন্ট (কোয়ান্টাইল) ফাংশনটি ব্যবহার করুন। ইন R, উদাহরণস্বরূপ, এই বলা হয় qbinomএবং মত প্রার্থনা করা হবে

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

জন্য আউটপুট α=0.05 হয়

109 141

এর অর্থ এই যে সমালোচনামূলক অঞ্চলটি নীচের সমস্ত নিম্ন মানের সমন্বিত k (এবং সহ) মধ্যে 0 এবং 109সমস্ত উচ্চ মানের সাথে একসাথে k (এবং সহ) মধ্যে 141 এবং 250। একটি পরীক্ষা হিসাবে, নাল সত্য হলে আমরা সেই অঞ্চলে যে Rসুযোগটি পড়ে আছে তা গণনা করতে বলতে পারি k:

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

আউটপুট হয় 0.0497এর খুব কাছাকাছি - তবে এর চেয়ে বড় নয় -αনিজেই। কারণ সমালোচনামূলক অঞ্চলটি একটি সম্পূর্ণ সংখ্যায় শেষ হতে হবে, সাধারণত এই প্রকৃত পরীক্ষার আকারটি নামমাত্র পরীক্ষার আকারের ঠিক সমান করা সম্ভব হয় নাα, তবে এই ক্ষেত্রে দুটি মান সত্যই খুব কাছাকাছি।

সাধারণ আনুমানিক সহ গণনা

দ্বিপদী এর গড়(250,1/2) বিতরণ হয় 250×1/2=125 এবং তার বৈকল্পিক হয় 250×1/2×(11/2)=250/4এর মানক বিচ্যুতির সমান করে 250/47.9। আমরা দ্বিপদী বিতরণকে একটি সাধারণ বিতরণ দিয়ে প্রতিস্থাপন করব। স্ট্যান্ডার্ড সাধারণ বিতরণ আছেα/2=0.05/2 এর সম্ভাবনা কম 1.95996Rকমান্ড দ্বারা গণিত

qnorm(alpha/2)

কারণ সাধারণ বিতরণগুলি প্রতিসম হয়, এটিরও রয়েছে 0.05/2 এর সম্ভাবনার চেয়ে বেশি +1.95996। অতএব সমালোচনামূলক অঞ্চলটি মানগুলির সমন্বয়ে গঠিতk এর চেয়েও বেশি 1.95996 স্ট্যান্ডার্ড বিচ্যুতি দূরে 125। এই থ্রেশহোল্ডগুলি গণনা করুন: তারা সমান125±7.9×1.96109.5,140.5। হিসাবটি একটি ঝাপটায় চালানো যেতে পারে

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

থেকে k পুরো সংখ্যাটি হতে হবে, আমরা দেখি এটি যখন সমালোচনামূলক অঞ্চলে পড়বে 109 বা কম বা 141বা আরও বড়। এই উত্তরটি সঠিক দ্বিপদী গণনা ব্যবহার করে পাওয়া প্রশ্নের অনুরূপ। সাধারণত যখন কেস হয়p কাছাকাছি 1/2 এটা তুলনায় 0 অথবা 1, নমুনার আকার মাঝারি থেকে বড় (দশক বা আরও বেশি) এবং α খুব ছোট নয় (কয়েক শতাংশ)।


এই পরীক্ষাটি, কারণ এটি জনসংখ্যার বিষয়ে কিছুই ধরে নেয় না (কেবলমাত্র এটির মাঝারিটির দিকে খুব বেশি মনোযোগ কেন্দ্রীভূত হয় না), জনগণের বিষয়ে নির্দিষ্ট অনুমান করা অন্যান্য পরীক্ষার মতো শক্তিশালী নয়। তবুও যদি পরীক্ষাটি নালাকে প্রত্যাখ্যান করে তবে পাওয়ারের অভাব নিয়ে উদ্বিগ্ন হওয়ার দরকার নেই। অন্যথায়, আপনি কী ধরে নিতে ইচ্ছুক এবং জনসংখ্যার বিষয়ে আপনি কী উপসংহারে পৌঁছাতে সক্ষম হচ্ছেন সেগুলির মধ্যে আপনাকে কিছু সূক্ষ্ম বাণিজ্য করতে হবে ।


2
যেহেতু এটি কার্যত আপনার আরও বিমূর্ত " পি-ভ্যালুর অর্থ " উত্তরটির একটি কাজের উদাহরণ , কেবল একই দর্শনের সন্ধানে নয়, যেভাবে আপনার উত্তরটি কাঠামোগত করা হয়েছে, আমি মনে করি আপনার এটির লিঙ্ক করা উচিত ("উদাহরণস্বরূপ) এটি বাস্তবে কীভাবে প্রয়োগ করা হয় তা আমার উত্তর ... ") এর উত্তরে সেখানে আপনার উত্তরের উপসংহারে পাওয়া যাবে।
সিলভারফিশ

2
@ সিলভার আপনাকে ধন্যবাদ; এটা সত্যিই আমার মন অতিক্রম করেছে। আমি ভেবেছিলাম প্রথমে কিছুটা অপেক্ষা করতে পারি। অন্যান্য বিষয়গুলির মধ্যে, আমি যদি কিছু উদ্যোগী সম্প্রদায়ের সদস্য একটি সদৃশ থ্রেড খনন করতে চাই, তবে আমি অবাক হব না, যা আমি আরও ঘনিষ্ঠভাবে পরীক্ষা করতে চাই। সর্বোপরি, এটি মৌলিক উপাদান - দ্বিপদী পরীক্ষা সম্পর্কে প্রচুর প্রশ্ন জিজ্ঞাসা করেছে। এইটির নতুন হওয়ার একমাত্র দাবিটি হ'ল এটি একটি মেডিয়ান পরীক্ষার প্রয়োজন হিসাবে এখানে পৌঁছেছিল - সুতরাং এটি শুরুতেই দ্বিপাক্ষিক পরীক্ষা ছিল না - এবং আমার উত্তরটির যোগ্য হওয়ার একমাত্র দাবী ছিল পড়া প্রতিটি পদক্ষেপ ব্যাখ্যা করার জন্য তার প্রচেষ্টা মিথ্যা।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.