বন্টনের সাম্যের জন্য চি-বর্গ পরীক্ষা: এটি কতটি শূন্য সহ্য করে?


10

আমি মিউট্যান্টগুলির দুটি গ্রুপের সাথে তুলনা করছি যার প্রতিটিতে 21 টির মধ্যে একটির ফিনোটাইপ থাকতে পারে। আমি দেখতে চাই যে এই ফলাফলগুলির বিতরণ দুটি গ্রুপের মধ্যে সমান। আমি একটি অনলাইন পরীক্ষা পেয়েছি যা "বন্টনের সাম্যের জন্য চি-বর্গ পরীক্ষা" গণনা করে এবং আমাকে কিছু প্রশংসনীয় ফলাফল দেয়। তবে, এই টেবিলটিতে আমার বেশ কয়েকটি শূন্য রয়েছে, তাই আমি কি এই ক্ষেত্রে মোটেই চি-স্কোয়ার ব্যবহার করতে পারি?

এখানে দুটি গ্রুপ এবং নির্দিষ্ট ফেনোটাইপগুলির গণনা সহ সারণীটি রয়েছে:

2 1
2 3
1 6
1 4
13 77
7 27
0 1
0 4
0 2
2 7
2 3
1 5
1 9
2 6
0 3
3 0
1 3
0 3
1 0
1 2
0 1

সারণীটি ঠিক বাইরে আসে নি। প্রতিটি বিজোড় সংখ্যাটি গ্রুপ 1 থেকে একটি গণনা এবং প্রতিটি
সমান

আমি আপনার প্রশ্নটির পুনরায় ফর্ম্যাট করেছি। টেবিলটি কি এখন সঠিক?
csgillespie

উত্তর:


8

এই জাতীয় টেবিলে ফিশারের 'নির্ভুল' পরীক্ষা করার জন্য আজকাল পুরোপুরি সম্ভাব্য । আমি মাত্র স্টাটা ব্যবহার করে পি = 0.087 পেয়েছি ( tabi 2 1 \ 2 3 \ .... , exact। মৃত্যুদন্ড কার্যকর করে 0.19 সেকেন্ড)।

নীচে chl এর মন্তব্যের পরে সম্পাদনা করুন (মন্তব্য হিসাবে যুক্ত করার চেষ্টা করেছেন তবে ফর্ম্যাট করতে পারবেন না):

এটি আমার জন্য আর 2.12.0 এ কাজ করে, যদিও আমাকে তার 200000 এর ডিফল্ট মানের তুলনায় 'ওয়ার্কস্পেস' বিকল্পটি বাড়িয়ে দিতে হয়েছিল:

> fisher.test(x)
Error in fisher.test(x) : FEXACT error 7.
LDSTP is too small for this problem.
Try increasing the size of the workspace.
> system.time(result<-fisher.test(x, workspace = 400000))
   user  system elapsed 
   0.11    0.00    0.11 
> result$p.value
[1] 0.0866764

(মৃত্যুর সময় স্টাটার তুলনায় কিছুটা দ্রুত, তবে ত্রুটি বার্তার অর্থ প্রকাশের জন্য সন্দেহজনক প্রাসঙ্গিকতা দেওয়া হয়েছে, যা ফিশার.স্টেস্ট সত্ত্বেও আর এর স্বাভাবিক অর্থের চেয়ে আলাদা কিছু বোঝাতে 'ওয়ার্কস্পেস' ব্যবহার করে) ub আর এর মূল 'পরিসংখ্যান' প্যাকেজের অংশ)


1
মজার বিষয় হচ্ছে, ফিশারের পরীক্ষাটি R.
chl

দুঃখিত, আরও উত্সাহ দেওয়া যাবে না। দেখে মনে হচ্ছে যে আমি wksp যথেষ্ট পরিমাণ বাড়িয়ে নি :)
chl

ফিশারের "সঠিক" পরীক্ষাটি আসলে কিছুটা পৃথক প্রশ্নকে সম্বোধন করে না: "... এটি দুই ধরণের শ্রেণিবদ্ধকরণের মধ্যে সংযুক্তির (কন্টিনজেন্সি) তাত্পর্য পরীক্ষা করতে ব্যবহৃত হয়" (উইকি পৃষ্ঠা)। আমার ক্ষেত্রে আমি এই অনুমানটি নিশ্চিত করতে (বা খণ্ডন) করতে চেয়েছি যে ২ টি দলের মধ্যে ফেনোটাইপগুলির বিতরণ একই রকম (সমান)। যখন আমি খুঁজে পেয়েছি "বন্টনের সাম্যের জন্য চি-স্কোয়ার পরীক্ষা" নামক অনলাইন পরীক্ষা (প্রথম পোস্টটি দেখুন) আমি ভেবেছিলাম এটি আমার সমস্যার জন্য সঠিকভাবে ছিল ...
মেমব্রান ২

এছাড়াও, আপনি যদি মনে করেন যে ফিশারের পরীক্ষার উল্লিখিত সংস্করণটি দুটি বিতরণের তুলনা করার জন্য উপযুক্ত, তবে এটি বিতরণের অভিন্নতা যাচাইয়ের জন্যও ব্যবহার করা যেতে পারে (অর্থাত একটি গ্রুপের ফেনোটাইপগুলি সম্ভাব্য ফিনোটাইপের একটি সীমাবদ্ধ সংখ্যার মধ্যে অ-অভিন্নভাবে বিতরণ করা হয়েছিল) ? চিত্রে ফাংশনটি ব্যবহার করে এক্সেলের মাধ্যমেও কেউ এটি করতে পারেন, তবে আমার যদি উপরেরগুলির মতো একটি বিতরণ হয় তবে প্রচুর ফিনোটাইপগুলি 5 বারেরও কম পর্যবেক্ষণ করে?
মেমব্রান

@ মেম্বারান # 1: উভয় সেট প্রান্তিকের মোট সেটগুলিতে ফিশারের সঠিক পরীক্ষা শর্ত হিসাবে এটি কিছুটা আলাদা প্রশ্ন। এটি আমার কাছে একাডেমিক পরিসংখ্যানের নব্বইয়ের কিছু মনে হলেও আমি একাডেমিয়ার একজন পরিসংখ্যানবিদ। ( বিটিডব্লিউ আপনি কোন উইকির বিষয়ে উল্লেখ করতে পারেন?) @ মেম্বারান # 2: আমি একতরফা টেবিলের ক্ষেত্রে শর্তসাপেক্ষ সঠিক পরীক্ষা "ফিশারের নির্ভুল পরীক্ষা" বলব না, তবে এই জাতীয় পরীক্ষা করা উচিত and এবং আমি ওয়ান-ওয়ে টেবিলগুলির জন্য আরও সহজবোধ্য চিন্তা করতেন তবে আমি বর্তমানে সহায়তা করার জন্য সফ্টওয়্যারটি খুঁজে পাচ্ছি না এবং আমার কাছে ছাড়া গণনা করার সময় নেই।
onestop

5

সাধারণ নির্দেশিকাটি হ'ল প্রত্যাশিত গণনাগুলি 5 এর চেয়ে বেশি হওয়া উচিত তবে নিম্নলিখিত নিবন্ধে আলোচিত হিসাবে এটি কিছুটা শিথিল করা যেতে পারে:

ক্যাম্পবেল, আই, চি-স্কোয়ার্ড এবং ফিশার small ছোট নমুনা সুপারিশ সহ দুটি বাই টেবিলের ইরভিন পরীক্ষা, মেডিসিনের পরিসংখ্যান (2007) 26 (19): 3661–3675।

আয়ান ক্যাম্পবেলের হোমপেজটিও দেখুন

pchisq.test(..., sim=TRUE)

আপনার ক্ষেত্রে, এটি প্রত্যাশিত গণনার প্রায় 80% 5 এর নিচে এবং 40% নীচের নীচে রয়েছে বলে মনে হচ্ছে কিছু পর্যবেক্ষিত ফেনোটাইপগুলিকে একত্রিত করার অর্থ কি বোধগম্য হবে?


পরামর্শের জন্য আপনাকে ধন্যবাদ। যৌক্তিকভাবে, ফেনোটাইপগুলিকে একীভূত করা একেবারেই সম্ভব নয় কারণ এগুলির প্রত্যেকটি তিনটি রেকর্ড করা প্যারামিটারের একটি অনন্য সমন্বয়। যেহেতু এই প্যারামিটারগুলির প্রতিটি মিউটেশনের ফলে "উপরে", "ডাউন" বা "অপরিবর্তিত" থাকতে পারে, তাই 3 ^ 3 = 27 স্বতন্ত্র ফিনোটাইপস থাকতে পারে। উপরের উদাহরণে আমি সেই ফেনোটাইপগুলি সরিয়ে দিয়েছি যার জন্য উভয় গ্রুপই "0" স্কোর করেছে, সুতরাং সেগুলির মধ্যে কেবল 21 টি ছিল। আমি কিছু ফেনোটাইপগুলির প্রসার দেখতে পাই তবে আমার কিছু পরিসংখ্যানগত প্রমাণ থাকতে চাই যে মিউট্যান্টদের বিভিন্ন গোষ্ঠীতে এই জাতীয় ফিনোটাইপগুলির বিতরণ একই রকম (বা না)। ধন্যবাদ!
মেমব্রান

1
@ মেমব্রান সমষ্টিটি অর্থবহ হতে হবে না: আপনি যে কোনও উপায়ে বিনা সংশ্লেষ করতে মুক্ত। একটি সূক্ষ্ম সমস্যা, যদিও, পোস্ট-ফ্যাক্টো সমষ্টিটি পি-মানগুলিকে সন্দেহের মধ্যে ফেলে দেয়; সমষ্টিটি ডেটা থেকে স্বতন্ত্র হওয়া উচিত।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.