চি স্কোয়ার্ড টেস্ট এবং সমান অনুপাতের পরীক্ষার মধ্যে কী সম্পর্ক?


52

মনে করুন চারটি পারস্পরিক একচেটিয়া বৈশিষ্ট্যযুক্ত আমার তিনটি জনসংখ্যা রয়েছে। আমি প্রতিটি জনসংখ্যার থেকে এলোমেলো নমুনা নিই এবং আমি যে বৈশিষ্ট্যগুলি পরিমাপ করছি তার জন্য ক্রসস্ট্যাব বা ফ্রিকোয়েন্সি টেবিল তৈরি করি। আমি কি এই কথাটি সঠিক:

  1. আমি যদি জনসংখ্যা এবং বৈশিষ্ট্যগুলির মধ্যে কোনও সম্পর্ক আছে কিনা তা পরীক্ষা করতে চাইতাম (উদাহরণস্বরূপ, একটি জনসংখ্যার বৈশিষ্ট্যের মধ্যে একটির বেশি ফ্রিকোয়েন্সি রয়েছে কিনা), আমার একটি চি-স্কোয়ার পরীক্ষা করা উচিত এবং ফলাফলটি তাৎপর্যপূর্ণ কিনা তা দেখতে হবে।

  2. যদি চি-স্কোয়ার পরীক্ষাটি তাৎপর্যপূর্ণ হয় তবে এটি কেবল আমাকে দেখায় যে জনসংখ্যা এবং বৈশিষ্ট্যের মধ্যে কিছু সম্পর্ক রয়েছে তবে তারা কীভাবে সম্পর্কিত তা নয়।

  3. তদুপরি, সমস্ত বৈশিষ্ট্যের জনসংখ্যার সাথে সম্পর্কিত হওয়া প্রয়োজন না। উদাহরণস্বরূপ, যদি বিভিন্ন জনগোষ্ঠীর A এবং B বৈশিষ্ট্যগুলির উল্লেখযোগ্যভাবে পৃথক বিতরণ হয় তবে সি এবং ডি এর নয়, তবে চি-স্কোয়ার পরীক্ষাটি এখনও তাত্পর্যপূর্ণ হিসাবে ফিরে আসতে পারে।

  4. যদি আমি পরিমাপ হোক বা না হোক একটি নির্দিষ্ট চরিত্রগত জনসংখ্যার দ্বারা প্রভাবিত হয় চেয়েছিলেন, তারপর আমি সমান অনুপাত জন্য একটি পরীক্ষা চালাতে পারেন (আমি দেখেছি এই z- পরীক্ষার নামে বা prop.test()মধ্যে R) শুধু যে চরিত্রগত হয়।

অন্য কথায়, prop.test()চি-স্কোয়ার্ড পরীক্ষা বলছে যে উল্লেখযোগ্য সম্পর্ক রয়েছে বলে যখন দুটি সেট বিভাগের মধ্যে সম্পর্কের প্রকৃতিটি আরও সঠিকভাবে নির্ধারণ করা উপযুক্ত?


আরও পড়ুন: stats.stackexchange.com/q/173415/3277
ttnphns

উত্তর:


23

খুব সংক্ষিপ্ত উত্তর:

চি-স্কোয়ার্ড পরীক্ষা ( chisq.test()আর-তে) প্রত্যাশিত ফ্রিকোয়েন্সিগুলির (প্রান্তিক ফ্রিকোয়েন্সিগুলির পণ্য হিসাবে গণনা করা) একটি কন্টিজেন্সি টেবিলের প্রতিটি বিভাগে পর্যবেক্ষণিত ফ্রিকোয়েন্সিগুলির সাথে তুলনা করে। এটি পর্যবেক্ষণ এবং প্রত্যাশিত গণনার মধ্যে বিচ্যুতির সুযোগকে দায়ী করার জন্য খুব বড় কিনা তা নির্ধারণ করতে ব্যবহৃত হয়। স্বাধীনতা থেকে প্রস্থান সহজেই অবশিষ্টাংশগুলি পরীক্ষা করে দেখুন (চেষ্টা করুন ?mosaicplotবা দেখুন ?assocplot, তবে vcdপ্যাকেজটি দেখুন)। fisher.test()সঠিক পরীক্ষার জন্য ব্যবহার করুন (হাইপারজমেট্রিক বিতরণের উপর নির্ভরশীল)।

আর এর prop.test()কাজটি অনুপাতগুলি গ্রুপগুলির মধ্যে তুলনীয় কিনা বা তাত্ত্বিক সম্ভাবনার চেয়ে পৃথক নয় কিনা তা পরীক্ষা করতে দেয়। এটিকে -টেষ্ট হিসাবে উল্লেখ করা হয় কারণ পরীক্ষার পরিসংখ্যান দেখতে এই রকম:z

z=(f1f2)p^(1p^)(1n1+1n2)

যেখানে , এবং সূচকগুলি আপনার সারণির প্রথম এবং দ্বিতীয় লাইনটি উল্লেখ করে। দ্বিমুখী কন্টিনজেন্সি টেবিল যেখানে , এটি সাধারণ পরীক্ষার সাথে তুলনামূলক ফলাফল পাওয়া উচিত :(1,2)এইচ0:p^=(p1+p2)/(n1+n2)(1,2)χ 2H0:p1=p2χ2

> tab <- matrix(c(100, 80, 20, 10), ncol = 2)
> chisq.test(tab)

    Pearson's Chi-squared test with Yates' continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476

> prop.test(tab)

    2-sample test for equality of proportions with continuity correction

data:  tab 
X-squared = 0.8823, df = 1, p-value = 0.3476
alternative hypothesis: two.sided 
95 percent confidence interval:
 -0.15834617  0.04723506 
sample estimates:
   prop 1    prop 2 
0.8333333 0.8888889 

আর এর সাথে পৃথক ডেটা বিশ্লেষণের জন্য, আমি লরা থম্পসনের কাছ থেকে আগ্রেস্তির শ্রেণিবদ্ধ ডেটা অ্যানালাইসিস (২০০২) এর সাথে একযোগে আর (এবং এস-প্লাস) ম্যানুয়ালটির সুপারিশ করছি ।


2
পরীক্ষার জন্য কি কোনও সাধারণ নাম রয়েছে যা প্রোপটেস্ট () সম্পাদন করে?
অ্যাটিকাস 29

2
"এটি একটি জেড-পরীক্ষা হিসাবে উল্লেখ করা হয়"।
রাসেলপিয়ার্স

@ সিএইচএল আমি কিছুটা বিভ্রান্ত হয়েছি - আমি ভেবেছিলাম prop.testএবং chisq.testদুজনেই চি-স্কোয়ার ব্যবহার করব যা একই ধরণের পি মানগুলিকে ব্যাখ্যা করবে, পাশাপাশি আর-ব্লগারগুলিতে এই পোস্টে তাদের নিজস্ব অ্যাডহক ফাংশন কেন আছে।
আন্তনি পরল্লদা

@ আন্টনি হ্যাঁ, কিথ তাঁর উত্তরে এটি ব্যাখ্যা করেছিলেন।
chl

3
কি এবং , , , , ? এন 2 এফ 1 এফ 2 পি 1 পি 2n1n2f1f2p1p2
টোমকা

23

দুটি অনুপাতের সমতার জন্য চি-স্কোয়ার পরীক্ষাটি -টেষ্ট হিসাবে ঠিক একই জিনিস । এক ডিগ্রি স্বাধীনতার সাথে চি-স্কোয়ার বিতরণ কেবল একটি সাধারণ বিচ্যুত, স্কোয়ার। আপনি মূলত কনজিস্টেন্সি টেবিলের একটি উপসেটে চি-স্কোয়ার পরীক্ষার পুনরাবৃত্তি করছেন। (এই কারণেই @ chl উভয় পরীক্ষার সাথে ঠিক একই মূল্য পেতে পারে))পিzp

প্রথমে বিশ্বব্যাপী চি-স্কোয়ার টেস্ট করার সমস্যা এবং তারপরে সাবলেটগুলিতে আরও পরীক্ষা করার জন্য ডাইভিংয়ের সমস্যাটি হ'ল আপনি অ্যালফোটি ​​অগত্যা সংরক্ষণ করবেন না - অর্থাৎ আপনি 5% এর চেয়ে কম ভুয়া পজিটিভকে নিয়ন্ত্রণ করতে পারবেন না (বা পুরো পরীক্ষা জুড়ে যাই হোক না কেন )।α

আমি মনে করি আপনি যদি এটি শাস্ত্রীয় দৃষ্টান্তে সঠিকভাবে করতে চান, আপনার শুরুতে আপনার অনুমানগুলি সনাক্ত করতে হবে (যা তুলনা করার অনুপাত), তথ্য সংগ্রহ এবং তার পরে অনুমানগুলি পরীক্ষা করা দরকার যাতে প্রতিটি পরীক্ষার অঙ্কের তাত্পর্য হিসাবে মোট চৌম্বক হয় th to । আপনি যদি কোনও প্রাইমারী প্রমাণ করতে না পারেন তবে কিছুটা পারস্পরিক সম্পর্ক রয়েছে।α

অনুপাতের সমতার জন্য সবচেয়ে শক্তিশালী পরীক্ষাকে বলা হয় শ্রেষ্ঠত্বের জন্য বার্নার্ডের পরীক্ষা


@ গুং আমি কিছুটা বিভ্রান্ত হয়েছি - আমি ভেবেছিলাম prop.testএবং chisq.testদুজনেই চি-স্কোয়ার ব্যবহার করব যা একই ধরণের পি মানগুলি ব্যাখ্যা করবে, পাশাপাশি আর-ব্লগারগুলিতে এই পোস্টে তাদের নিজস্ব অ্যাডহক ফাংশন কেন।
আন্তোনি পরেল্লদা

আমি আপনাকে বুঝতে পারি না যে আপনাকে কী বিভ্রান্ত করছে, @ অ্যান্টোনিপ্রেল্লদা। এই উত্তরে বলা হয়েছে যে তারা "একেবারে একই", যা "দুজনেই চি-স্কোয়ার ব্যবহার করে" যদি তা বোঝায়।
গুং - মনিকা পুনরায়

মূল উত্তরটিতে @ গুং চিলে উল্লেখ করেছে যে prop.test()... ... এর বিপরীতে জেড-টেস্ট হিসাবে উল্লেখ করা হয় chisq.test()। পরে কীথ বলেছে, "দুটি অনুপাতের সমতার জন্য চি-স্কোয়ার পরীক্ষাটি জেড-টেস্টের মতো একই জিনিস ((এই কারণেই @chl উভয় পরীক্ষার সাথে ঠিক একই মান-মূল্য পেয়ে যায়)")
আন্তোনি পরেল্লদা

1
এটি কেবল একটি অলোভনীয় বাক্য বলে মনে হচ্ছে, @ আন্টনিপ্রেল্লদা। ধারণাগতভাবে, 2 টি পরীক্ষা স্বতন্ত্র, যা আপনি আমার অন্যান্য উত্তরে দেখেছি discussed তবে গাণিতিকভাবে, তারা সমতুল্য। আসলে, আমি বিশ্বাস করি আর ফাংশনটি prop.test()কেবলমাত্র কল chisq.test()করে আউটপুটটিকে আলাদাভাবে মুদ্রণ করে।
গুং - মনিকা পুনরায়

@ গুং আমি আর-ব্লগারদের অনুরূপ একটি অনুষ্ঠানে কাজ করে যাচ্ছিলাম এবং আমি আমার প্রথম স্তরের লোকদের জন্য একটি পোস্ট তৈরি করতে যাচ্ছিলাম, যা আপনার লেখার কয়েকটি মূল ধারণার বিষয়ে আপনাকে উদ্ধৃত করে, চিটির জন্য উভয়ই গণিতের মধ্য দিয়ে চলছে বর্গক্ষেত্র এবং জেড-পরীক্ষা এবং তারপরে আর কোড দেওয়া।
আন্তোনি পরেল্লদা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.