কি পর্যায়ে একটি হল


15

ব্যাকগ্রাউন্ড: নিরাপদে এড়িয়ে যান - এটি এখানে রেফারেন্সের জন্য, এবং প্রশ্নটিকে বৈধতা দেওয়ার জন্য।

এই কাগজ খোলার পড়া:

"কার্ল পিয়ারসন এর বিখ্যাত চি-বর্গক্ষেত্র অন্যসাপেক্ষ পরীক্ষা অন্য পরিসংখ্যাত থেকে প্রাপ্ত করা হয়, Z পরিসংখ্যাত বলা হয়, সাধারণ বণ্টনের উপর ভিত্তি করে। সহজ সংস্করণ χ2 গাণিতিকভাবে সমতুল্য z- র পরীক্ষা অভিন্ন হতে দেখানো যায়। পরীক্ষা একই ফলাফল উত্পাদন সব পরিস্থিতিতে। সব ইন্টেন্টগুলি এবং উদ্দেশ্যের জন্য "চি-ছক" "Z-স্কোয়ারড" বলা যেতে পারে। সমালোচনা মান χ2 স্বাধীনতার এক ডিগ্রি জন্য z- র সংশ্লিষ্ট সমালোচনামূলক মূল্যবোধের বর্গক্ষেত্র আছে। "

এটি সিভিতে একাধিকবার বলা হয়েছে ( এখানে , এখানে , এখানে এবং অন্যান্য)।

এবং প্রকৃতপক্ষে আমরা প্রমাণ করতে পারি যে এক্স2 এরসাথেXN(0,1) এরসমান:χ1df2X2XN(0,1)

ধরা যাক যে এবং এটি Y = X 2 এবং c d f পদ্ধতি ব্যবহার করে Y এর ঘনত্ব সন্ধান করুন :XN(0,1)Y=X2Ycdf

। সমস্যাটি হ'ল আমরা সাধারণ বন্টনের ঘনত্বকে ঘনিষ্ঠ আকারে সংহত করতে পারি না। তবে আমরা তা প্রকাশ করতে পারি:p(Yy)=p(X2y)=p(yxy)

ডেরাইভেটিভ গ্রহণ:

FX(y)=FX(y)FX(y).

fX(y)=FX(y)12y+FX(y)12y.

যেহেতু সাধারণ এর মানগুলি প্রতিসম হয়:pdf

। এই equatingপিস্বাভাবিক (বর্তমানেএক্সমধ্যেপিহতে হবেfX(y)=FX(y)1ypdfxpdf প্লাগ ইন করতে - এক্স 2yসাধারণপিডিএর 2 অংশ); এবং1অন্তর্ভুক্ত মনে রাখবেনex22pdf শেষে:1y

fX(y)=FX(y)1y=12πey21y=12πey2y121

চি স্কোয়ারের পিডিএফ এর সাথে তুলনা করুন:

fX(x)=12ν/2Γ(ν2)ex2xν21

যেহেতু , জন্য1df প্রয়োগ, আমরা ঠিক উদ্ভূত হয়েছেপিচি স্কোয়ারের।Γ(1/2)=π1pdf

আরও, যদি আমরা prop.test()আর তে ফাংশনটি কল করি আমরা একই পরীক্ষার অনুরোধ করছি যেন আমরা সিদ্ধান্ত নিই ।χ2chisq.test()

প্রশ্নটি:

সুতরাং আমি এই সমস্ত পয়েন্ট পেয়েছি, তবুও আমি এখনও জানি না যে তারা দুটি কারণে এই দুটি পরীক্ষার প্রকৃত বাস্তবায়নের ক্ষেত্রে কীভাবে আবেদন করে:

  1. একটি জেড-পরীক্ষা স্কোয়ার হয় না।

  2. প্রকৃত পরীক্ষার পরিসংখ্যান সম্পূর্ণ আলাদা:

একটি জন্য পরীক্ষার-পরিসংখ্যানেরχ2 মান হ'ল:

কোথায়χ2=i=1n(OiEi)2Ei=Ni=1npi(Oi/Npipi)2

= পিয়ারসন এর ক্রমসঞ্চিত পরীক্ষার পরিসংখ্যান, যা এসিম্পটোটিকভাবে একটি পন্থা χ 2 বন্টন। i = টাইপ i এর পর্যবেক্ষণের সংখ্যা; এন = পর্যবেক্ষণের মোট সংখ্যা; আমি = এন পি আমি = টাইপ প্রত্যাশিত (তাত্ত্বিক) ফ্রিকোয়েন্সি আমি , নাল হাইপোথিসিস যে ধরনের ভগ্নাংশ দ্বারা জাহির আমি জনসংখ্যা হল পি আমি ; n = টেবিলের কক্ষের সংখ্যা।χ2χ2OiiNEiNpiiipin

অন্যদিকে, টেস্টের পরীক্ষার পরিসংখ্যান হ'ল:z

সঙ্গেপি=এক্স1Z=x1n1x2n2p(1p)(1/n1+1/n2) , যেখানেx1এবংx2হল "সাফল্যের সংখ্যা", শ্রেণিবদ্ধ ভেরিয়েবলগুলির প্রতিটি স্তরের বিষয়ের সংখ্যার উপরে, যেমনএন1এবংএন2p=x1+x2n1+n2x1x2n1n2

এই সূত্রটি দ্বিপদী বিতরণের উপর নির্ভর করে বলে মনে হচ্ছে।

এই দুটি পরীক্ষার পরিসংখ্যান পরিষ্কারভাবে আলাদা, এবং ভিন্ন ফলাফল প্রকৃত পরীক্ষা পরিসংখ্যান, সেইসাথে জন্য স্থাপিত পি -values : 5.8481জন্য এবং Z- পরীক্ষার জন্য, যেখানে 2.4183 2 = 5.84817 (তোমাকে ধন্যবাদ, @ mark999 )। পি জন্য -value χ 2 পরীক্ষা যখন Z- পরীক্ষার জন্য, । পার্থক্যটি দুটি-লেজ বনাম একটি-লেজযুক্ত দ্বারা ব্যাখ্যা করা হয়েছে: 0.01559 / 2 = 0.007795 (আপনাকে ধন্যবাদ @ অ্যামিবা)।χ22.41832.41832=5.84817χ20.015590.00770.01559/2=0.007795

সুতরাং আমরা কোন স্তরে বলব যে তারা এক এবং অভিন্ন?


তবে এটি দুটি অভিন্ন পরীক্ষা। জেড স্কোয়ার্ডটি চি-স্কোয়ারের পরিসংখ্যান। আপনার কাছে 2x2 ফ্রিকোয়েন্সি টেবিল রয়েছে যেখানে কলাম দুটি গ্রুপ এবং সারিগুলি "সাফল্য" এবং "ব্যর্থতা"। তারপরে প্রদত্ত কলামে চি-বর্গ পরীক্ষার তথাকথিত প্রত্যাশিত ফ্রিকোয়েন্সিগুলি সেই গ্রুপের এন দ্বারা গুণিত ( গ্রুপ 'এন দ্বারা) গড় কলাম (গোষ্ঠী) প্রোফাইল হয় Thus সুতরাং, এটি আসে যে চি-বর্গের বিচ্যুতি পরীক্ষা করে এই গড় গ্রুপ প্রোফাইল থেকে দুটি গ্রুপের প্রোফাইলের মধ্যে প্রতিটি - যা একে অপরের থেকে গ্রুপের প্রোফাইলের পার্থক্য পরীক্ষা করার সমতুল্য, অনুপাতের z- পরীক্ষা।
ttnphns

সর্বশেষ হাইপারলিংকের উদাহরণে প্রায় জেড-পরীক্ষা পরিসংখ্যানের বর্গক্ষেত্র, তবে বেশ নয়, এবং পি-মানগুলি পৃথক। এছাড়াও, যখন আপনি উপরের বাকী পরিসংখ্যানগুলির সূত্রগুলি দেখেন, তখন কি সত্যই তাৎক্ষণিকভাবে তা অভিন্ন হয়? নাকি একটির বর্গও অন্য? χ2
আন্তনি পরল্লদা

2
ইন chisq.test(), আপনি ব্যবহার করার চেষ্টা করেছেন correct=FALSE?
999

1
আসলে, আন্তোনি। উভয় পরীক্ষা ইয়েটসের সাথে বা ছাড়াই বিদ্যমান। এটা কি আপনি এক সাথে অন্য গণনা করা ছাড়া এটি হতে পারে?
ttnphns

1
ধন্যবাদ! আপনি (পূর্বাভাস) সঠিক ছিলেন। ইয়েটস সংশোধন বন্ধ হওয়ার সাথে সাথে একটির অন্যটির বর্গাকার মাত্র। আমি সেই অনুযায়ী প্রশ্নটি সম্পাদনা করেছি, যদিও কিছুটা দ্রুত। আমি এখনও বীজগণিতভাবে প্রমাণ করতে চাই যে উভয় পরীক্ষার পরিসংখ্যান একই (বা অন্যটির একটি বর্গ) এবং কেন পি-মানগুলি পৃথক।
আন্তনি পরল্লদা

উত্তর:


12

আসুন একটি 2x2 ফ্রিকোয়েন্সি টেবিল যেখানে কলামগুলি উত্তরদাতাদের দুটি গ্রুপ এবং সারিগুলি হ'ল "হ্যাঁ" এবং "না" দুটি প্রতিক্রিয়া। এবং আমরা ফ্রিকোয়েন্সিগুলি গ্রুপের অনুপাতে , অর্থাৎ উল্লম্ব প্রোফাইলগুলিতে পরিণত করেছি :

      Gr1   Gr2  Total
Yes   p1    p2     p
No    q1    q2     q
      --------------
     100%  100%   100%
      n1    n2     N

এই টেবিলটির স্বাভাবিক (ইয়েটস সংশোধন করা হয়নি) , আপনি সূত্রটিতে ফ্রিকোয়েন্সিগুলির পরিবর্তে অনুপাতের পরিবর্তে, এর মতো দেখতে:χ2

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2+n2(p2p)2pq.

মনে রাখবেন যে p=n1p1+n2p2n1+n2(p1,q1)(p2,q2)

...=(p1p2)2(n12n2+n1n22)pqN2

Divide both numerator and denominator by the (n12n2+n1n22) and get

(p1p2)2pq(1/n1+1/n2)=Z2,

the squared z-statistic of the z-test of proportions for "Yes" response.

Thus, the 2x2 homogeneity Chi-square statistic (and test) is equivalent to the z-test of two proportions. The so called expected frequencies computed in the chi-square test in a given column is the weighted (by the group n) average vertical profile (i.e. the profile of the "average group") multiplied by that group's n. Thus, it comes out that chi-square tests the deviation of each of the two groups profiles from this average group profile, - which is equivalent to testing the groups' profiles difference from each other, which is the z-test of proportions.

This is one demonstration of a link between a variables association measure (chi-square) and a group difference measure (z-test statistic). Attribute associations and group differences are (often) the two facets of the same thing.


(Showing the expansion in the first line above, By @Antoni's request):

n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(p1p)2qpq+n1(q1q)2ppq+n2(p2p)2qpq+n2(q2q)2ppq=n1(p1p)2(1p)+n1(1p11+p)2p+n2(p2p)2(1p)+n2(1p21+p)2ppq=n1(p1p)2(1p)+n1(pp1)2p+n2(p2p)2(1p)+n2(pp2)2ppq=[n1(p1p)2][(1p)+p]+[n2(p2p)2][(1p)+p]pq=n1(p1p)2+n2(p2p)2pq.


@ttnphs This is great! Any chance you could clarify the intermediate step in the first equation (χ2) formula - I don't see how the q's go away after the equal sign.
Antoni Parellada

@ttnphs When I expand it I get n1[(p1p)2p+(q1q)2q]+n2[(p2p)2p+(q2q)2q]=n1(q(p2+p(2p12q1+p12)+p(q2+q12)pq)+n2(q(p2+p(2p22q2)+p22)+p(q2+q22)pq)
Antoni Parellada

@ttnphs ... Or some reference so it's less work to type the latex... And I'll promptly and happily 'accept' the answer...
Antoni Parellada

@Antoni, expansion inserted.
ttnphns

@ttnphns Awesome!
Antoni Parellada
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.