সম্মিলিত স্ট্যান্ডার্ড বিচ্যুতি খুঁজে পাওয়া সম্ভব?


32

ধরুন আমার 2 টি সেট রয়েছে:

সেট এ : আইটেমের সংখ্যা , ,n=10μ=2.4σ=0.8

বি সেট করুন : আইটেমের সংখ্যা , ,n=5μ=2σ=1.2

আমি সহজেই সম্মিলিত গড় ( ) খুঁজে পেতে পারি, তবে কীভাবে আমার সম্মিলিত স্ট্যান্ডার্ড বিচ্যুতিটি সন্ধান করার কথা?μ


উত্তর:


30

সুতরাং, আপনি যদি কেবলমাত্র এই দুটি নমুনা আপনার কাছে থাকা একটিতে নিয়ে আসতে চান:

s1=1n1Σi=1n1(xiy¯1)2

s2=1n2Σi=1n2(yiy¯2)2

যেখানে এবং ˉ y 2 হ'ল নমুনা অর্থ এবং s 1 এবং s 2 হ'ল নমুনা স্ট্যান্ডার্ড বিচ্যুতি।y¯1y¯2s1s2

এগুলি যুক্ত করতে আপনার কাছে রয়েছে:

s=1n1+n2Σi=1n1+n2(ziy¯)2

নতুন গড় ˉ y 1 এবং ˉ y 2 থেকে পৃথক হওয়ায় এটি যা সোজা নয় :y¯y¯1y¯2

y¯=1n1+n2Σi=1n1+n2zi=n1y¯1+n2y¯2n1+n2

চূড়ান্ত সূত্রটি হ'ল:

s=n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2

সাধারণভাবে ব্যবহৃত বেসেল-সংশোধন (" এডমিনিস্টেটর") স্ট্যান্ডার্ড বিচ্যুতিটির সংস্করণের জন্য, ফলাফলগুলির ফলাফলগুলি আগের মতোই রয়েছে তবেn1

s=(n11)s12+(n21)s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n21

আপনি এখানে আরও তথ্য পড়তে পারেন: http://en.wikedia.org/wiki/S স্ট্যান্ডার্ড_ডিয়েশন


1
যদি ওপি নমুনা স্ট্যান্ডার্ড বিচ্যুতিটির বেসেল-সংশোধিত ( এডমিনিস্টেটর) সংস্করণটি ব্যবহার করে (যেমন এখানে যারা জিজ্ঞাসা করেন তারা সকলেই করছেন) তবে এই উত্তরটি তারা যা খুঁজছেন তা পুরোপুরি দেয় না। n1
গ্লেন_বি -রিনস্টেট মনিকা

সেক্ষেত্রে, এই বিভাগে কৌতুক আছে। (পুরানো উইকিপিডিয়া সংস্করণে এটি লিঙ্ক থেকে সম্পাদনা করুন যেহেতু এটি
নতুনটি

@ Glen_b ভাল ক্যাচ এটিকে আরও কার্যকর করার জন্য আপনি কি উত্তরে এডিট করতে পারেন?
সাশকেলো

আমি প্রমাণটি খুঁজতে উইকিপিডিয়ায় গিয়েছিলাম, তবে দুর্ভাগ্যক্রমে এই সূত্রটি আর নেই। বিস্তারিত (প্রমাণ) বা উইকিপিডিয়াকে উন্নত করার বিষয়ে যত্নশীল? :)
রুনি লিলিমেটস


8

এটি স্পষ্টতই গ্রুপগুলিতে প্রসারিত :K

s=k=1K(nk1)sk2+nk(y¯ky¯)2(k=1Knk)1

7
This is a bit brief by out standards. Could you say a bit more about how this is derived and why this is the correct answer?
Sycorax says Reinstate Monica

1

I had the same problem: having the standard deviation, means and sizes of several subsets with empty intersection, compute the standard deviation of the union of those subsets.

আমি সাশকেলো এবং গ্লেন_বি ♦ এর উত্তরটি পছন্দ করি তবে আমি এর একটি প্রমাণ পেতে চাই। আমি এটি এই উপায়ে করেছি এবং এটি কারওর পক্ষে সহায়ক হলে আমি এটি এখানে রেখেছি।


s=(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2

Step by step:

(n1s12+n2s22+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1(xiy1¯)2+i=1n2(yiy2¯)2+n1(y¯1y¯)2+n2(y¯2y¯)2n1+n2)1/2=(i=1n1((xiy1¯)2+(y¯1y¯)2)+i=1n2((yiy2¯)2+(y¯2y¯)2)n1+n2)1/2=(i=1n1(xi2+y¯2+2y1¯22xiy1¯2y1¯y¯)n1+n2+i=1n2(yi2+y¯2+2y2¯22yiy2¯2y2¯y¯)n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯i=1n1xin1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯i=1n2yin1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)+2n1y1¯22y1¯n1y1¯n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)+2n2y2¯22y2¯n2y2¯n1+n2)1/2=(i=1n1(xi2+y¯22y¯j=1n1xjn1)n1+n2+i=1n2(yi2+y¯22y¯j=1n2yjn2)n1+n2)1/2

Now the trick is to realize that we can reorder the sums: since each

2y¯j=1n1xjn1
term appears n1 times, we can re-write the numerator as
i=1n1(xi2+y¯22y¯xi),

and hence, continuing with the equality chain:

=(i=1n1(xiy¯)2n1+n2+i=1n2(yiy¯)2n1+n2)1/2=(i=1n1+n2(ziy¯)2n1+n2)1/2=s

This been said, there is probably a simpler way to do this.

The formula can be extended to k subsets as stated before. The proof would be induction on the number of sets. The base case is already proven, and for the induction step you should apply a similar equality chain to the latter.


I don't see how the question is clear. Are the two data sets assumed to come from the same distribution? Does the OP have the actual observations available or just the sample estimates of mean and standard deviation?
Michael R. Chernick

Yes they are assumed to come from the same distribution. Observations are not available, just the mean and standard deviation of the subsets.
iipr

Then why are using a formula that involves the individual observations?
Michael R. Chernick

Maybe my answer is not clear. I am simply posting a mathematical proof of the above formula that allows to compute s from the standard deviations, means and sizes of two subsets. In the formula there is no reference to the individual observations. In the proof there is, but its just a proof, and from my point of view, correct.
iipr
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.