আমরা কয়েকটি ধরণের স্ট্যাটিস্টিকাল হাইপোথিসিস টেস্টিং বাস্তবায়ন করেছি যার মধ্যে একটি চি স্কোয়ার উপযুক্ত মডেল টেস্ট - প্রদত্ত সম্ভাব্যতা বন্টনের বিপরীত সিডিএফ থেকে নির্ধারিত বিনের সংখ্যার নমুনার একটি চি বর্গ পরীক্ষা। সুতরাং উদাহরণস্বরূপ, কচী বিতরণ নমুনা জেনারেশনটি পরীক্ষা করার জন্য, আমি এই জাতীয় কিছু চালাই
with(Statistics):
infolevel[Statistics] := 1:
distribution := CauchyDistribution(2, 3):
sample := Sample(distribution, 10^6):
ChiSquareSuitableModelTest(sample, distribution, 'bins' = 100, 'level' = 0.001);
α
সীমাবদ্ধ মুহুর্তগুলির সাথে বিতরণের জন্য, আমি একদিকে বেশ কয়েকটি নমুনা মুহুর্তগুলি গণনা করি এবং অন্যদিকে, আমি সম্পর্কিত বিতরণের মুহুর্তগুলি এবং তাদের আদর্শ ত্রুটির প্রতীকীভাবে গণনা করি। সুতরাং যেমন বিটা বিতরণ:
with(Statistics):
distribution := BetaDistribution(2, 3):
distributionMoments := Moment~(distribution, [seq(1 .. 10)]);
standardErrors := StandardError[10^6]~(Moment, distribution, [seq(1..10)]);
evalf(distributionMoments /~ standardErrors);
106
with(Statistics):
sample := Sample(BetaDistribution(2, 3), 10^6):
sampleMoments := map2(Moment, sample, [seq(1 .. 10)]);
distributionMoments := [2/5, 1/5, 4/35, 1/14, 1/21, 1/30, 4/165, 1/55, 2/143, 1/91];
standardErrors :=
[1/5000, 1/70000*154^(1/2), 1/210000*894^(1/2), 1/770000*7755^(1/2),
1/54600*26^(1/2), 1/210000*266^(1/2), 7/5610000*2771^(1/2),
1/1567500*7809^(1/2), 3/5005000*6685^(1/2), 1/9209200*157366^(1/2)];
deviations := abs~(sampleMoments - distributionMoments) /~ standardErrors;
উপরের প্রথম রান থেকে আসা distributionMoments
এবং standardErrors
আসা সংখ্যাগুলি । এখন যদি নমুনা জেনারেশনটি সঠিক হয় তবে বিচ্যুতির সংখ্যা তুলনামূলকভাবে কম হওয়া উচিত। আমি ধরে নিলাম এগুলি প্রায় সাধারণভাবে বিতরণ করা হয়েছে (যা তারা সত্যই নয়, তবে এটি যথেষ্ট কাছাকাছি আসে - এগুলি নমুনা মুহুর্তগুলির আকারযুক্ত সংস্করণ নয়, নমুনাগুলি নিজেরাই নয়) এবং এইভাবে আমি উদাহরণস্বরূপ এমন কোনও ক্ষেত্রে পতাকা আনতে পারি যেখানে কোনও বিচ্যুতি ঘটে flag 4 এর চেয়ে বেশি - একটি নমুনা মুহুর্তের সাথে সম্পর্কিত যা বিতরণের মুহুর্ত থেকে চারগুণ বেশি স্ট্যান্ডার্ড ত্রুটি বিচ্যুত করে। নমুনা জেনারেশন ভাল হলে এটি এলোমেলোভাবে হওয়ার সম্ভাবনা খুব কম। অন্যদিকে, যদি প্রথম 10 টি নমুনা মুহুর্তগুলি বিতরণের মুহুর্তগুলিকে অর্ধ শতাংশেরও কম সময়ের সাথে মেলে, তবে আমাদের কাছে বিতরণের মোটামুটি ভাল আনুমানিকতা রয়েছে।