আমি যে পরীক্ষা চালাচ্ছি তার জন্য বিতরণের অ-অভিন্নতা পরিমাপ করার জন্য একটি মেট্রিক নিয়ে আসার চেষ্টা করছি। আমার একটি এলোমেলো পরিবর্তনশীল রয়েছে যা বেশিরভাগ ক্ষেত্রে সমানভাবে বিতরণ করা উচিত এবং আমি ভেরিয়েবলটি কিছু মার্জিনের মধ্যে অভিন্নভাবে বিতরণ না করা তথ্য সেটগুলির উদাহরণগুলি সনাক্ত করতে (এবং সম্ভবত ডিগ্রি পরিমাপ করতে সক্ষম) হতে সক্ষম হতে চাই।
10 টি পরিমাপের সাথে তিনটি ডাটা সিরিজের একটি উদাহরণ যা আমি পরিমাপ করছি তার সংঘটনটির প্রতিনিধিত্ব করে এমন কিছু হতে পারে:
a: [10% 11% 10% 9% 9% 11% 10% 10% 12% 8%]
b: [10% 10% 10% 8% 10% 10% 9% 9% 12% 8%]
c: [ 3% 2% 60% 2% 3% 7% 6% 5% 5% 7%] <-- non-uniform
d: [98% 97% 99% 98% 98% 96% 99% 96% 99% 98%]
আমি সি এবং এর মতো বিতরণগুলিকে পৃথক করতে সক্ষম হতে চাই যা একটি এবং খ এর মতো, এবং সি-এর বিচ্যুতিটি অভিন্ন বিতরণ থেকে পরিমাপ করে। সমানভাবে, যদি কোনও ডিস্ট্রিবিউশন কীভাবে ইউনিফর্মের জন্য মেট্রিক থাকে (শূন্যের কাছাকাছি বিচ্যুতি?), আমি সম্ভবত এটি ব্যবহার করতে পারি উচ্চতর বৈকল্পিকের সাথে আলাদা করতে। তবে, আমার উপাত্তের উপরের সি উদাহরণের মতো কেবল একটি বা দু'জন আউটলিয়ার থাকতে পারে এবং নিশ্চিত যে এটি সেভাবে সহজে সনাক্তযোগ্য হবে কিনা not
আমি সফ্টওয়্যারটিতে এটি করার জন্য কিছু হ্যাক করতে পারি তবে এটি আনুষ্ঠানিকভাবে ন্যায়সঙ্গত করার জন্য পরিসংখ্যান পদ্ধতি / পদ্ধতির সন্ধান করছি। আমি বছর আগে ক্লাস নিয়েছিলাম, তবে পরিসংখ্যান আমার অঞ্চল নয়। এটি এমন কোনও কিছুর মতো বলে মনে হচ্ছে যা একটি সুপরিচিত পদ্ধতির উচিত। দুঃখিত, যদি এর কোনওটি পুরোপুরি হাড়-মাথাযুক্ত হয়। আগাম ধন্যবাদ!