আমি একটি প্রোগ্রাম লিখেছি যা এলোমেলো ডেটা উত্পন্ন করে। যদি প্রোগ্রামটি সঠিকভাবে কাজ করে, তবে সেই ডেটাটির একটি নির্দিষ্ট, জ্ঞাত সম্ভাবনা বন্টন অনুসরণ করা উচিত। আমি প্রোগ্রামটি চালাতে চাই, ফলাফলটি সম্পর্কে কিছু গণনা করব এবং একটি পি-মান নিয়ে এসেছি।
অন্য কেউ এটির আগে বলার আগে: আমি বুঝতে পারি যে প্রোগ্রামটি সঠিকভাবে পরিচালনা করার সময় অনুমানের পরীক্ষাটি সনাক্ত করতে পারে না। এটি কেবলমাত্র যখন নির্দিষ্ট উপায়ে ভুলভাবে পরিচালিত হয় তা সনাক্ত করতে পারে । (এবং তারপরেও, পরীক্ষার "সময়ের X% ব্যর্থ হওয়া উচিত, আপনি কোন তাত্পর্য স্তরটি বেছে নেবেন তার উপর নির্ভর করে ...)
সুতরাং, আমি কী সরঞ্জামগুলি উপযুক্ত হতে পারে তা বোঝার চেষ্টা করছি। নির্দিষ্টভাবে:
আমি যতটা চাই এলোমেলো ডেটা তৈরি করতে পারি। আমাকে যা করতে হবে তা হ'ল প্রোগ্রামটি যথেষ্ট দীর্ঘ চলমান। সুতরাং আমি কোনও নির্দিষ্ট নমুনার আকারের মধ্যে সীমাবদ্ধ নই।
আমি এমন কৌশলগুলিতে আগ্রহী যা একটি পি-মান তৈরি করে। সুতরাং কোনও গ্রাফের দিকে দৃষ্টিপাত করা এবং "হ্যাঁ, এটাকে দৃষ্টিনন্দন রৈখিক দেখায়" বলা আকর্ষণীয় বিকল্প নয়। যদি না কোনও গ্রাফের "উইনকিনেস" এ একটি শক্ত নম্বর স্থাপনের উপায় থাকে না। ;-)
আমি এখন অবধি যা জানি:
আমি তিনটি প্রধান ধরণের পরীক্ষার মুখোমুখি হয়েছি যা উল্লিখিত হয়েছে যেগুলির শব্দগুলি প্রযোজ্য হতে পারে: [পিয়ারসন] চি-স্কোয়ার্ড পরীক্ষা, কোলমোগোরভ-স্মারনভ পরীক্ষা এবং অ্যান্ডারসন-ডার্লিং পরীক্ষা।
এটি প্রদর্শিত হয় যে চি চি-স্কোয়ার্ড পরীক্ষা পৃথক বিতরণের জন্য উপযুক্ত , অন্য দুটি ক্রমাগত বিতরণের জন্য আরও উপযুক্ত । (?)
বিভিন্ন উত্স ইঙ্গিত দেয় যে এডি পরীক্ষাটি কেএস পরীক্ষার চেয়ে "ভাল", তবে আরও বিশদে যেতে ব্যর্থ।
শেষ পর্যন্ত, এই সমস্ত পরীক্ষাগুলি সম্ভবত নাল বিতরণ থেকে বিচ্যুত হওয়ার "বিভিন্ন উপায়" সনাক্ত করে। তবে আমি এখনও পার্থক্যগুলি কী তা এখনও জানি না ... সংক্ষেপে, আমি এক ধরণের সাধারণ বিবরণ খুঁজছি যেখানে প্রতিটি ধরণের পরীক্ষা সর্বাধিক প্রযোজ্য এবং কোন ধরণের সমস্যাগুলি এটি সবচেয়ে ভাল সনাক্ত করে।