আমি একক ডেটা সেট থেকে দুটি গ্রুপের মান আলাদা করার চেষ্টা করছি। আমি ধরে নিতে পারি যে জনসংখ্যার একটি সাধারণত বিতরণ করা হয় এবং এটি নমুনার কমপক্ষে অর্ধেক আকারের। প্রথমটির মানগুলির চেয়ে দ্বিতীয়টির মান উভয়ই কম বা উচ্চতর (বন্টনটি অজানা)। আমি যা করার চেষ্টা করছি তা হ'ল উপরের এবং নিম্ন সীমাগুলি যা অন্যটি থেকে সাধারণত বিতরণ করা জনগোষ্ঠীকে ঘিরে রাখে find
আমার অনুমান আমাকে সূচনা পয়েন্ট সরবরাহ করে:
- নমুনার আন্তঃখণ্ড পরিমণ্ডলের মধ্যে সমস্ত পয়েন্টগুলি সাধারণত বিতরণ করা জনগোষ্ঠীর।
আমি সাধারণভাবে বিতরণকৃত জনসংখ্যার 3 য় স্টাডেভের মধ্যে ফিট না হওয়া অবধি বাইরের নমুনাগুলি বাকী থেকে তাদের নিয়ে যাওয়ার জন্য আমি পরীক্ষার চেষ্টা করছি। যা আদর্শ নয়, তবে যথেষ্ট যুক্তিসঙ্গত ফলাফল বলে মনে হচ্ছে।
আমার ধারণাটি কি পরিসংখ্যানগত দিক থেকে শক্ত? এই সম্পর্কে আরও ভাল উপায় কি হতে পারে?
দয়া করে কারও ট্যাগগুলি ঠিক করুন।