নিম্নলিখিতটি আমি কী সম্পাদন করার চেষ্টা করছি তা বর্ণনা করে তবে একটি বিকল্প সমস্যার বিবৃতি আমার লক্ষ্য বর্ণনা করতে পারে:
আমি চাই
নিম্নলিখিত সংখ্যাগুলিকে এমন গ্রুপগুলিতে বিভক্ত করুন যেখানে প্রতিটি গ্রুপের মধ্যে সংখ্যার বৈচিত্রগুলি খুব বেশি নয় এবং গ্রুপগুলির গড়ের মধ্যে পার্থক্য খুব কম নয়
শেষে প্রাপ্ত বিতরণটিকে "নিখুঁত "গুলির সাথে তুলনা করুন এবং দেখুন নিখুঁত হওয়া থেকে এটি কতটা" আলাদা "।
গোলের লেম্যানের ব্যাখ্যা
আমি আয়ের বন্টন গণনা করার চেষ্টা করছি এবং প্রতিটি জনসংখ্যার মধ্যে থাকা "ইনকাম ব্র্যাকেটগুলি" নির্ধারণ করতে চাইছি income
আমার লক্ষ্য হ'ল আয়ের বন্ধনীগুলির মধ্যে পার্থক্য পরিমাপ করা বা গণনা করা। আমি ধরে নিচ্ছি অনেকগুলি বন্ধনী থাকবে এবং প্রতিটি স্তরটি কতটা "দূরে" রয়েছে তা দেখতে চাই।
20 জনসংখ্যার একটি নমুনা সেটের জন্য প্রতি ঘন্টা আয়ের একটি নমুনা এবং মোট আয় 3587:
Population= 10 pop=2 population=5 population =3
10, 11,13,14,14,14,14,14,15,20, 40,50 ,90,91,92,93,94 999,999,900
প্রদত্ত জনগোষ্ঠীর উপর আয়ের বন্টনের মতো কাজ করে এমন ডেটা গোছানো, বাছাই এবং বিশ্লেষণ করতে আমি কীভাবে গণিতের ধারণাগুলি ব্যবহার করতে পারি?
গণনার শেষে, আমি টাইার্ড আয়ের বিতরণটি নির্ধারণ করতে চাই, যেখানে নিখুঁত বন্টন এ জাতীয় কিছু দেখায়
(each person makes $10 more per hour than the previous; total is 3587)
89, 99, 109, 119, 129, 139, 149, 159, 169, 179, 189, 199, 209, 219, 229, 239, 249, 259, 269, 279
অথবা এটা:
(evenly distributed groups of people make the same per hour)
(gaps between income groups is consistent and not "too far")
(income total is 3587)
99 99 99 129 129 129 159 159 159 199 199 199 229 229 229 269 269 269
প্রশ্ন
জনসংখ্যার গোষ্ঠীগুলি কীভাবে বিশ্লেষণ করব এবং এই ফাঁকটি এমনভাবে পরিমাপ করব যা আমাকে বলবে যে উপরের তালিকাভুক্ত শেষ দুটি মডেলের সেটগুলির মতো এটি আরও তৈরি করার জন্য কতটা প্রয়োজন?
It may seem you are interested in cluster analysis, but the problem with real-life distributions is they are nearly continuous, and hence the straightforward clusterization won't apply.