একটি শাস্ত্রীয় তথ্য বিশ্লেষণ সমস্যা বিবেচনা করুন যেখানে আপনি একটি ফলাফল আছে এবং কিভাবে এটা ভবিষ্যতবক্তা একটি নম্বর সঙ্গে সম্পর্কযুক্ত । এখানে মূল ধরণের প্রয়োগের বিষয়টি মনে রাখবেন
কিছু গ্রুপ পর্যায়ের ফলাফল যেমন শহরে অপরাধের হার ।
ভবিষ্যদ্বাণীকারীরা গ্রুপের স্তরের বৈশিষ্ট্যগুলি যেমন শহর এর ডেমোগ্রাফিক বৈশিষ্ট্য ।
প্রাথমিক লক্ষ্যটি একটি রিগ্রেশন মডেল ফিট করা (সম্ভবত এলোমেলো প্রভাব সহ তবে এটি এখনই ভুলে যান):
ভবিষ্যদ্বাণীকারীদের মধ্যে একটি (বা আরও) যখন প্রতিটি ইউনিটের জন্য আলাদা আলাদা নমুনা মাপের সমীক্ষার ফলাফল হয় তখন কি কিছু প্রযুক্তিগত সমস্যা দেখা দেয়? উদাহরণ স্বরূপ, ধরুন শহরের জন্য একটি সারসংক্ষেপ স্কোর হল যে শহর থেকে ব্যক্তি একটি নমুনা থেকে গড় প্রতিক্রিয়া কিন্তু নমুনা মাপ এই গড় উপর ভিত্তি করে দুর্দান্তভাবে বিভিন্ন আছেন:
যেহেতু ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি একরকম অর্থ নয়, কিছুটা অর্থে, প্রতিটি শহরের জন্য, আমি আশঙ্কা করি যে এই ভেরিয়েবলগুলিকে একটি রিগ্রেশন মডেল হিসাবে কন্ডিশনিং করার ফলে তারা সমস্ত "সমানভাবে তৈরি" হলেও কিছু বিভ্রান্তিমূলক ধারণা তৈরি করতে পারে।
এই ধরণের সমস্যার কোনও নাম আছে? যদি তা হয় তবে কীভাবে এটি পরিচালনা করতে হবে তা নিয়ে গবেষণা আছে?
আমার ধারণাটি এটিকে ত্রুটিযুক্ত পরিমাপক ভবিষ্যদ্বাণী হিসাবে পরিবর্তনশীল হিসাবে বিবেচনা করা এবং এই লাইনগুলি বরাবর কিছু করা কিন্তু পরিমাপের ত্রুটিগুলিতে ভিন্নতা আছে, সুতরাং এটি খুব জটিল হবে। আমি এটি ভুল পদ্ধতিতে ভাবতে পারি বা এটি এটিকে আরও জটিল করে তুলতে পারি তবে এখানে যে কোনও আলোচনা সহায়ক হতে পারে।