দ্বি-পর্যায়ের মডেল তৈরির গুই 11 ড্যামের ধারণাটি সঠিক পথে যাওয়া যায় তবে যাইহোক, আপনার সেটআপের বিশেষ অসুবিধা বিবেচনা করা উচিত যা debtণের পরিমাণ এবং অর্থ প্রদানের সম্ভাবনার মধ্যে খুব দৃ negative় নেতিবাচক সম্পর্ক।
এখানে একটি দ্বি-পর্যায়ের মডেল তৈরির প্রাথমিক সমস্যাটি হ'ল, দ্বিতীয় মডেলটি (ofণের পূর্বাভাসের জন্য) যখন কেবল "নন-জিরো" উপর নির্মিত হয়, সম্ভবত জনসংখ্যার সম্ভবত এলোমেলো নমুনার উপর নির্মিত ( পুরো ডেটাसेट), তবে সম্মিলিত মডেলটি আবার পুরো জনগণের উপরে প্রয়োগ করতে হবে । এর অর্থ হ'ল দ্বিতীয় মডেলটিকে ডেটাগুলির অংশগুলির জন্য পূর্বাভাস দিতে হবে যা এটি আগে কখনও দেখেনি, ফলস্বরূপ নির্ভুলতা হারাবে। একে নমুনা নির্বাচন বায়াস বলা হয় (এমএল দৃষ্টিকোণ থেকে একটি পর্যালোচনার জন্য আমি স্মিথ এবং এলকান দ্বারা প্রত্যাখ্যান প্রত্যাখ্যানের জন্য একটি বায়েশিয়ান নেটওয়ার্ক ফ্রেমওয়ার্ক প্রস্তাব করি )।
KDD-কাপ-98 একটি অনুরূপ সমস্যা যেখানে এক ভবিষ্যদ্বাণী করা উচিত কিনা তা একটি ভেটেরান্স প্রতিষ্ঠানের জন্য একটি দাতা আবার দান করতে সম্ভবত এবং কত এটা দান করার সম্ভাবনা বেশি হয় মোকাবেলা। এই ডেটাসেটে, আবার অনুদানের সম্ভাবনাটিও প্রত্যাশিত অর্থের সাথে নেতিবাচকভাবে সম্পর্কিত হয়েছিল। নমুনা নির্বাচনের পক্ষপাতিত্ব উপস্থিত হয়েছিল।
যে সমাধানটি আমাকে সবচেয়ে বেশি প্রভাবিত করেছিল সেগুলি আবিষ্কার এবং সিদ্ধান্ত গ্রহণের ক্ষেত্রে পাওয়া যেতে পারে যখন ব্যায়ঙ্কা জাদরোজনি এবং চার্লস এলকান দ্বারা ব্যয় এবং সম্ভাবনা উভয়ই অজানা । তারা হেকম্যান সংশোধনের উপর ভিত্তি করে একটি ব্যয় সংবেদনশীল সমাধান তৈরি করেছে , যা আমার জ্ঞানের কাছে (নমুনা) নির্বাচনের পক্ষপাতিত্ব সংশোধন করার জন্য প্রথম পদ্ধতিগত পদ্ধতি।