আমি অনেক জায়গায় দেখেছি যেখানে তাদের ইনপুট / আউটপুট ডেটাসেট রয়েছে যেখানে তারা প্রথমে লিনিয়ার রিগ্রেশন রেখা তৈরি করে, পক্ষপাত সংশোধন করে এবং তারপরে কেবলমাত্র তাদের মডেলের জন্য সেই ডেটা ব্যবহার করে। এই পক্ষপাত সংশোধন কি আমি পাইনি?
আমি অনেক জায়গায় দেখেছি যেখানে তাদের ইনপুট / আউটপুট ডেটাসেট রয়েছে যেখানে তারা প্রথমে লিনিয়ার রিগ্রেশন রেখা তৈরি করে, পক্ষপাত সংশোধন করে এবং তারপরে কেবলমাত্র তাদের মডেলের জন্য সেই ডেটা ব্যবহার করে। এই পক্ষপাত সংশোধন কি আমি পাইনি?
উত্তর:
যদিও আপনি কী ধরণের পক্ষপাত সংশোধন করছেন উল্লেখ করার জন্য সমস্যার বিবৃতি যথাযথ নয় তবে আমি মনে করি আমি সাধারণ শব্দে এ সম্পর্কে কথা বলতে পারি। কখনও কখনও একটি অনুমানকারী পক্ষপাতদুষ্ট হতে পারে। এর নিছক অর্থ হ'ল এটি যদিও ভাল অনুমানক হতে পারে তবে এর প্রত্যাশিত বা গড় মান প্যারামিটারের সাথে ঠিক সমান নয়। অনুমানকারকের গড় এবং সত্য পরামিতি মানের পার্থক্যকে পক্ষপাত বলা হয়। যখন কোনও অনুমানকারী পক্ষপাতদুষ্ট হিসাবে পরিচিত হয়, কখনও কখনও সম্ভব হয়, অন্য উপায়ে, পক্ষপাতদুটি অনুমান করা এবং তারপরে মূল অনুমান থেকে আনুমানিক পক্ষপাতাকে বিয়োগ করে অনুমানকারীকে সংশোধন করা সম্ভব। এই পদ্ধতিটিকে পক্ষপাত সংশোধন বলা হয়। এটি অনুমানের উন্নতির অভিপ্রায় নিয়ে করা হয়েছে। যদিও এটি পক্ষপাত হ্রাস করবে এটি বৈচিত্র্যও বাড়িয়ে তুলবে।
সফল পক্ষপাত সংশোধনের একটি ভাল উদাহরণ হ'ল শ্রেণিবিন্যাস ত্রুটির হারের বুটস্ট্র্যাপ পক্ষপাতিত্ব সংশোধন অনুমান। নমুনার আকার ছোট হলে ত্রুটি হারের পুনঃব্যবস্থাপনা অনুমানের একটি বৃহত আশাবাদী পক্ষপাত থাকে। পুনরায় প্রতিষ্ঠানের অনুমানের পক্ষপাত নির্ণয়ের জন্য বুটস্ট্র্যাপ ব্যবহার করা হয় এবং যেহেতু পুনর্নির্মাণের অনুমানটি ত্রুটির হারের সংশোধন প্রাক্কলন পেতে পুনরায় প্রতিষ্ঠানের অনুমানের সাথে যুক্ত করা হয় তত্কুলের হারকে পুনরায় প্রতিষ্ঠানের অনুমানের সাথে যুক্ত করা হয়। যখন নমুনার আকারটি 30 বা তার কম সংক্ষিপ্তভাবে দুটি শ্রেণীর সমস্যার সাথে উভয় শ্রেণীর সংমিশ্রণ হয় বুটস্ট্র্যাপ অনুমানের নির্দিষ্ট ফর্মগুলি (বিশেষত 2৩২ অনুমান) ছাড়-ওয়ান ক্রস বৈধতার চেয়ে ত্রুটি হারের আরও সঠিক অনুমান সরবরাহ করে (যা খুব খুব ত্রুটি হারের প্রায় পক্ষপাতহীন অনুমান)।