ব্যাগিংয়ের জন্য প্রধান ব্যবহারের ক্ষেত্র হ'ল নিম্ন-পক্ষপাতযুক্ত মডেলগুলির একসাথে মিশ্রণের বৈচিত্র্য হ্রাস করা। এই ল্যান্ডমার্ক কাগজে প্রায়োগিক চর্চিত ছিল " একটি গবেষণামূলক ভোটিং ক্লাসিফিকেশন আলগোরিদিম তুলনা: ব্যাগিং, Boosting এবং ভেরিয়েন্ট " বাউইর এবং Kohavi দ্বারা । এটি সাধারণত বিজ্ঞাপন হিসাবে কাজ করে।
তবে, জনপ্রিয় বিশ্বাসের বিপরীতে ব্যাগিংয়ের প্রকরণটি হ্রাস করার নিশ্চয়তা নেই । আরও সাম্প্রতিক এবং (আমার মতে) আরও ভাল ব্যাখ্যা হ'ল ব্যাগিং লিভারেজ পয়েন্টগুলির প্রভাবকে হ্রাস করে। লিভারেজ পয়েন্টগুলি হ'ল ফলস্বরূপ মডেলগুলিকে অপ্রতিরোধ্যভাবে প্রভাবিত করে যেমন কমপক্ষে স্কোয়াসের রিগ্রেশনে আউটলায়াররা। ফলস্বরূপ মডেলগুলিকে ইতিবাচকভাবে প্রভাবিত করতে লিভারেজ পয়েন্টগুলির পক্ষে এটি বিরল তবে সম্ভব, সেক্ষেত্রে ব্যাগিং কর্মক্ষমতা হ্রাস করে। কটাক্ষপাত আছে " ব্যাগিং প্রভাব equalizes " Grandvalet দ্বারা ।
সুতরাং, শেষ পর্যন্ত আপনার প্রশ্নের উত্তর দিতে: ব্যাগিংয়ের প্রভাব মূলত লিভারেজ পয়েন্টের উপর নির্ভর করে। অল্প কিছু তাত্ত্বিক গ্যারান্টি বিদ্যমান, কেবলমাত্র ব্যাগিং আকারের ক্ষেত্রে গণনার সময়কে সামঞ্জস্যভাবে বাড়িয়ে তোলে! বলেছিল, এটি এখনও বহুল ব্যবহৃত এবং খুব শক্তিশালী কৌশল। লেবেল শব্দের সাথে শেখার সময়, ব্যাগিং আরও মজবুত শ্রেণিবদ্ধ তৈরি করতে পারে ।
রাও এবং Tibshirani একটি Bayesian ব্যাখ্যা দিয়েছি " মডেল গড় এবং নির্বাচনের জন্য আউট-অফ-বুটস্ট্র্যাপ পদ্ধতি " :
এই অর্থে, বুটস্ট্র্যাপ বিতরণটি আমাদের প্যারামিটারের জন্য একটি (আনুমানিক) ননপ্যারমেট্রিক, অ-তথ্যমূলক পোস্টেরিয়র বিতরণ উপস্থাপন করে। তবে এই বুটস্ট্র্যাপ বিতরণটি নির্বিঘ্নে প্রাপ্ত হয়- আনুষ্ঠানিকভাবে কোনও পূর্বের নির্দিষ্টকরণ ছাড়াই এবং উত্তরোত্তর বিতরণ থেকে নমুনা না নিয়ে। অতএব আমরা বুটস্ট্র্যাপ বিতরণকে একজন দরিদ্র ব্যক্তির "বয়েস উত্তরোত্তর হিসাবে ভাবতে পারি।