ব্যাগিংয়ের তাত্ত্বিক গ্যারান্টিগুলি কী


17

আমি (প্রায়) শুনেছি:

ব্যাগিং হ'ল একটি ভবিষ্যদ্বাণীকারী / অনুমানক / লার্নিং অ্যালগরিদমের বৈকল্পিকতা হ্রাস করার কৌশল।

যাইহোক, আমি এই বক্তব্যের কোনও গাণিতিক প্রমাণ কখনও দেখিনি। কেউ কি জানেন যে এটি গাণিতিকভাবে সত্য কেন? এটি কেবল এ জাতীয় বহুল স্বীকৃত / জ্ঞাত সত্য বলে মনে হচ্ছে, আমি এর প্রত্যক্ষ রেফারেন্স আশা করবো। যদি না থাকে তবে আমি অবাক হব। এছাড়াও, কেউ কি জানেন যে এই পক্ষপাতদুটির উপর কী প্রভাব ফেলে?

ব্যাগিংয়ের পদ্ধতির কোনও অন্যান্য তাত্ত্বিক গ্যারান্টি রয়েছে যা যে কেউ জানে এবং মনে করে যে এটি গুরুত্বপূর্ণ এবং এটি ভাগ করতে চায়?

উত্তর:


21

ব্যাগিংয়ের জন্য প্রধান ব্যবহারের ক্ষেত্র হ'ল নিম্ন-পক্ষপাতযুক্ত মডেলগুলির একসাথে মিশ্রণের বৈচিত্র্য হ্রাস করা। এই ল্যান্ডমার্ক কাগজে প্রায়োগিক চর্চিত ছিল " একটি গবেষণামূলক ভোটিং ক্লাসিফিকেশন আলগোরিদিম তুলনা: ব্যাগিং, Boosting এবং ভেরিয়েন্ট " বাউইর এবং Kohavi দ্বারা । এটি সাধারণত বিজ্ঞাপন হিসাবে কাজ করে।

তবে, জনপ্রিয় বিশ্বাসের বিপরীতে ব্যাগিংয়ের প্রকরণটি হ্রাস করার নিশ্চয়তা নেই । আরও সাম্প্রতিক এবং (আমার মতে) আরও ভাল ব্যাখ্যা হ'ল ব্যাগিং লিভারেজ পয়েন্টগুলির প্রভাবকে হ্রাস করে। লিভারেজ পয়েন্টগুলি হ'ল ফলস্বরূপ মডেলগুলিকে অপ্রতিরোধ্যভাবে প্রভাবিত করে যেমন কমপক্ষে স্কোয়াসের রিগ্রেশনে আউটলায়াররা। ফলস্বরূপ মডেলগুলিকে ইতিবাচকভাবে প্রভাবিত করতে লিভারেজ পয়েন্টগুলির পক্ষে এটি বিরল তবে সম্ভব, সেক্ষেত্রে ব্যাগিং কর্মক্ষমতা হ্রাস করে। কটাক্ষপাত আছে " ব্যাগিং প্রভাব equalizes " Grandvalet দ্বারা

সুতরাং, শেষ পর্যন্ত আপনার প্রশ্নের উত্তর দিতে: ব্যাগিংয়ের প্রভাব মূলত লিভারেজ পয়েন্টের উপর নির্ভর করে। অল্প কিছু তাত্ত্বিক গ্যারান্টি বিদ্যমান, কেবলমাত্র ব্যাগিং আকারের ক্ষেত্রে গণনার সময়কে সামঞ্জস্যভাবে বাড়িয়ে তোলে! বলেছিল, এটি এখনও বহুল ব্যবহৃত এবং খুব শক্তিশালী কৌশল। লেবেল শব্দের সাথে শেখার সময়, ব্যাগিং আরও মজবুত শ্রেণিবদ্ধ তৈরি করতে পারে

রাও এবং Tibshirani একটি Bayesian ব্যাখ্যা দিয়েছি " মডেল গড় এবং নির্বাচনের জন্য আউট-অফ-বুটস্ট্র্যাপ পদ্ধতি " :

এই অর্থে, বুটস্ট্র্যাপ বিতরণটি আমাদের প্যারামিটারের জন্য একটি (আনুমানিক) ননপ্যারমেট্রিক, অ-তথ্যমূলক পোস্টেরিয়র বিতরণ উপস্থাপন করে। তবে এই বুটস্ট্র্যাপ বিতরণটি নির্বিঘ্নে প্রাপ্ত হয়- আনুষ্ঠানিকভাবে কোনও পূর্বের নির্দিষ্টকরণ ছাড়াই এবং উত্তরোত্তর বিতরণ থেকে নমুনা না নিয়ে। অতএব আমরা বুটস্ট্র্যাপ বিতরণকে একজন দরিদ্র ব্যক্তির "বয়েস উত্তরোত্তর হিসাবে ভাবতে পারি।


1
গাছগুলির ক্ষেত্রে কীভাবে 'লিভারেজ পয়েন্টস' ব্যাখ্যা কার্যকর হয়, যা প্রায়শই ব্যাগিংয়ের জন্য সুপারিশ করা হয়? যদিও এটি স্পষ্ট হয়েছে যে লিনিয়ার রিগ্রেশন জন্য উচ্চ লিভারেজ পয়েন্টগুলি কী, গাছগুলির জন্য এই পয়েন্টগুলি কী?
ডেভিডআর 17'15

এই প্রশ্নের অন্য একটি রেফারেন্স খুঁজে পেয়েছি: quora.com/… আপনি কী ভাবেন? আপনি কি বলেছিলেন যে এটি তাত্ত্বিকভাবে বৈকল্পিকতা হ্রাস করে না এই বিষয়টি কি বিরোধিতা করে?
চার্লি পার্কার

আমি দেখেছি যে উইকিপিডিয়া বলেছে যে ব্যাগিং (ওরফে বুটস্ট্র্যাপ একীকরণ) বৈকল্পিকতা হ্রাস করে। যদি এর জন্য কোনও তাত্ত্বিক প্রমাণ না থাকে তবে এর অর্থ কি নিবন্ধটি ভুল?
চার্লি পার্কার 21

বেশিরভাগ ক্ষেত্রে ব্যাগিং কম বৈকল্পিকতা করে তবে এটি এর আসল প্রক্রিয়া নয়। গ্র্যান্ডভ্যালেট উদাহরণ দেখিয়েছেন যেখানে এটি তারতম্য বৃদ্ধি করে এবং চিত্রিত করে যে পদ্ধতিটি মডেলকে দৃ strongly়ভাবে প্রভাবিত করে এমন তথ্য পয়েন্টগুলির সমান প্রভাবের সাথে ঘনিষ্ঠভাবে জড়িত, যেমন কমপক্ষে-স্কোয়ার রিগ্রেশনের বহিরাগতরা, যা বেশিরভাগ ক্ষেত্রে বৈকল্পিকতা হ্রাস করে।
মার্ক ক্লেসেন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.