এনসেম্বল লার্নিং: মডেল স্ট্যাকিং কার্যকর কেন?


11

সাম্প্রতিককালে, আমি মডেল স্ট্যাকিংয়ের জন্য আগ্রহী হয়ে উঠছি se বিশেষত, আমি রিগ্রেশন সমস্যার জন্য কিছু খেলনা ডেটাসেটের সাথে কিছুটা পরীক্ষা করেছি। আমি মূলত স্বতন্ত্র "স্তর 0" রেজিস্ট্রারগুলি প্রয়োগ করেছি, প্রতিটি রেজিস্ট্রারের আউটপুট পূর্বাভাসকে "মেটা-রেজিস্ট্রার" এর ইনপুট হিসাবে গ্রহণ করার জন্য একটি নতুন বৈশিষ্ট্য হিসাবে সংরক্ষণ করেছি এবং এই নতুন বৈশিষ্ট্যগুলিতে এই মেটা-রেজিস্টারকে ফিট করেছি (স্তরটি থেকে ভবিষ্যদ্বাণীগুলি 0 রিগ্রিজার)। বৈধতা সেটের বিরুদ্ধে মেটা-রেজিস্ট্রার পরীক্ষা করার সময় স্বতন্ত্র রেজিস্ট্রারগুলির তুলনায় এমনকি পরিমিত উন্নতি দেখে আমি অত্যন্ত অবাক হয়েছি।

সুতরাং, এখানে আমার প্রশ্ন: মডেল স্ট্যাকিং কার্যকর কেন? স্বজ্ঞাতভাবে, আমি আশা করব যে মডেলটি স্ট্যাকিংটি খারাপভাবে সম্পাদন করবে কারণ এটি স্তরের 0 টি মডেলের প্রতিটি তুলনায় একটি দরিদ্র বৈশিষ্ট্য উপস্থাপনা বলে মনে হচ্ছে। এটি হ'ল, যদি আমি 20 টি বৈশিষ্ট্যযুক্ত কোনও ডেটাসেটে 3 স্তরের 0 রেজিস্ট্রারদের প্রশিক্ষণ দিই এবং এই স্তর 0 রেজিস্ট্রারদের পূর্বাভাসগুলি আমার মেটা-রেজিস্ট্রারের ইনপুট হিসাবে ব্যবহার করি, এর অর্থ আমার মেটা-রেজিস্ট্রার থেকে শিখতে কেবল 3 টি বৈশিষ্ট্য রয়েছে। মেটা-রেজিস্ট্রার প্রশিক্ষণের জন্য যে 3 আউটপুট বৈশিষ্ট্যগুলি প্রশিক্ষণের জন্য স্তরের 0 রেজিস্ট্রারদের প্রশিক্ষণের জন্য রয়েছে সেই 20 টি মূল বৈশিষ্ট্যে আরও তথ্য এনকোড করা হয়েছে বলে মনে হয়।

উত্তর:


5

মূলত কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটির শোষণ হিসাবে একত্রিত হওয়ার কথা ভাবুন।

কেন্দ্রীয় সীমাবদ্ধতার উপপাদটি আলগাভাবে বলেছে যে, নমুনার আকার বাড়ার সাথে সাথে, নমুনার গড়টি জনসংখ্যার প্রকৃত অবস্থানের ক্রমবর্ধমান সঠিক অনুমান হয়ে উঠবে (ধরে নিচ্ছেন যে পরিসংখ্যানটি আপনি দেখছেন) এবং তারতম্য আরও দৃighten় হবে ।

আপনার যদি একটি মডেল থাকে এবং এটি আপনার নির্ভরশীল ভেরিয়েবলের জন্য একটি ভবিষ্যদ্বাণী তৈরি করে, সেই ভবিষ্যদ্বাণীটি সম্ভবত উচ্চতর বা কম কিছুটা কম। তবে যদি আপনার কাছে 3 বা 5 বা 10 টি বিভিন্ন মডেল থাকে যা বিভিন্ন পূর্বাভাস দেয়, যে কোনও পর্যবেক্ষণের জন্য, কিছু মডেল থেকে উচ্চতর ভবিষ্যদ্বাণীগুলি অন্য কোনও মডেল থেকে নিম্ন ত্রুটিগুলি অফসেট করতে প্রবণতা রাখে এবং নেট ইফেক্টটি গড়ের একত্রিতকরণ হবে (বা অন্যান্য সংমিশ্রণ) "সত্য" এর দিকে ভবিষ্যদ্বাণীগুলির। প্রতিটি পর্যবেক্ষণে নয়, তবে সাধারণভাবে এটি প্রবণতা। এবং তাই, সাধারণত, একটি সাজানো সেরা একক মডেলকে ছাড়িয়ে যাবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.