সাম্প্রতিককালে, আমি মডেল স্ট্যাকিংয়ের জন্য আগ্রহী হয়ে উঠছি se বিশেষত, আমি রিগ্রেশন সমস্যার জন্য কিছু খেলনা ডেটাসেটের সাথে কিছুটা পরীক্ষা করেছি। আমি মূলত স্বতন্ত্র "স্তর 0" রেজিস্ট্রারগুলি প্রয়োগ করেছি, প্রতিটি রেজিস্ট্রারের আউটপুট পূর্বাভাসকে "মেটা-রেজিস্ট্রার" এর ইনপুট হিসাবে গ্রহণ করার জন্য একটি নতুন বৈশিষ্ট্য হিসাবে সংরক্ষণ করেছি এবং এই নতুন বৈশিষ্ট্যগুলিতে এই মেটা-রেজিস্টারকে ফিট করেছি (স্তরটি থেকে ভবিষ্যদ্বাণীগুলি 0 রিগ্রিজার)। বৈধতা সেটের বিরুদ্ধে মেটা-রেজিস্ট্রার পরীক্ষা করার সময় স্বতন্ত্র রেজিস্ট্রারগুলির তুলনায় এমনকি পরিমিত উন্নতি দেখে আমি অত্যন্ত অবাক হয়েছি।
সুতরাং, এখানে আমার প্রশ্ন: মডেল স্ট্যাকিং কার্যকর কেন? স্বজ্ঞাতভাবে, আমি আশা করব যে মডেলটি স্ট্যাকিংটি খারাপভাবে সম্পাদন করবে কারণ এটি স্তরের 0 টি মডেলের প্রতিটি তুলনায় একটি দরিদ্র বৈশিষ্ট্য উপস্থাপনা বলে মনে হচ্ছে। এটি হ'ল, যদি আমি 20 টি বৈশিষ্ট্যযুক্ত কোনও ডেটাসেটে 3 স্তরের 0 রেজিস্ট্রারদের প্রশিক্ষণ দিই এবং এই স্তর 0 রেজিস্ট্রারদের পূর্বাভাসগুলি আমার মেটা-রেজিস্ট্রারের ইনপুট হিসাবে ব্যবহার করি, এর অর্থ আমার মেটা-রেজিস্ট্রার থেকে শিখতে কেবল 3 টি বৈশিষ্ট্য রয়েছে। মেটা-রেজিস্ট্রার প্রশিক্ষণের জন্য যে 3 আউটপুট বৈশিষ্ট্যগুলি প্রশিক্ষণের জন্য স্তরের 0 রেজিস্ট্রারদের প্রশিক্ষণের জন্য রয়েছে সেই 20 টি মূল বৈশিষ্ট্যে আরও তথ্য এনকোড করা হয়েছে বলে মনে হয়।