আমি জানি না এটি কোনও মন্তব্য হিসাবে বা উত্তর হিসাবে যোগ্য কিনা। আমি এখানে রাখছি কারণ এটি একটি উত্তর মত মনে হচ্ছে।
কে-ভাঁজ ক্রস-বৈধকরণে আপনি আপনার ডেটা কে গ্রুপে বিভক্ত করছেন। যদি আপনি এমনকি "বেসিকগুলি" coveringেকে রাখেন তবে আপনি প্রতিটি বি বিনের জন্য অবিচ্ছিন্নভাবে সদস্য নির্বাচন করছেন।
আমি যখন ডেটার কথা বলি, তখন আমি প্রতিটি সারিকে একটি নমুনা হিসাবে এবং প্রতিটি কলামকে একটি মাত্রা হিসাবে ভাবি। পরিবর্তনশীল গুরুত্ব, কলামের গুরুত্ব নির্ধারণ করতে আমি বিভিন্ন পদ্ধতি ব্যবহার করে অভ্যস্ত।
আপনি যদি একটি চিন্তার অনুশীলন হিসাবে, "পাঠ্যপুস্তক" ইউনিফর্মটি এলোমেলোভাবে ছেড়ে চলে যান এবং কোন সারিটি গুরুত্বপূর্ণ তা নির্ধারণ করেন? হতে পারে তারা একবারে একটি একক চলককে অবহিত করে তবে তারা আরও অবহিত করে। এমন কিছু সারি রয়েছে যা অন্যের চেয়ে কম গুরুত্বপূর্ণ? পয়েন্টগুলির অনেকগুলি তথ্যমূলক হতে পারে, খুব কমই হতে পারে।
ভেরিয়েবলের গুরুত্ব সম্পর্কে জানা, আপনি সম্ভবত তাদের গুরুত্ব দিয়ে বিনিন করতে পারেন। সম্ভবত আপনি সর্বাধিক গুরুত্বপূর্ণ নমুনাগুলি সহ একটি একক বিন তৈরি করতে পারেন। এটি আপনার "কে" এর আকার নির্ধারণ করতে পারে। এইভাবে, আপনি "সর্বাধিক তথ্যবহুল" কাঠের বালতিটি নির্ধারণ করছেন এবং এটি অন্যের সাথে এবং কমপক্ষে তথ্যমূলক বালতির বিপরীতে তুলনা করছেন।
এটি আপনাকে আপনার মডেল পরামিতিগুলির সর্বাধিক পরিবর্তনের ধারণা দিতে পারে। এটি কেবল একটি ফর্ম।
Kth bucket বিভক্ত করার দ্বিতীয় উপায় হ'ল দৈর্ঘ্য এবং প্রভাবের দিকনির্দেশ। সুতরাং আপনি একটি বালতিতে একটি দিকের প্যারামিটার বা পরামিতিগুলির দমন করতে পারেন এমন নমুনাগুলি রেখে দিতে পারেন এবং একই পরামিতি বা পরামিতিগুলিকে বিপরীত দিকে আলাদা বালতিতে ফেলেছেন samples
এই ফর্মের প্যারামিটারের প্রকরণটি ভেরিয়েবলগুলিকে একটি বৃহত্তর সুইপ দিতে পারে, তথ্য ঘনত্বের ভিত্তিতে নয়, তবে তথ্য ব্রিডের ভিত্তিতে।
ভাগ্য সুপ্রসন্ন হোক.