সাধারণত অবশ্যই পার্থক্যটি লক্ষণীয় নয়, এবং তাই আমার প্রশ্নটিও চলে যায় - যখন কোনও ধরণের ফলাফল অন্যর চেয়ে উল্লেখযোগ্যভাবে পৃথক হয় তখন আপনি কি উদাহরণের কথা ভাবতে পারেন?
আমি নিশ্চিত হচ্ছি না যে পার্থক্যটি বিনা লক্ষণীয় এবং এটি কেবলমাত্র অ্যাডহক উদাহরণে এটি লক্ষণীয় হবে। ক্রস-বৈধকরণ এবং বুটস্ট্র্যাপিং (সাব-স্যাম্পলিং) উভয় পদ্ধতিই তাদের নকশার প্যারামিটারগুলির উপর সমালোচনামূলকভাবে নির্ভর করে এবং এই বোঝাপড়াটি এখনও সম্পূর্ণ হয়নি। সাধারণভাবে, কে-ফোল্ড ক্রস-বৈধকরণের মধ্যে ফলাফলগুলি ভাঁজের সংখ্যার উপর সমালোচনামূলকভাবে নির্ভর করে, তাই আপনি সাব-স্যাম্পলিংয়ে যা পর্যবেক্ষণ করবেন তার থেকে সর্বদা আলাদা ফলাফল আশা করতে পারেন।
পয়েন্ট ইন কেস: বলুন যে আপনার কাছে একটি নির্দিষ্ট সংখ্যক পরামিতি রয়েছে line যদি আপনি কে-ফোল্ড ক্রস-বৈধকরণ (প্রদত্ত, স্থির কে সহ) ব্যবহার করেন এবং পর্যবেক্ষণের সংখ্যাটি অসীমের দিকে যেতে দিন, কে-ফোল্ড ক্রস বৈধকরণ মডেল নির্বাচনের ক্ষেত্রে অসম্পূর্ণভাবে বেমানান হবে, অর্থাত্ এটি একটি ভুল মডেল সনাক্ত করবে সম্ভাবনা ০ এর চেয়ে বেশি greater এই চমকপ্রদ ফলাফলটি জুন শাওর কারণে, "ক্রস-ভ্যালিডেশন দ্বারা লিনিয়ার মডেল নির্বাচন", আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল , ৮৮ , ৪৮6-৪৯৪ (১৯৯৩), তবে আরও শিথিল খুঁজে পাওয়া যাবে।
সাধারণভাবে, সম্মানজনক পরিসংখ্যান সংক্রান্ত কাগজপত্রগুলি ক্রস-বৈধতা প্রোটোকলকে নির্দিষ্ট করে, ঠিক কারণ ফলাফলগুলি অদম্য নয়। যে ক্ষেত্রে তারা বড় ডেটাসেটের জন্য বিশাল সংখ্যক ভাঁজ বেছে নেয়, তারা মন্তব্য করে এবং মডেল নির্বাচনের পক্ষপাতদুদের সংশোধন করার চেষ্টা করে।