রিগ্রেশন মডেলগুলির মধ্যে নির্বাচন করতে কে-ফোল্ড সিভি ব্যবহার করার সময়, আমি সাধারণত প্রতিটি মডেলের সিভি ত্রুটি আলাদাভাবে তার স্ট্যান্ডার্ড ত্রুটি এসই সহ গণনা করি এবং আমি সর্বনিম্ন সিভি ত্রুটি সহ মডেলটির 1 এসি মধ্যে সর্বাধিকতম মডেল নির্বাচন করি (1 স্ট্যান্ডার্ড ত্রুটি বিধি, উদাহরণস্বরূপ এখানে দেখুন )। যাইহোক, আমাকে সম্প্রতি বলা হয়েছে যে এইভাবে আমি পরিবর্তনশীলতাটিকে অত্যধিক বিবেচনা করছি এবং এ এবং বি দুটি মডেলের মধ্যে নির্বাচন করার ক্ষেত্রে নির্দিষ্ট ক্ষেত্রে আমার সত্যিই অন্যভাবে এগিয়ে যাওয়া উচিত:
- প্রতিটি ভাঁজ জন্য দৈর্ঘ্যের , দুটি মডেলের পূর্বাভাসের মধ্যে পয়েন্টওয়াইজ পার্থক্য গণনা করুন hen তারপরে ভাঁজের জন্য গড় বর্গক্ষেত্রের পার্থক্য গণনা করুন
- গড় যথারীতি ভাঁজগুলি জুড়ে এবং সাধারণকরণের ত্রুটির জন্য অনুমানক হিসাবে এই সিভি পার্থক্য ত্রুটি (একসাথে এর আদর্শ ত্রুটি সহ) ব্যবহার করুন।
প্রশ্নাবলী:
- এটি কি আপনার অর্থবোধ করে? আমি জানি যে সাধারণীকরণ ত্রুটির অনুমানক হিসাবে সিভি ত্রুটি ব্যবহারের পিছনে তাত্ত্বিক কারণ রয়েছে (আমি জানি না যে এই কারণগুলি কী, তবে আমি জানি যে তারা বিদ্যমান!)। এই "পার্থক্য" সিভি ত্রুটি ব্যবহারের পিছনে তাত্ত্বিক কারণ আছে কিনা আমার কোনও ধারণা নেই।
- আমি জানি না যে এটি দুটিরও বেশি মডেলের তুলনাতে সাধারণীকরণ করা যায় কিনা। সমস্ত জোড়া মডেলের জন্য পার্থক্য গণনা ঝুঁকিপূর্ণ বলে মনে হচ্ছে (একাধিক তুলনা?): আপনি যদি দুটি মডেলের বেশি হন তবে আপনি কী করবেন?
সম্পাদনা: আমার সূত্রটি সম্পূর্ণ ভুল, এখানে সঠিক মেট্রিক বর্ণিত হয়েছে এবং এটি আরও জটিল। ভাল, আমি খুশি আমি অন্ধভাবে সূত্র প্রয়োগ করার আগে এখানে জিজ্ঞাসা করেছি! আমি @ বে কে তার আলোকিত উত্তর দিয়ে আমাকে বুঝতে সাহায্য করার জন্য ধন্যবাদ জানাই। বর্ণিত সঠিক পরিমাপটি বেশ পরীক্ষামূলক, তাই আমি আমার বিশ্বস্ত কাজের ঘোড়াতে আটকে থাকব, সিভি ত্রুটি!