ওভারফিটিং প্রতিরোধের জন্য ক্রস-বৈধতা কি যথেষ্ট?


17

যদি আমার কাছে কোনও ডেটা থাকে এবং আমি ক্রস বৈধকরণের (এই 5 টি ভাঁজগুলি বলি) একটি শ্রেণিবদ্ধকরণ চালাও (আসুন 5-ভাজ বলি) আমি কি এই সিদ্ধান্তে পৌঁছাতে পারি যে আমার পদ্ধতিতে কোনও অতিরিক্ত ফিট নেই?

উত্তর:


20

একেবারেই না. যাইহোক, ক্রস বৈধতা আপনাকে আপনার পদ্ধতির পরিমাণ কত বেশি তা নির্ধারণ করতে সহায়তা করে।

উদাহরণস্বরূপ, যদি আপনার প্রশিক্ষণের ডেটা কোনও রিগ্রেশনের আর-স্কোয়ার হয় 0.50 এবং ক্রসওলটিভেটেড আর-স্কোয়ার্ড 0.48 হয় তবে আপনার খুব কমই খুব ভাল লাগবে এবং আপনার ভাল লাগছে। অন্যদিকে, যদি ক্রসওলিউটিভেটেড আর-স্কোয়ার্ড এখানে মাত্র ০.০ হয়, তবে আপনার মডেল পারফরম্যান্সের একটি উল্লেখযোগ্য অংশ সত্যিকারের সম্পর্ক থেকে নয় ওভারফিটিংয়ের কারণে আসে। এই জাতীয় ক্ষেত্রে আপনি হয় কম পারফরম্যান্স গ্রহণ করতে পারেন বা কম ওভারফিটিংয়ের সাথে বিভিন্ন মডেলিং কৌশলগুলি ব্যবহার করতে পারেন।


8
আমি মনে করি এই উত্তরটি চেতনায় সঠিক, তবে আমি দ্বিতীয় অনুচ্ছেদে ওভার ফিটের বৈশিষ্ট্যটির সাথে একমত নই। আমি বিশ্বাস করি না যে ট্রেনের ত্রুটি - পরীক্ষার ত্রুটি> কিছু আবদ্ধ হওয়ার পরিবর্তে ওভার ফিটিংয়ের ঘটনা ঘটে তবে আমি তার চেয়ে বেশি ফিটিংকে এমন একটি পরিস্থিতি হিসাবে চিহ্নিত করব যেখানে মডেলের জটিলতা বাড়ানো হোল্ড আউট ত্রুটিকে কিছুটা বাড়ায় । আপনার ট্রেন এবং পরীক্ষার ত্রুটিগুলি তুলনীয় হওয়ার প্রয়োজনীয়তার ফলে প্রায়শই খুব আন্ডারফিট মডেল তৈরি হয়।
ম্যাথু ড্রুরি

7

অতিরিক্ত-ফিটিং হ্রাস করার জন্য ক্রস-বৈধকরণ একটি ভাল, তবে নিখুঁত নয় technique

যদি আপনার কাছে থাকা ডেটা যে ডেটা আপনি ভবিষ্যদ্বাণী করতে চেষ্টা করবেন তার প্রতিনিধি না হলে ক্রস-বৈধকরণ বাইরের ডেটার সাথে ভাল সম্পাদন করবে না!

ক্রস-বৈধকরণের ত্রুটি থাকলে এখানে দুটি কংক্রিট পরিস্থিতি রয়েছে:

  • আপনি ভবিষ্যতের ভবিষ্যদ্বাণী করতে অতীতকে ব্যবহার করছেন: ভবিষ্যতের পর্যবেক্ষণগুলির মতো একই বন্টন সহ অতীতের পর্যবেক্ষণগুলি একই জনসংখ্যার কাছ থেকে আসবে বলে ধরে নেওয়া প্রায়শই বড় ধারণা। অতীত থেকে আঁকা একটি ডেটা ক্রস-বৈধকরণ এটির বিরুদ্ধে রক্ষা করবে না।
  • আপনার সংগৃহীত ডেটাগুলিতে একটি পক্ষপাতিত্ব রয়েছে: আপনি যে ডেটা পর্যবেক্ষণ করেন সেটি আপনার পর্যবেক্ষণ না করা ডেটা থেকে নিয়মিতভাবে আলাদা। উদাহরণস্বরূপ, আমরা যারা জরিপ নেওয়া বেছে নিয়েছি তাদের মধ্যে উত্তরদাতা পক্ষপাত সম্পর্কে আমরা জানি।

3
আপনার ডেটাসেটটি সত্য জনসংখ্যার দুর্বল উপস্থাপনা না হওয়া সাধারণত ওভার ফিটিংয়ের একটি পৃথক সমস্যা হিসাবে বিবেচিত হয়। অবশ্যই, এটি সঠিক যে ক্রস-বৈধতা তাদের সম্বোধন করে না।
ক্লিফ এবি

2

এছাড়াও আমি এই ভিডিওগুলি পরিসংখ্যানগত শিক্ষার স্ট্যানফোর্ড কোর্স থেকে পুনরায় সংশোধন করতে পারি। এই ভিডিওগুলি কীভাবে কার্যকরভাবে ক্রস-ভ্যালুডেশনকে ব্যবহার করতে পারে সে সম্পর্কে যথেষ্ট গভীরতায় যায়।

ক্রস-বৈধকরণ এবং বুটস্ট্র্যাপ (14:01)

কে-ভাঁজ ক্রস-বৈধকরণ (13:33)

ক্রস-বৈধকরণ: সঠিক এবং ভুল উপায় (10:07)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.