সরল ইংরেজিতে ক্রস-বৈধকরণ?

77

ডেটা বিশ্লেষণের পটভূমি ছাড়াই আপনি কাউকে ক্রস-বৈধতা কীভাবে বর্ণনা করবেন ?

cross-validation

— শেন
সূত্র

3

এই প্রশ্নটি সাইটের নামের প্রস্তাব নিয়ে যে কোনও বিভ্রান্তি তৈরি করতে সহায়তা করবে: meta.stats.stackexchange.com/questions/21/… ।

— শেন

54

নিম্নলিখিত পরিস্থিতি বিবেচনা করুন:

আমি আমার অফিসে যেতে পাতাল রেলটি ধরতে চাই। আমার পরিকল্পনাটি আমার গাড়িটি নিয়ে যাওয়া, সাবওয়েতে পার্ক করা এবং তারপরে ট্রেনটি আমার অফিসে যাওয়ার জন্য। আমার লক্ষ্য হ'ল প্রতিদিন সকাল 8.15 টায় ট্রেন ধরছি যাতে আমি সময়মতো আমার অফিসে পৌঁছতে পারি। আমাকে নিম্নলিখিত সিদ্ধান্ত নিতে হবে: (ক) আমার বাসা থেকে আমার যে সময়টি ছেড়ে যেতে হবে এবং (খ) স্টেশন চালাতে আমি যে পথে যাব।

উপরের উদাহরণে আমার দুটি প্যারামিটার রয়েছে (যেমন, বাড়ি থেকে ছেড়ে যাওয়ার সময় এবং স্টেশনে যাওয়ার পথে) এবং আমার এই পরামিতিগুলি বেছে নেওয়া দরকার যেগুলি আমি সকাল 8.15 টার মধ্যে স্টেশন পৌঁছেছি।

উপরের সমস্যাটি সমাধান করার জন্য আমি সোমবার, বুধবার এবং শুক্রবারে 'পরামিতি' (অর্থাত্ যাত্রা ও রুটের বিভিন্ন সংমিশ্রণ) এর বিভিন্ন সেটগুলি চেষ্টা করতে পারি, এটি দেখতে সেরা কোনটি সমন্বিত। ধারণাটি হ'ল একবার আমি সর্বোত্তম সংমিশ্রণটি চিহ্নিত করে আমি এটি প্রতিদিন ব্যবহার করতে পারি যাতে আমি আমার উদ্দেশ্য অর্জন করি।

ওভারফিটিংয়ের সমস্যা

উপরোক্ত পদ্ধতির সমস্যাটি হ'ল আমি অতিরিক্ত উপস্থাপন করতে পারি যার মূলত অর্থটি হল আমি সেরা অর্থে যে সংশ্লেষটি চিহ্নিত করতে পারি তা কোনও অর্থে সোম, বুধ এবং শুক্রবারের জন্য অনন্য হতে পারে এবং এই সংমিশ্রণটি মঙ্গল এবং থু এর পক্ষে কাজ নাও করতে পারে means ওফিটফিটিং ঘটতে পারে যদি আমার সময় এবং রুটের সর্বোত্তম সংমিশ্রণের জন্য আমি সোম / বুধ / শুক্রবার ট্র্যাফিক পরিস্থিতির কিছু দিক ব্যবহার করি যা মঙ্গল ও থুতে ঘটে না।

ওভারফিটিংয়ের একটি সমাধান: ক্রস-বৈধকরণ

ক্রস-বৈধতা ওভারফিটিংয়ের একটি সমাধান। ধারণাটি হ'ল একবার আমরা আমাদের পরামিতিগুলির সর্বোত্তম সংমিশ্রণটি চিহ্নিত করে (আমাদের ক্ষেত্রে সময় এবং রুটে) আমরা সেই পরামিতিগুলির সেটের কার্যকারিতাটি অন্য একটি প্রসঙ্গে পরীক্ষা করি। অতএব, আমরা আমাদের পছন্দগুলি সেই দিনগুলিতেও কাজ করে তা নিশ্চিত করার জন্য মঙ্গল ও থুতেও পরীক্ষা করতে চাইতে পারি।

পরিসংখ্যানগুলিতে সাদৃশ্য প্রসারিত করা

পরিসংখ্যানগুলিতে, আমাদের একই রকম সমস্যা রয়েছে। আমরা প্রায়শই জানি না এমন অজানা প্যারামিটারগুলি অনুমান করতে সীমিত ডেটা ব্যবহার করি। যদি আমরা ওভারফিট করে থাকি তবে আমাদের প্যারামিটারের অনুমানগুলি বিদ্যমান ডেটাগুলির জন্য খুব ভাল কাজ করবে তবে আমরা যখন সেটিকে অন্য কোনও প্রসঙ্গে ব্যবহার করব তখন সেভাবে নয়। সুতরাং, ক্রস-বৈধতা আমাদের কিছুটা আশ্বাস দিয়ে প্রমাণ করেছে যে প্যারামিটারের অনুমানগুলি আমরা যে অনুমানের জন্য ব্যবহার করি সেগুলির সাথে অনন্য নয় prov

অবশ্যই, ক্রস বৈধতা নিখুঁত নয়। পাতাল রেলের আমাদের উদাহরণটিতে ফিরে গিয়ে এমনটি ঘটতে পারে যে ক্রস-বৈধকরণের পরেও আমাদের সেরা পরামিতিগুলি বিভিন্ন সমস্যার কারণে (যেমন, নির্মাণ, ট্র্যাফিকের পরিমাণের পরিবর্তনের সময় ইত্যাদি) এক লাইনে এক মাস কাজ নাও করতে পারে।

— jbaums
সূত্র

2

প্রযুক্তিগতভাবে, এটি হোল্ডআউট বৈধতা তবে কেউ পাতাল রেল উদাহরণটি ক্রস-বৈধকরণ প্রসঙ্গে প্রসারিত করার কল্পনা করতে পারে। যদি এটি সহায়তা করে তবে আমি উদাহরণটি এবং বাকী বাক্যটি আবার ক্রস-বৈধকরণের জন্য নির্দিষ্ট করে লিখব।

@ শ্রীকান্ত..একটি শব্দ হিসাবে শব্দটি অত্যধিক মানায় আমাকে পরামর্শ দেয় যে "কিছু বেশি" অর্থ করা হচ্ছে .. প্রয়োজনের চেয়ে বেশি..অবর্ধমানভাবে কী করা হয়েছে? এটি কি ভেরিয়েবলের নয়? আমি দুঃখিত আমি এই শব্দটি অনেকবার শোনাচ্ছি এবং আপনার সাথে এটি পরিষ্কার করার জন্য এই অপরিজ্ঞতাটি গ্রহণ করব।

— আয়ুষ বিয়ানি

1

আমি ভাবি যে এই উত্তরটি ভাঁজগুলির ধারণা যুক্ত করে উন্নত হবে, যা সিডি কীভাবে হোল্ডআউট পরীক্ষার চেয়ে আলাদা different উদাহরণস্বরূপ (সোমবারের জন্য এম সংক্ষেপণ, মঙ্গলবারের জন্য টি ... টি ইত্যাদিতে কাজ করে। সুতরাং প্রতিটি দিনই সমস্যার অংশ হিসাবে চারবার এবং একবার সমস্যার চেক হিসাবে ব্যবহৃত হয়, তবে একই সমস্যা হিসাবে আর কখনও চেক হিসাবে দেখা যায় না।

— ওয়েইন

43

আমি মনে করি যে নিম্নলিখিত চিত্রের সাথে এটি সর্বোত্তমভাবে বর্ণিত হয়েছে ( এক্ষেত্রে কে-ফোল্ড ক্রস-বৈধকরণ দেখানো হচ্ছে):

বিকল্প পাঠ

ক্রস-বৈধকরণ এমন একটি কৌশল যা ভবিষ্যদ্বাণীমূলক মডেলটিতে ওভারফিটিংয়ের বিরুদ্ধে সুরক্ষার জন্য ব্যবহৃত হয়, বিশেষত এমন একটি ক্ষেত্রে যেখানে ডেটার পরিমাণ সীমিত হতে পারে। ক্রস-বৈধকরণে, আপনি ডেটাগুলির একটি নির্দিষ্ট সংখ্যক ভাঁজ (বা পার্টিশন) তৈরি করেন, প্রতিটি ভাঁজটিতে বিশ্লেষণ চালান এবং তারপরে সামগ্রিক ত্রুটির অনুমান।

— শেন
সূত্র

2

এটি এই সাইটের অন্য কোথাও আলোচনার ভিত্তিতে দেখা যাচ্ছে যে কে-ফোল্ড ক্রস বৈধকরণ ক্রস বৈধকরণের এক প্রকার এবং এটি বর্ণনা করা ক্রস বৈধতা কী তা বর্ণনা করার সাধারণ কাজ করে না।

— রাসেলপিয়ের্স

3

@ ড্রকনেেক্সাস: এটি সুষ্ঠু, তবে আমি উল্লেখ করেছি যে এটি কে-গুণ এবং এটি ব্যাখ্যা করার জন্য আমি প্রক্রিয়াটির একটি দৃশ্যধারণ করতে চেয়েছিলাম।

— শেন

দ্রুত ব্যাখ্যা: এটি কি সেই ক্ষেত্রে, এনফোল্ড = 4 এর অর্থ পরীক্ষার জন্য 25%; nfold = 5 অর্থ 20% পরীক্ষা সেট; nfold = 10 এর অর্থ পরীক্ষার সেটের জন্য 10%, এবং এর বাইরে: nfold = n মানে 100 / n শতাংশ পরীক্ষার সেটে যায়?

— johnjps111

9

"প্রশিক্ষিত মডেলটি স্বাধীন ডেটাতে ভাল পারফরম্যান্স করে তা নিশ্চিত করে হৃদয় দিয়ে আপনার প্রশিক্ষণ ডেটা শিখবেন না" "

— আন্দ্রে হলজনার
সূত্র

3

এটি সিভির জন্য অনুপ্রেরণার চেয়ে সিভি নিজেই বিবরণের চেয়ে বেশি।

— jbaums

6

যাক আপনি কিছু প্রক্রিয়া তদন্ত করেন; আপনি এটিকে বর্ণনা করার জন্য কিছু ডেটা সংগ্রহ করেছেন এবং আপনি একটি মডেল তৈরি করেছেন (তবে পরিসংখ্যান বা এমএল, কোনও ব্যাপার নয়)। তবে এখন, ঠিক আছে কিনা তা বিচার করবেন কীভাবে? সম্ভবত এটি যে ডেটা তৈরি করেছিল তা সন্দেহজনকভাবে ফিট করে, তাই কেউ বিশ্বাস করবে না যে আপনার মডেলটি এত দুর্দান্ত যে আপনি ভাবেন।
প্রথম ধারণাটি হ'ল আপনার ডেটার একটি উপসেট পৃথক করে এবং বাকী ডেটাতে আপনার পদ্ধতি অনুসারে মডেল বিল্ডটি পরীক্ষা করতে এটি ব্যবহার করুন। ফলাফলটি অবশ্যই স্পষ্টতাহীন-মুক্ত, তবুও (বিশেষত ছোট সেটগুলির জন্য) আপনি (আন) ভাগ্যবান হতে পারতেন এবং পরীক্ষার জন্য আরও সহজ কেসগুলি আঁকতে পারতেন (এটি আরও কঠিন) ভবিষ্যদ্বাণী করা সহজ করে তোলে ... এছাড়াও আপনার নির্ভুলতা / মডেল তুলনা / অপ্টিমাইজেশনের জন্য ত্রুটি / ধার্মিকতার অনুমান মূল্যহীন, যেহেতু আপনি সম্ভবত এটির বিতরণ সম্পর্কে কিছুই জানেন না।
সন্দেহ হলে, নিষ্ঠুর শক্তি ব্যবহার করুন, সুতরাং কেবল উপরের প্রক্রিয়াটির প্রতিলিপি করুন, নির্ভুলতা / ত্রুটি / সদ্ব্যবহারের কয়েকটি অনুমান সংগ্রহ করুন এবং সেগুলি গড় করুন - এবং সুতরাং আপনি ক্রস বৈধতা পান। আরও ভাল অনুমানের মধ্যে আপনি হিস্টোগ্রামও পাবেন, সুতরাং আপনি আনুমানিক বিতরণ করতে পারবেন বা কিছু-প্যারামিমেট্রিক পরীক্ষা করতে পারবেন না।
এবং এটি এটি; টেস্ট-ট্রেন বিভাজনের বিবরণ বিভিন্ন সিভি ধরণের কারণ, এখনও বিরল ঘটনা এবং ছোট শক্তির পার্থক্য বাদে তারা সমতুল্য। প্রকৃতপক্ষে এটি একটি বিশাল সুবিধা, কারণ এটি এটিকে একটি বুলেটপ্রুফ-ফেয়ার পদ্ধতি করে তোলে; এটি ঠকানো খুব কঠিন।

3

যেহেতু প্রশিক্ষণের সময় আপনার কাছে পরীক্ষার ডেটা অ্যাক্সেস নেই এবং আপনি চান যে আপনার মডেলটি অদেখা পরীক্ষার ডেটাতে ভাল করতে পারে, আপনি বার বার একটি ছোট্ট অংশ সাবমল করে কিছু পরীক্ষার ডেটাতে আপনার অ্যাক্সেসের "ভান" করেন আপনার প্রশিক্ষণের ডেটা, মডেলটিকে প্রশিক্ষণ দেওয়ার সময় এই সেটটি ধরে রাখুন এবং তারপরে হোল্ড আউট সেটটিকে পরীক্ষার ডেটার জন্য প্রক্সি হিসাবে চিকিত্সা করুন (এবং এমন মডেল পরামিতিগুলি চয়ন করুন যা অনুষ্ঠিত আউট ডেটার উপরে সেরা পারফরম্যান্স দেয়)। আপনি আশা করেন যে প্রশিক্ষণ ডেটা থেকে এলোমেলোভাবে বিভিন্ন উপসেটের নমুনা তৈরি করে আপনি এগুলি পরীক্ষার ডেটার মতো দেখতে পাবেন (গড়পড়তা আচরণের অর্থে), এবং সুতরাং শিখেছি মডেল পরামিতিগুলি পরীক্ষার ডেটার জন্যও ভাল হবে (যেমন, আপনার মডেল অদেখা তথ্যের জন্য ভাল জেনারালাইজেশন)।

— ebony1
সূত্র