যেহেতু এই প্রশ্নের উপর ওপি একটি অনুগ্রহ করেছে, তাই এটি কিছুটা দৃষ্টি আকর্ষণ করবে এবং সুতরাং এটি ওপির সরাসরি উত্তর না দিলেও কিছু সাধারণ ধারণা নিয়ে আলোচনা করার সঠিক জায়গা।
প্রথম, নাম:
ক) ক্রস বৈধতা সমস্ত অনুমান / পরিমাপ কৌশলগুলির সাধারণ নাম যা ট্রেনের সেটের চেয়ে পৃথক কোনও পরীক্ষা সেট ব্যবহার করে। প্রতিশব্দ: বহিরাগত-নমুনা বা অতিরিক্ত-নমুনা অনুমান। প্রতিশব্দ: ইন-নমুনা অনুমান।
নমুনা অনুমানটি এমন কৌশলগুলি যা মডেলটির গুণমান নির্ধারণের জন্য প্রশিক্ষণে কিছু তথ্য ব্যবহার করে (অগত্যা ত্রুটি নয়)। মডেলটির উচ্চতর পক্ষপাত থাকলে এটি খুব সাধারণ - এটি - এটি ডেটা সম্পর্কে দৃ strong় অনুমান করে। রৈখিক মডেলগুলিতে (একটি উচ্চ পক্ষপাতের মডেল), প্রশ্নের উদাহরণ হিসাবে, কেউ আর-স্কোয়ারড, এআইসিসি, বিআইসি, বিচ্যুতি ব্যবহার করে মডেল মানের হিসাবে - এই সমস্তগুলি ইন-নমুনা অনুমানকারী। উদাহরণস্বরূপ, এসভিএম-তে, সমর্থন ভেক্টরের অনুপাতের ডেটা সংখ্যার সংখ্যার সাথে মডেলটির ত্রুটির একটি নমুনা অনুমান।
অনেকগুলি ক্রস বৈধকরণের কৌশল রয়েছে:
খ) ধরে রাখা উপরের পদ্ধতি # 1 করা। সেটটি একটি প্রশিক্ষণ এবং একটি পরীক্ষায় বিভক্ত করুন। প্রশিক্ষণ এবং পরীক্ষার সেটগুলির আপেক্ষিক আকারের বিষয়ে আলোচনা এবং অনুশীলনের একটি দীর্ঘ ইতিহাস রয়েছে।
গ) কে- ভাঁজ - পদ্ধতি # 2 উপরে। বেশ মান।
d) ছাড়ুন-এক-আউট - পদ্ধতি # 3 উপরে।
ঙ) বুটস্ট্র্যাপ : যদি আপনার সেটে এন ডেটা থাকে, সেট থেকে প্রতিক্রিয়াতে এলোমেলোভাবে এন নমুনা নির্বাচন করুন এবং এটি প্রশিক্ষণ হিসাবে ব্যবহার করুন। মূল সেট থেকে প্রাপ্ত ডেটা যা কোনও সময় নমুনা হয়ে যায়নি তা পরীক্ষার সেট হিসাবে ব্যবহৃত হয়। মডেলটির ত্রুটির চূড়ান্ত অনুমানের গণনা করার বিভিন্ন উপায় রয়েছে যা পরীক্ষার সেট (নমুনা ছাড়াই) এবং ট্রেনের সেট (ইন-নমুনা) এর জন্য ত্রুটি উভয়ই ব্যবহার করে। উদাহরণস্বরূপ, .632 বুটস্ট্র্যাপ দেখুন। আমি মনে করি একটি .632+ সূত্রও রয়েছে - সেগুলি এমন সূত্র যা নমুনা ছাড়াই এবং ইন-নমুনা ত্রুটি উভয়ই ব্যবহার করে মডেলের আসল ত্রুটিটি অনুমান করে।
চ) উপরোক্ত পদ্ধতির নির্বাচনের অর্থোগোনালটি পুনরাবৃত্তি করার বিষয়টি। ছুটি-এক-আউট ব্যতীত উপরের সমস্ত পদ্ধতিতে যে কোনও সংখ্যক বার পুনরাবৃত্তি করা যেতে পারে। আসলে কেউ রিপেইটেড হোল্ড-আউট, বা রিপিটেড কে- ফোল্ড সম্পর্কে কথা বলতে পারে । ন্যায়বিচারের জন্য, প্রায়শই বুটস্ট্র্যাপ পদ্ধতিটি পুনরাবৃত্ত ফ্যাশনে ব্যবহৃত হয়।
পরবর্তী প্রশ্নটি হল, কোন পদ্ধতিটি "ভাল"।সমস্যাটি "উন্নত" অর্থ কী means
1) প্রথম উত্তরটি হ'ল এই প্রতিটি পদ্ধতির মডেল ত্রুটির অনুমানের জন্য পক্ষপাতদুষ্ট জন্য ভবিষ্যতের (ভবিষ্যতের তথ্যের অসীম পরিমাণের জন্য)।
২) দ্বিতীয় বিকল্পটি হ'ল এই পদ্ধতিগুলির প্রতিটিটি কতটা দ্রুত বা কত ভালভাবে সত্য মডেল ত্রুটিতে রূপান্তরিত করে (যদি তারা পক্ষপাতদুষ্ট না হয়)। আমি বিশ্বাস করি এটি এখনও গবেষণার বিষয় is আমাকে এই দুটি কাগজপত্র (পে-ওয়ালের পিছনে) দিকে ইশারা করুন তবে বিমূর্তটি তারা কী অর্জন করতে চাইছে সে সম্পর্কে কিছুটা বোঝার সুযোগ দেয়। এছাড়াও খেয়াল করুন যে কে- ফোল্ডকে "ক্রস-বৈধকরণ" হিসাবে নিজেরাই বলা খুব সাধারণ ।
এই বিষয়গুলি সম্পর্কে সম্ভবত আরও অনেকগুলি কাগজপত্র রয়েছে। সেগুলি কেবল কয়েকটি উদাহরণ।
3) "আরও ভাল" এর আরেকটি দিক হ'ল: উপরের কৌশলগুলির মধ্যে একটির ব্যবহার করে মডেল ত্রুটির একটি নির্দিষ্ট পরিমাপ দেওয়া হয়েছে, আপনি কীভাবে নিশ্চিত হতে পারেন যে সঠিক মডেলের ত্রুটিটি নিকটে রয়েছে।
সাধারণভাবে, এক্ষেত্রে আপনি ত্রুটির অনেকগুলি পদক্ষেপ নিতে এবং একটি আত্মবিশ্বাসের ব্যবধান (বা আপনি যদি বায়েসিয়ান পদ্ধতির অনুসরণ করেন তবে বিশ্বাসযোগ্য ব্যবধান) গণনা করতে চান । এই ক্ষেত্রে, সমস্যাটি হ'ল ত্রুটি ব্যবস্থাপনার সেটটির পরিবর্তনের উপর আপনি কতটা বিশ্বাস করতে পারেন। লক্ষ করুন যে, ছুটি এক-আউটের জন্য ব্যতীত, উপরের সব কৌশল আপনি আলাদা আলাদা ব্যবস্থা (দেব ট একটি জন্য ব্যবস্থা ট ধা, এন একটি জন্য ব্যবস্থা এন -repeated আউট রাখা) এবং এইভাবে আপনি ভ্যারিয়েন্স (অথবা স্ট্যানডার্ড ডেভিয়েশন পরিমাপ করতে পারেন ) এই সেটটি এবং ত্রুটির পরিমাপের জন্য একটি আত্মবিশ্বাসের ব্যবধান গণনা করুন।
এখানে বিষয়গুলি কিছুটা জটিল হয়ে যায়। থেকে কি আমি কাগজ থেকে বুঝতে ভ্যারিয়েন্স এর কোনো নিরপেক্ষ মূল্নির্ধারক ট ধা ক্রস-বৈধতা (paywall পিছনে না), একটি ভ্যারিয়েন্স আপনি যদি একটি থেকে পেতে বিশ্বাস করতে পারি না ট ধা - তাই এক থেকে একটি ভাল আস্থা ব্যবধান গঠন করা যায় না ট - folds। তত্ত্বাবধানে শ্রেণিবদ্ধকরণ শেখার অ্যালগরিদমগুলি (পেওয়ালের পিছনে নয়) তুলনা করার জন্য আনুমানিক পরিসংখ্যানগত টেস্টগুলি থেকে কাগজটি যা আমি বুঝতে পারি তার থেকে , কৌশলগুলি যা পুনরাবৃত্তি ব্যবস্থাগুলি ব্যবহার করে (পুনরাবৃত্তি কে- ভাঁজ, বার বার হোল্ড-আউট - বুটস্ট্র্যাপ সম্পর্কে নিশ্চিত নয়) ত্রুটি পরিমাপের প্রকৃত প্রকরণটি উপ-অনুমান করবে (এটি দেখতে কিছুটা সহজ) - যেহেতু আপনি পরিমাপটি খুব বড় সংখ্যার পুনরাবৃত্তি করেন তবে আপনি একটি সীমাবদ্ধ সেট থেকে নমুনা নিচ্ছেন অনেক সময় একই মানগুলি পুনরাবৃত্তি করতে থাকবে, যা গড়কে একই রাখে তবে বৈকল্পিকতা হ্রাস করে)। সুতরাং পুনরাবৃত্তি ব্যবস্থা কৌশলগুলি আত্মবিশ্বাসের বিরতিতে খুব আশাবাদী হবে।
এই শেষ কাগজে 5 টি পুনরাবৃত্তি 2-ভাঁজ করার পরামর্শ দেয় - যাকে তিনি 5 × 2 সিভি বলেছেন - অনেকগুলি পরিমাপের (10) ভাল ব্যালেন্স হিসাবে দেখায় তবে খুব বেশি পুনরাবৃত্তি নয়।
সম্পাদনা করুন:
অবশ্যই এই কয়েকটি প্রশ্নের ক্রস ভ্যালিডেটে দুর্দান্ত উত্তর রয়েছে (যদিও তারা কখনও কখনও নিজেদের মধ্যে একমত হয় না)। এখানে কিছু আছে:
শ্রেণিবিন্যাসের পারফরম্যান্স মূল্যায়নের জন্য ক্রস-বৈধতা বা বুটস্ট্র্যাপিং?
পূর্বাভাস ত্রুটিটি অনুমান করার জন্য ক্রস বৈধকরণ এবং বুটস্ট্র্যাপিংয়ের মধ্যে পার্থক্য
শ্রেণিবিন্যাসের পারফরম্যান্স মূল্যায়নের জন্য ক্রস-বৈধতা বা বুটস্ট্র্যাপিং?
বৈধতা এবং মডেল নির্বাচনের জন্য বুটস্ট্র্যাপিং বোঝা
সাধারণভাবে, ট্যাগ ক্রস-বৈধতা এখানে আপনার বন্ধু।
তাহলে সবচেয়ে ভাল সমাধান কী? আমি জানি না। যখন আমার খুব কঠোর হওয়া দরকার তখন আমি 5 × 2 সিভি ব্যবহার করি, যখন আমার নিশ্চিত হওয়া দরকার যে একটি কৌশল অন্যের চেয়ে ভাল, বিশেষত প্রকাশনাগুলিতে। আমি যদি হোল্ড আউট ব্যবহার করি যদি আমি কোনও পরিমানের বৈকল্পিকতা বা মানক বিচ্যুতি করার পরিকল্পনা না করি, বা আমার যদি সময় সীমাবদ্ধতা থাকে - হোল্ড- আউটে কেবলমাত্র একটি মডেল শিখতে হবে ।