উত্তর:
এটি বৈকল্পিকতা এবং পক্ষপাতদুষ্টে নেমে আসে (যথারীতি)। সিভি কম পক্ষপাতদুষ্ট বলে মনে হয় তবে কে-ফোল্ড সিভিতে যথেষ্ট বড় বৈচিত্র রয়েছে large অন্যদিকে, বুটস্ট্র্যাপিং এর প্রকরণটি মারাত্মকভাবে হ্রাস করতে পারে তবে আরও পক্ষপাতদুষ্ট ফলাফল দেয় (তারা হতাশাব্যঞ্জক হতে থাকে)। অন্যান্য বুটস্ট্র্যাপিং পদ্ধতিগুলি বুটস্ট্র্যাপ পক্ষপাতমূলক (যেমন such৩২ এবং 2৩২+ বিধি) মোকাবিলা করার জন্য গ্রহণ করা হয়েছে।
অন্য দুটি পন্থা হ'ল "মন্টি কার্লো সিভি" ওরফে "লিভ-গ্রুপ-আউট সিভি" যা অনেকগুলি ডেটা এলোমেলোভাবে বিভক্ত করে তোলে (সাজানোর মতো মিনি প্রশিক্ষণ এবং পরীক্ষার বিভাজন)। এই পদ্ধতির জন্য ভেরিয়েন্সটি খুব কম এবং যদি হোল্ড-আউট-এ থাকা ডেটার পরিমাণ কম থাকে তবে পক্ষপাত খুব খারাপ হয় না। এছাড়াও, পুনরাবৃত্ত সিভি বেশ কয়েকবার কে-ভাঁজ করে এবং নিয়মিত কে-ফোল্ডের মতো ফলাফলের গড় গড় করে। আমি এর পক্ষে সবচেয়ে বেশি আংশিক, যেহেতু এটি কম পক্ষপাতিত্ব রাখে এবং বৈকল্পিকতা হ্রাস করে।
বড় আকারের নমুনা আকারের জন্য, বৈকল্পিক বিষয়গুলি কম গুরুত্বপূর্ণ হয়ে যায় এবং গণনার অংশটি আরও একটি সমস্যা issues আমি এখনও ছোট এবং বড় নমুনা আকারের জন্য পুনরাবৃত্ত সিভি দ্বারা আটকে থাকব।
কিছু প্রাসঙ্গিক গবেষণা নীচে রয়েছে (esp কিম এবং মলিনারো)।
বেনজিও, ওয়াই, এবং গ্র্যান্ডওয়ালেট, ওয়াই (2005)। কে-ভাঁজ ক্রস-বৈধকরণের বৈকল্পিক অনুমানের ক্ষেত্রে বায়াস। জটিল ডেটা সমস্যার জন্য পরিসংখ্যানের মডেলিং এবং বিশ্লেষণ, 75-95।
ব্রাগা-নেটো, ইউএম (2004)। ছোট-নমুনা মাইক্রোয়ারে শ্রেণিবদ্ধকরণ বায়োইনফরম্যাটিক্স, 20 (3), 374–380 এর জন্য ক্রস-বৈধতা বৈধ valid ডোই: 10,1093 / বায়োইনফরম্যাটিক্স / btg419
ইফ্রন, বি (1983)। পূর্বাভাস বিধির ত্রুটি হারের অনুমান করা: ক্রস-বৈধকরণের উন্নতি। আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন জার্নাল, 316–331।
ইফ্রন, বি।, এবং তিবশিরানী, আর। (1997)। ক্রস-বৈধকরণের উন্নতি: 632+ বুটস্ট্র্যাপ পদ্ধতি। আমেরিকান পরিসংখ্যান সমিতি জার্নাল, 548-5560।
ফুরলেনেলো, সি।, মেরার, এস।, চেমিনি, সি।, এবং রিজোলি, এ। (1997)। বাস্তুসংক্রান্ত ডেটাতে বুটস্ট্র্যাপের 632+ নিয়মের একটি অ্যাপ্লিকেশন। WIRN 97।
জিয়াং, ডাব্লু।, এবং সাইমন, আর। (2007) মাইক্রোয়ারে শ্রেণিবিন্যাসে পূর্বাভাস ত্রুটির অনুমান করার জন্য বুটস্ট্র্যাপ পদ্ধতির তুলনা এবং একটি সমন্বিত বুটস্ট্র্যাপ পদ্ধতির। মেডিসিনে পরিসংখ্যান, 26 (29), 5320–5334।
জোনাথন, পি।, ক্রজানোভস্কি, ডাব্লু।, এবং ম্যাকার্থি, ডাব্লু। (2000)। মাল্টিভিয়ারেট পূর্বাভাসে পারফরম্যান্স মূল্যায়নের জন্য ক্রস-বৈধকরণের ব্যবহার। পরিসংখ্যান এবং কম্পিউটিং, 10 (3), 209-2229।
কিম, জে.এইচ। (2009)। শ্রেণিবদ্ধকরণ ত্রুটির হার অনুমান করা: বারবার ক্রস-বৈধকরণ, বারবার হোল্ড-আউট এবং বুটস্ট্র্যাপ। গণনা সংক্রান্ত পরিসংখ্যান এবং ডেটা বিশ্লেষণ, 53 (11), 3735–3745। ডোই: 10,1016 / j.csda.2009.04.009
কোহাবী, আর। (1995)। সঠিকতা অনুমান এবং মডেল নির্বাচনের জন্য ক্রস-বৈধতা এবং বুটস্ট্র্যাপের একটি অধ্যয়ন। কৃত্রিম বুদ্ধিমত্তার উপর আন্তর্জাতিক যৌথ সম্মেলন, 14, 1137–1145।
মার্টিন, জে, এবং হিরসবার্গ, ডি। (1996)। শ্রেণিবিন্যাস ত্রুটির হারের জন্য ছোট নমুনার পরিসংখ্যান I: ত্রুটি হারের পরিমাপ।
মলিনারো, এএম (2005) পূর্বাভাস ত্রুটির অনুমান: পুনরায় মডেলিং পদ্ধতির একটি তুলনা। বায়োইনফরম্যাটিকস, 21 (15), 3301–3307। ডোই: 10,1093 / বায়োইনফরম্যাটিক্স / bti499
সৌরব্রেই, ডাব্লু। এবং শুমাচাআর 1, এম (2000)। ডেটা-চালিত রিগ্রেশন মডেলগুলির জটিলতা নির্ধারণের জন্য বুটস্ট্র্যাপ এবং ক্রস-বৈধকরণ। মেডিকেল ডেটা বিশ্লেষণ, 26-28।
তিবশিরানী, আরজে, এবং তিবশিরানী, আর। (২০০৯)। ক্রস-বৈধকরণের সর্বনিম্ন ত্রুটি হারের জন্য একটি পক্ষপাত সংশোধন। আরাক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 0908.2904।
@ ফ্র্যাঙ্ক হ্যারেল এই প্রশ্নটিতে অনেক কাজ করেছেন। আমি নির্দিষ্ট উল্লেখ জানি না।
তবে আমি বরং দুটি কৌশলকে বিভিন্ন উদ্দেশ্যে দেখছি। মডেলটির সিদ্ধান্ত নেওয়ার সময় ক্রস যাচাইকরণ একটি ভাল হাতিয়ার - এটি আপনাকে নিজের চেয়ে বেশি বুদ্ধি এড়াতে সহায়তা করে যে বাস্তবে আপনি বেশি মানা করার সময় আপনার একটি ভাল মডেল রয়েছে।
যখন আপনার মডেলটি স্থির হয়ে যায়, তারপরে বুটস্ট্র্যাপ ব্যবহার করা আরও বেশি অর্থবোধ করে (কমপক্ষে আমার কাছে)।
Http://www.burns-stat.com/pages/Tutor/bootstrap_resampling.html এ আর ব্যবহার করে এই ধারণাগুলির (আরও অনুমানের পরীক্ষাগুলি) একটি ভূমিকা রয়েছে
আমার বোধগম্যতা হল যে বুটস্ট্র্যাপিং আপনার মডেলের অনিশ্চয়তা পরিমাপ করার একটি উপায়, যখন ক্রড বৈধকরণ মডেল নির্বাচন এবং ভবিষ্যদ্বাণীক নির্ভুলতা পরিমাপের জন্য ব্যবহৃত হয়।
একটি পার্থক্য হ'ল জ্যাককেনিফের মতো ক্রস-বৈধকরণ আপনার সমস্ত ডেটা পয়েন্ট ব্যবহার করে, যেখানে বুটস্ট্র্যাপিং, যা আপনার ডেটা এলোমেলোভাবে প্রতিস্থাপন করে, সমস্ত পয়েন্টগুলিতে আঘাত না করে।
আপনি যতক্ষণ চান বুটস্ট্র্যাপ করতে পারেন, এর অর্থ একটি বৃহত আকারের নমুনা, যা ছোট নমুনাগুলিতে সহায়তা করবে।
ক্রস-বৈধকরণ বা জ্যাকনিফের গড় অর্থ নমুনা গড়ের মতোই হবে, তবে বুটস্ট্র্যাপের গড়ের নমুনা গড়ের মতো হওয়ার সম্ভাবনা খুব কম।
ক্রস-বৈধকরণ এবং জ্যাকনিফের ওজন হিসাবে সমস্ত নমুনা একইরূপে নির্দেশ করে, বুটস্ট্র্যাপের তুলনায় তাদের একটি ছোট (যদিও সম্ভবত ভুল) আস্থার ব্যবধান থাকতে হবে।
এগুলি পুনর্নির্মাণের দুটি কৌশল:
ক্রস বৈধকরণে আমরা ডেটা এলোমেলোভাবে কেফোল্ডে বিভক্ত করি এবং এটি ওভারফিটিংয়ে সহায়তা করে তবে এই পদ্ধতির এর অপূর্ণতা রয়েছে। এটি এলোমেলো নমুনা ব্যবহার করে তাই কিছু নমুনা বড় ত্রুটি তৈরি করে। সিভি কমানোর জন্য কৌশল রয়েছে তবে এটি শ্রেণিবিন্যাসের সমস্যাগুলির সাথে এতটা শক্তিশালী নয়। বুটস্ট্র্যাপ এটিকে সহায়তা করে, এটি নিজস্ব নমুনা চেক থেকে ত্রুটিটিকে উন্নত করে..বিস্তারিত জন্য দয়া করে উল্লেখ করুন ..
https://lagunita.stanford.edu/c4x/HumanitiesScience/StatLearning/asset/cv_boot.pdf