TLDR:
আমার ডেটাসেটটি বেশ ছোট (120) নমুনা। 10-গুণ ক্রস বৈধকরণ করার সময়, আমার উচিত:
প্রতিটি পরীক্ষার ভাঁজ থেকে আউটপুট সংগ্রহ করুন, সেগুলিকে একটি ভেক্টরের সাথে একত্রীকরণ করুন, এবং তারপরে পূর্বাভাসের এই পুরো ভেক্টরের (120 নমুনা) ত্রুটিটি গণনা করুন?
অথবা পরিবর্তে আমার প্রাপ্ত ফলাফলগুলিতে ত্রুটিটি গণনা করা উচিত প্রতিটি ভাঁজগুলিতে ( 12 টি নমুনা সহ) প্রাপ্ত এবং তারপরে 10 ভাঁজ ত্রুটির প্রাক্কলনের গড় হিসাবে আমার চূড়ান্ত ত্রুটি অনুমান করা উচিত?
এমন কোন বৈজ্ঞানিক কাগজপত্র রয়েছে যেগুলি এই কৌশলগুলির মধ্যে পার্থক্যকে তর্ক করে?
পটভূমি: মাল্টি-লেবেল শ্রেণিবিন্যাসে ম্যাক্রো / মাইক্রো স্কোরগুলির সাথে সম্ভাব্য সম্পর্ক:
আমি মনে করি এই প্রশ্নটি মাইক্রো এবং ম্যাক্রো গড়ের মধ্যে পার্থক্যের সাথে সম্পর্কিত হতে পারে যা প্রায়শই একটি বহু-লেবেল শ্রেণিবদ্ধকরণ কার্যে ব্যবহৃত হয় (যেমন 5 লেবেল বলুন)।
বহু-ট্যাগ সেটিং, মাইক্রো গড় স্কোর একটি করে নির্ণিত হয় রাশীকৃত 120 নমুনায় সমস্ত 5 শ্রেণিবদ্ধের পূর্বাভাসের জন্য সত্য ধনাত্মক, মিথ্যা ধনাত্মক, সত্য নেতিবাচক, মিথ্যা নেতিবাচক সংঘটন সারণী । এই কন্টিনজেন্সি টেবিলটি তখন মাইক্রো স্পষ্টতা, মাইক্রো রিকল এবং মাইক্রো এফ-পরিমাপের গণনা করতে ব্যবহৃত হয়। সুতরাং যখন আমাদের 120 টি নমুনা এবং পাঁচটি শ্রেণিবদ্ধ রয়েছে, তখন মাইক্রো ব্যবস্থা 600 অনুমান (120 নমুনা * 5 লেবেল) এর উপর ভিত্তি করে গণনা করা হয়।
ম্যাক্রো ভেরিয়েন্ট ব্যবহার করার সময় , প্রতিটি লেবেলে স্বতন্ত্রভাবে পরিমাপগুলি (যথার্থতা, প্রত্যাহার ইত্যাদি) গণনা করা হয় এবং শেষ পর্যন্ত, এই ব্যবস্থাগুলির গড় হয়।
মাইক্রো বনাম ম্যাক্রো অনুমানের মধ্যে পার্থক্যের পিছনে ধারণাটি বাইনারি শ্রেণিবদ্ধকরণ সমস্যায় কে-ফোল্ড সেটিংয়ে করা যেতে পারে to 10 ভাঁজ আমরা হয় পারেন গড় 10 মান ( ম্যাক্রো পরিমাপ) অথবা 10 পরীক্ষানিরীক্ষা কনক্যাটেনেট এবং গনা মাইক্রো ব্যবস্থা।
পটভূমি - প্রসারিত উদাহরণ:
নিম্নলিখিত উদাহরণটি প্রশ্নের চিত্র তুলে ধরেছে। ধরা যাক আমাদের 12 টি পরীক্ষার নমুনা রয়েছে এবং আমাদের 10 টি ভাঁজ রয়েছে:
- ভাঁজ 1 : টিপি = 4, এফপি = 0, টিএন = 8 যথার্থ = 1.0
- ভাঁজ 2 : টিপি = 4, এফপি = 0, টিএন = 8 যথার্থ = 1.0
- ভাঁজ 3 : টিপি = 4, এফপি = 0, টিএন = 8 যথার্থতা = 1.0
- ভাঁজ 4 : টিপি = 0, এফপি = 12, যথার্থ = 0
- ভাঁজ 5 .. ভাঁজ 10 : সবার একই টিপি = 0, এফপি = 12 এবং যথার্থ = 0 থাকে have
যেখানে আমি নিম্নলিখিত স্বরলিপি ব্যবহার করেছি:
সত্য ধনাত্মকগুলির টিপি = #, এফপি = # মিথ্যা ইতিবাচক, সত্য নেতিবাচকদের টিএন = #
ফলাফলগুলি হ'ল:
- 10 ভাঁজ = 3/10 = 0.3 এ জুড়ে গড় নির্ভুলতা
- 10 ভাঁজ = টিপি / টিপি + এফপি = 12/12 + 84 = 0.125 এর পূর্বাভাসের সংমিশ্রণের উপর যথার্থতা
নোট করুন যে 0.3 এবং 0.125 মানগুলি খুব আলাদা !