কে-ফোল্ড ক্রস-বৈধতা থেকে কনফিউশন ম্যাট্রিক্স কীভাবে প্রতিবেদন করা হয়েছে?


18

ধরুন আমি কে = 10 ভাঁজ সহ কে-ফোল্ড ক্রস-বৈধকরণ করছি। প্রতিটি ভাড়ার জন্য একটি বিভ্রান্তির ম্যাট্রিক্স থাকবে। ফলাফলগুলি প্রতিবেদন করার সময়, আমি কি গণনা করা উচিত যে গড় বিভ্রান্তির ম্যাট্রিক্স, বা কেবল বিভ্রান্তির ম্যাট্রিক্সের যোগফলটি করব?

উত্তর:


11

আপনি যদি কোনও মডেলের পারফরম্যান্স পরীক্ষা করে থাকেন (অর্থাত্ প্যারামিটারগুলি অপ্টিমাইজ করবেন না), তবে সাধারণত আপনি বিভ্রান্তির ম্যাট্রিকগুলি যোগ করতে পারেন। এটি এরকমভাবে ভাবুন, আপনি 10 টি আলাদা ভাঁজ বা 'পরীক্ষা' সেটগুলিতে ডেটা ভাগ করেছেন split আপনি ভাঁজগুলির 9-10 তে আপনার মডেলটিকে প্রশিক্ষণ দিন এবং প্রথম ভাঁজটি পরীক্ষা করুন এবং একটি বিভ্রান্তির ম্যাট্রিক্স পান। এই বিভ্রান্তির ম্যাট্রিক্স ডেটা 1-10 এর শ্রেণিবিন্যাস উপস্থাপন করে। আপনি পরবর্তী 'পরীক্ষা' সেটটি দিয়ে বিশ্লেষণটি আবার পুনরাবৃত্তি করুন এবং আরও একটি 1/10 তথ্য উপস্থাপন করে অন্য একটি বিভ্রান্তির ম্যাট্রিক্স পান। প্রথমটিতে এই নতুন বিভ্রান্তির ম্যাট্রিক্স যুক্ত করা এখন আপনার ডেটার 20% উপস্থাপন করে। আপনি যতক্ষণ না আপনার সমস্ত ভাঁজগুলি চালনা করেন, আপনার সমস্ত বিভ্রান্তির ম্যাট্রিক্স যোগ করেন এবং চূড়ান্ত বিভ্রান্তির ম্যাট্রিক্স সমস্ত তথ্যের জন্য সেই মডেলের কার্যকারিতা উপস্থাপন করে। আপনি বিভ্রান্তির ম্যাট্রিকগুলি গড় গড়তে পারেন তবে এটি প্রকৃতসংখ্যক ম্যাট্রিক্স থেকে কোনও অতিরিক্ত তথ্য সরবরাহ করে না এবং যদি আপনার ভাঁজগুলি একই আকার না হয় তবে পক্ষপাতদুষ্ট হতে পারে।

দ্রষ্টব্য - এটি আপনার ডেটা পুনরাবৃত্তি নমুনা ধরে। আমি বারবার স্যাম্পলিংয়ের জন্য এটি আলাদা হবে কিনা তা আমি সম্পূর্ণ নিশ্চিত নই। আমি কিছু শিখি বা কেউ কোনও পদ্ধতির প্রস্তাব দিলে আপডেট হবে।


ধন্যবাদ সিডিটারম্যান। মডেল নির্বাচন (টিউনিং প্যারামিটারগুলি উন্নত করা) সম্পর্কে কী?
জন এম

@ জোহানএম তখন সম্পূর্ণ মডেলের সেরা পরামিতিগুলি কী হবে তার একটি ইঙ্গিত পেতে আপনি প্রতিটি ভাঁজকে স্বতন্ত্রভাবে দেখছেন। আপনি উভয় একত্রিত করতে চাইলে আপনি নেস্টেড সিভিতে সন্ধান করতে পারেন।
সিডেটারম্যান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.