কীভাবে জানবেন যে এসভিএম মডেল থেকে একটি শেখার কার্ভ পক্ষপাত বা বৈকল্পিকতায় ভুগছে?


12

আমি এই শেখার বক্ররেখা তৈরি করেছি এবং আমি জানতে চাই যে আমার এসভিএম মডেল পক্ষপাত বা ভেরিয়েন্সে ভুগছে কিনা? এই গ্রাফ থেকে আমি কীভাবে এই উপসংহারটি আনতে পারি?

শিখার কিউভ


এখানে একটি লিঙ্ক এখানে আপনি বিশদটি
ডেটাউকোয়েস্ট.আইও /

উত্তর:


13

পর্ব 1: শেখার বক্ররেখা কীভাবে পড়বেন

প্রথমত, আমাদের প্লটের ডান দিকে মনোনিবেশ করা উচিত, যেখানে মূল্যায়নের জন্য পর্যাপ্ত পরিমাণে ডেটা রয়েছে।

  • যদি দুটি বক্ররেখা "একে অপরের কাছাকাছি" থাকে এবং উভয়ই তবে কম স্কোর থাকে। মডেলটি একটি আন্ডার ফিটিং সমস্যায় ভুগছেন (হাই বায়াস)

  • প্রশিক্ষণ বক্রের যদি আরও ভাল স্কোর থাকে তবে পরীক্ষার বক্ররেখার কম স্কোর থাকে, অর্থাৎ, দুটি বক্ররেখাগুলির মধ্যে বড় ব্যবধান রয়েছে। তারপরে মডেল একটি ওভার ফিটনেস সমস্যায় ভুগছেন (উচ্চ ভেরিয়েন্স)

পার্ট 2: আপনার সরবরাহিত প্লটের জন্য আমার মূল্যায়ন

প্লটটি থেকে মডেলটি ভাল কিনা তা বলা শক্ত। এটি সম্ভব যে আপনার সত্যিই "সহজ সমস্যা" রয়েছে, একটি ভাল মডেল 90% অর্জন করতে পারে। অন্যদিকে, এটি আপনার পক্ষে সম্ভবত একটি "কঠিন সমস্যা" রয়েছে যা আমরা করতে পারি সেরা কাজটি হ'ল 70% অর্জন করা। (দ্রষ্টব্য, আপনি আশা করতে পারেন না যে আপনি একটি নিখুঁত মডেল পাবেন, স্কোর বলুন 1। আপনি কতটা অর্জন করতে পারবেন তা আপনার ডেটাতে কতটা গোলমাল নির্ভর করে তার উপর নির্ভর করে ose মনে করুন আপনার ডেটাতে প্রচুর ডেটা পয়েন্ট রয়েছে ঠিক বৈশিষ্ট্য রয়েছে তবে বিভিন্ন লেবেল রয়েছে, আপনি যা করুক না কেন, আপনি স্কোরের উপর 1 অর্জন করতে পারবেন না))

আপনার উদাহরণের আরেকটি সমস্যা হ'ল বাস্তব জগতে প্রয়োগের ক্ষেত্রে 350 টি উদাহরণ খুব ছোট বলে মনে হচ্ছে।

পার্ট 3: আরও পরামর্শ

আরও ভাল বোঝার জন্য আপনি ওভার ফিটিংয়ের অধীনে অভিজ্ঞতার জন্য নিম্নলিখিত পরীক্ষা-নিরীক্ষা করতে পারেন এবং শেখার বক্ররেখায় কী ঘটবে তা পর্যবেক্ষণ করতে পারেন।

  • এমএনআইএসটি ডেটা বলার জন্য একটি খুব জটিল ডেটা নির্বাচন করুন এবং একটি সাধারণ মডেলের সাথে মানানসই, একটি বৈশিষ্ট্য সহ রৈখিক মডেল বলুন।

  • একটি সাধারণ ডেটা নির্বাচন করুন, আইরিস ডেটা বলুন, কোনও জটিলতার মডেলের সাথে মানানসই, বলুন, এসভিএম।


অংশ 4: অন্যান্য উদাহরণ

এছাড়াও, আমি আন্ডার ফিটিং এবং ওভার ফিটিং সম্পর্কিত দুটি উদাহরণ দেব। নোট করুন এটি বক্রতা শিখছে না, তবে গ্রেডিয়েন্ট বুস্টিং মডেলটিতে পুনরাবৃত্তির সংখ্যার ক্ষেত্রে পারফরম্যান্সের প্রতি শ্রদ্ধা রয়েছে যেখানে আরও পুনরাবৃত্তির ক্ষেত্রে বেশি ফিট করার সম্ভাবনা থাকবে। এক্স অক্ষটি পুনরাবৃত্তির সংখ্যা দেখায়, এবং y অক্ষগুলি কার্যকারিতা দেখায়, যা আরওসি-র আওতাধীন Areaণাত্মক অঞ্চল (কম ভাল the

বাম সাবপ্ল্লট ওভার ফিটিংয়ে ভুগছে না (পারফরম্যান্স যুক্তিসঙ্গতভাবে ভাল হওয়ায় ফিটিংয়ের অধীনেও নয়) তবে পুনরাবৃত্তির সংখ্যা যখন বড় হয় তখন ডানদিকে ওভার ফিটিং থেকে ভোগা হয়।

এখানে চিত্র বর্ণনা লিখুন


আপনাকে ধন্যবাদ hxd1011! আমি যদি বলি যে আমার মডেলটি কিছুটা ভিন্নতা এবং কিছুটা পক্ষপাতদুষ্টায় ভুগছে (যেহেতু স্কোর 1 নয়)?
আফকে

@ পেপি আমার মনে হয় আপনার মডেলটি ভাল ... স্কোরের ৮০% খারাপ নয় এবং দুটি বক্ররেখা কাছাকাছি রয়েছে। একমাত্র সমস্যাটি উদাহরণগুলি 350 পর্যন্ত রয়েছে যা বাস্তব বিশ্বের অ্যাপ্লিকেশনটিতে খুব কম হতে পারে।
হাইতাও ডু

@ পেপি এছাড়াও, আপনি আশা করতে পারেন না যে আপনি একটি নিখুঁত মডেল পাবেন, বলুন স্কোর ১ টি। আপনি কতটা অর্জন করতে পারবেন তা আপনার ডেটাতে কত আওয়াজ দেয় তার উপর নির্ভর করে। মনে করুন আপনার ডেটাতে প্রচুর ডেটা পয়েন্ট রয়েছে ঠিক বৈশিষ্ট্য কিন্তু বিভিন্ন লেবেল, আপনি যা করেন না কেন, আপনি স্কোরটিতে 1 অর্জন করতে পারবেন না।
হাইতাও ডু

11
আমি মনে করি তার "80% স্কোর খারাপ নয়" বিষয়গুলি সম্পর্কে ভাবার পক্ষে ভাল উপায় নয়। কোনও বিশ্বব্যাপী স্কোর নেই যা ভাল, এটি প্রক্রিয়াটিতে শব্দের অনুপাতের সংকেত এবং উপলভ্য যে ডেটা উপলব্ধ রয়েছে তার উপর নির্ভর করে সমস্যাটি যে খুব বেশি সমাধান করা হচ্ছে তার উপর নির্ভর করে। আপনি আপনার উত্তরে এটি উল্লেখ করেছেন, তাই আমি "খারাপ নয়" মন্তব্যটি সরিয়ে ফেলব।
ম্যাথু ড্রুরি

1
@ ম্যাথেজড্রুরি পরামর্শের জন্য ধন্যবাদ, উত্তর সংশোধিত!
হাইতাও ডু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.