যখন একটি মডেল আন্ডারফিট করা হয়?


56

যুক্তি প্রায়শই বলে যে কোনও মডেলকে সজ্জিত করে, এটি সাধারণকরণের ক্ষমতা বাড়িয়ে তোলে। এটি বলেছিল, কোনও মডেলকে স্পষ্টভাবে উপস্থাপনের কারণে মডেলগুলির ডেটা জটিলতা নির্বিশেষে আরও খারাপ হয়ে যায়।

আপনি কীভাবে জানবেন যে যখন আপনার মডেলটি সঠিক ভারসাম্যকে আঘাত করেছে এবং এটি যে মডেলটির কাছে খোঁজ করছে সেই ডেটাটি উপযুক্ত নয়?


দ্রষ্টব্য: এটি আমার প্রশ্নের অনুসরণ, " ওভারফিটিং কেন খারাপ? "


আমার ধারণা আপনি বোঝাতে চেয়েছিলেন, " লজিক প্রায়শই বলে যে কোনও মডেলকে (অধিকতর) অধীনে এনে তার সাধারণকরণের ক্ষমতা বৃদ্ধি পায়। "
রুবেন্স

উত্তর:


43

কোনও মডেল আন্ডারফিটগুলি যখন এটি মডেল করার চেষ্টা করা হয় সেই ডেটার সাথে সম্মতিতে খুব সাধারণ।

এই ধরনের পরিস্থিতি সনাক্ত করার একটি উপায় হ'ল পক্ষপাত – বৈকল্পিক পদ্ধতির ব্যবহার , যা এটির মতো প্রতিনিধিত্ব করতে পারে:

এখানে চিত্র বর্ণনা লিখুন

আপনি যখন উচ্চ পক্ষপাতিত্ব করেন তখন আপনার মডেলটি সাফ হয়ে যায়।


আপনার অত্যধিক পক্ষপাত বা খুব বেশি বৈকল্পিক আছে কিনা তা জানতে, আপনি প্রশিক্ষণ এবং পরীক্ষার ত্রুটির ক্ষেত্রে ঘটনাটি দেখুন:

উচ্চ পক্ষপাত: এই শেখার বক্ররেখা প্রশিক্ষণ এবং পরীক্ষার উভয় সেটগুলিতেই উচ্চ ত্রুটি দেখায়, তাই অ্যালগরিদম উচ্চ পক্ষপাতের শিকার হচ্ছে:

এখানে চিত্র বর্ণনা লিখুন

উচ্চতর বৈকল্পিকতা: এই শেখার বক্ররেখা প্রশিক্ষণ এবং পরীক্ষা সেট ত্রুটির মধ্যে একটি বৃহত ব্যবধান দেখায়, তাই অ্যালগরিদম উচ্চ বৈকল্পিকতায় ভুগছে।

এখানে চিত্র বর্ণনা লিখুন

যদি একটি অ্যালগরিদম উচ্চ বৈকল্পিকতায় ভুগছে:

  • আরও তথ্য সম্ভবত সাহায্য করবে
  • অন্যথায় মডেল জটিলতা হ্রাস

যদি একটি অ্যালগরিদম উচ্চ পক্ষপাতের শিকার হয়:

  • মডেল জটিলতা বৃদ্ধি

আমি কর্সেরার মেশিন লার্নিং কোর্স , বিভাগ "10: মেশিন লার্নিং প্রয়োগের জন্য পরামর্শ" দেখার পরামর্শ দেব , যা থেকে আমি উপরের গ্রাফগুলি নিয়েছি।


আপনি শেষ বুলেট পয়েন্টে "মডেল জটিলতা হ্রাস" বলতে চান? আমি কেবল "মডেল জটিলতা বৃদ্ধি" বলে মনে করি। । । বিটিডব্লিউর ভাল সময় আমি সেই কোর্সে ভর্তি হয়েছি এবং আপনি কেবলমাত্র সেই ভিডিওটি দেখেছেন যা আপনি উল্লেখ করছেন।
নিল স্লটার

@ নীলস্ল্যাটার ধন্যবাদ, ভাল ক্যাচ, সত্যিই একটি টাইপ ছিল :) :)
ফ্রাঙ্ক ডারননকোর্ট

1
আপনি ধরে নিচ্ছেন যে প্রশিক্ষণের ত্রুটিটি পক্ষপাতিত্বের একটি শালীন অনুমান। পক্ষপাতিত্ব (এমএসই লোকসান ফাংশনের সাধারণ ক্ষেত্রে) আপনি নতুন ডেটাতে প্রত্যাশিত ত্রুটি হিসাবে সংজ্ঞায়িত হন , যখন আপনি সমস্ত বিভিন্ন প্রশিক্ষণের সেটগুলির উপরে আপনার ভবিষ্যদ্বাণী গড়েন । কী J_train (প্রশিক্ষণ সেট জুড়ে গড় না, এবং নতুন ডেটা ব্যবহার না করে) পক্ষপাতিত্বের একটি শালীন অনুমান করে?
সর্বাধিক

@ ফ্র্যাঙ্কডেরননকোর্ট আমরা কি পরীক্ষার তথ্য বনাম প্রশিক্ষণের আকারের সাথে ওভারফিটিং এবং আন্ডারফটিং যুক্ত করতে পারি? আমরা কী বলতে পারি যে মডেলটি ছোট প্রশিক্ষণ সেট অন্তর্বাসগুলির বিষয়ে প্রশিক্ষিত?
সুদীপ ভান্ডারী

10

আপনার প্রশ্নের উত্তর দেওয়ার জন্য আপনি যে রেফারেন্সটির সন্ধান করছেন তা বোঝা গুরুত্বপূর্ণ, আপনি যদি মডেল ফিটিংয়ে দার্শনিকভাবে অর্জন করতে চাইছেন তা সন্ধান করছেন, রুবেন্সের উত্তরটি দেখুন যে তিনি সেই প্রসঙ্গে ব্যাখ্যা করার জন্য একটি ভাল কাজ করেন।

তবে, অনুশীলনে আপনার প্রশ্নটি প্রায় পুরোপুরি ব্যবসায়ের উদ্দেশ্য দ্বারা সংজ্ঞায়িত।

একটি দৃ concrete় উদাহরণ দেওয়ার জন্য বলি যে আপনি একজন loanণ কর্মকর্তা, আপনি loansণ প্রদান করেছেন যা , 000 3,000 এবং লোকে আপনাকে যখন ফিরিয়ে দেয় আপনি 50 ডলার করে দেন। স্বাভাবিকভাবেই আপনি এমন একটি মডেল তৈরির চেষ্টা করছেন যা কোনও ব্যক্তির ডিফল্ট হলে কীভাবে তার পূর্বাভাস দেয় ঋণ। এটি সহজ রাখতে দিন এবং বলুন যে ফলাফলগুলি সম্পূর্ণ অর্থ প্রদান, বা ডিফল্ট।

ব্যবসায়ের দৃষ্টিকোণ থেকে আপনি একটি आकस्मिक ম্যাট্রিক্সের সাথে মডেলগুলির পারফরম্যান্স যোগ করতে পারেন:

এখানে চিত্র বর্ণনা লিখুন

যখন মডেলটি পূর্বাভাস দেয় যে কেউ ডিফল্ট হতে চলেছে, তারা কি করবে? ফিটিংয়ের ওপরে চলাচলের দিকটি নির্ধারণ করার জন্য আমি এটি একটি অপ্টিমাইজেশান সমস্যা হিসাবে ভাবতে সাহায্যকারী বলে মনে করি কারণ ভবিষ্যদ্বাণীিত শ্লোকগুলির প্রতিটি ক্রস বিভাগে প্রকৃত মডেলের কার্য সম্পাদন করতে হয়:

এখানে চিত্র বর্ণনা লিখুন

এই উদাহরণে একটি ডিফল্ট হিসাবে পূর্বাভাস দেওয়া যে কোনও ডিফল্ট মানে কোনও ঝুঁকি এড়ানো, এবং এমন একটি নন-ডিফল্ট পূর্বাভাস দেওয়া হয় যা ডিফল্ট হয় না যা প্রদত্ত .ণ প্রতি 50 ডলার করে দেবে । কোথায় জিনিষ অনির্ভরযোগ্য, যদি আপনি ডিফল্ট যখন আপনি অ ডিফল্টভাবে যখন আপনি সমগ্র ঋণ প্রধান হারান এবং আপনি যদি ডিফল্ট ভবিষ্যদ্বাণী করা একটি গ্রাহক আসলে আপনি ভোগা হতো না যখন পূর্বাভাস হয়, যখন আপনি ভুল $ মিস সুযোগের 50। এখানে সংখ্যাগুলি গুরুত্বপূর্ণ নয়, কেবলমাত্র পদ্ধতির।

এই কাঠামোর সাহায্যে আমরা এখন ওভারের ও ফিটিংয়ের সাথে সম্পর্কিত জটিলতাগুলি বুঝতে শুরু করতে পারি।

এই ক্ষেত্রে ওভার ফিট করার অর্থ হ'ল আপনার মডেল আপনার বিকাশ / পরীক্ষার ডেটা সম্পর্কে আরও ভাল কাজ করে তবে এটি উত্পাদন করে। বা অন্যভাবে বলতে গেলে, উত্পাদনের ক্ষেত্রে আপনার মডেলটি আপনি বিকাশে যা দেখেছেন তার তুলনায় আরও কম দক্ষতার পরিচয় দেবে, এই ভ্রান্ত আত্মবিশ্বাস সম্ভবত আপনাকে আরও বেশি ঝুঁকিপূর্ণ loansণ নেওয়ার কারণ হতে পারে তবে অন্যথায় আপনি অর্থ হারাতে খুব দূর্বল হয়ে পড়বেন।

অন্যদিকে, এই প্রসঙ্গে উপযুক্ততার অধীনে আপনাকে এমন একটি মডেল ছেড়ে দেবে যা বাস্তবের সাথে মিলে যাওয়ার ক্ষেত্রে খারাপ কাজ করে does যদিও এর ফলাফলগুলি বুনোভাবে অপ্রত্যাশিত হতে পারে, (বিপরীত শব্দটি আপনি আপনার ভবিষ্যদ্বাণীপূর্ণ মডেলগুলি বর্ণনা করতে চান), সাধারণত যা হয় তা মানদণ্ডগুলি আরও কঠোর করা হয়, কম সামগ্রিক গ্রাহকরা হ'ল ভাল গ্রাহকদের দিকে পরিচালিত করে।

আন্ডার ফিটিং এক ধরণের বিপরীত অসুবিধায় ভুগছে যা ওভার ফিটিংই করে যা ফিটিংয়ের আওতায় আসে যা আপনাকে কম আত্মবিশ্বাস দেয়। অন্তর্নিহিতভাবে, পূর্বাভাসের অভাব এখনও আপনাকে অপ্রত্যাশিত ঝুঁকি নিতে পরিচালিত করে, এগুলি সবই খারাপ সংবাদ।

আমার অভিজ্ঞতা হিসাবে এই পরিস্থিতি দুটি এড়ানোর সর্বোত্তম উপায়টি হ'ল আপনার মডেলটিকে আপনার প্রশিক্ষণের ডেটার আওতার বাইরে থাকা ডেটাতে আপনার মডেলটিকে বৈধতা দেওয়া, যাতে আপনার কিছুটা আত্মবিশ্বাস থাকতে পারে যে আপনি বন্যের মধ্যে কী দেখবেন তার একটি প্রতিনিধি নমুনা রয়েছে '।

অতিরিক্তভাবে, আপনার মডেলটি কত দ্রুত অবনতি হয় এবং এটি যদি এখনও আপনার উদ্দেশ্যগুলি সম্পাদন করে চলেছে তা নির্ধারণ করার জন্য পর্যায়ক্রমে আপনার মডেলগুলি পুনরায় বৈজ্ঞানিককরণ করা একটি ভাল অনুশীলন।

কিছু বিষয় পর্যন্ত, যখন আপনার বিকাশ এবং উত্পাদনের ডেটা উভয়ই ভবিষ্যদ্বাণী করার একটি দুর্বল কাজ করে তখন আপনার মডেলটি ফিট হয়ে যায়।


6

মডেলগুলি কিন্তু বাস্তব জীবনে যা দেখা যায় তার বিমূর্ততা। পছন্দসই বিশ্লেষণকে সমর্থন করার জন্য পর্যাপ্ত তথ্য রাখার সময় এগুলি পর্যবেক্ষণে বাস্তব সিস্টেমের বিমূর্ততা থেকে দূরে সরে যাওয়ার জন্য ডিজাইন করা হয়েছে।

কোনও মডেল যদি অতিমাত্রায় সাফ হয় তবে এটি কী পর্যবেক্ষণ করা হচ্ছে সে সম্পর্কে অনেকগুলি বিবরণ বিবেচনা করে এবং এ জাতীয় অবজেক্টে ছোট পরিবর্তনগুলি মডেলকে যথাযথতা হারাতে পারে। অন্যদিকে, কোনও মডেল যদি অন্তর্নির্মিত হয় তবে এটি এতগুলি অল্প বৈশিষ্ট্যকে মূল্যায়ন করে যে বস্তুর উল্লেখযোগ্য পরিবর্তনগুলি উপেক্ষা করা যেতে পারে।

এটিও নোট করুন যে ডেটাসেটের উপর নির্ভর করে আন্ডারফিটকে একটি ওভারফিট হিসাবে দেখা যেতে পারে । যদি আপনার ইনপুটটি একক বৈশিষ্ট্যের সাথে 99% -র সঠিকভাবে শ্রেণিবদ্ধ করা যেতে পারে, তবে আপনি বিমূর্ততাটিকে একক বৈশিষ্ট্যের সাথে সহজ করে ডেটাতে মডেলটিকে উপস্থাপন করেন। এবং, এক্ষেত্রে আপনি বেসের 1 %কে 99%-শ্রেণীর মধ্যে খুব বেশি জেনারালাইজড করে তুলবেন - বা মডেলটিকে এত বেশি নির্দিষ্ট করে দিচ্ছেন যে এটি কেবল একটি শ্রেণি দেখতে পারে ।

যুক্তিযুক্ত উপায় যে কোনও মডেল শেষ হয় না বা আন্ডারফিটটি ক্রস-বৈধতা সম্পাদন করে না। আপনি আপনার ডেটাসেটকে কে অংশে বিভক্ত করেছেন এবং বলছেন, আপনার বিশ্লেষণ সম্পাদন করতে তাদের মধ্যে একটি বেছে নিন, অন্য মডেলটিকে প্রশিক্ষণের জন্য অন্য কে - 1 অংশ ব্যবহার করার সময় । ইনপুট নিজেই পক্ষপাতদুষ্ট নয় বিবেচনা করে, বাস্তব জীবনের প্রক্রিয়াকরণে মডেলটি ব্যবহার করার সময় আপনার কাছে যতটা তথ্য ট্রেনিং এবং মূল্যায়ন করতে হবে তার उतুল বৈচিত্র থাকতে সক্ষম হবেন।


5

সহজভাবে, একটি সাধারণ পদ্ধতি হ'ল মডেলের জটিলতা বৃদ্ধি করা, এটি সহজ করে দেওয়া এবং সম্ভবত প্রথমে উপকার করা এবং ওভারফিটিংয়ের প্রাথমিক লক্ষণগুলি ক্রস বৈধকরণ, বুটস্ট্র্যাপের মতো পুনর্নির্মাণের প্রযুক্তি ব্যবহার না করা অবধি মডেলটির জটিলতা বৃদ্ধি করা, প্রভৃতি

আপনি আপনার মডেলটিতে প্যারামিটারগুলি (কৃত্রিম নিউরাল নেটওয়ার্কগুলির জন্য লুকানো নিউরনের সংখ্যা, একটি এলোমেলো বনের গাছের সংখ্যা) যোগ করে বা আপনার মডেলটিতে নিয়মিতকরণ (প্রায়শই ল্যাম্বডা, বা সমর্থন ভেক্টর মেশিনের জন্য সি) শব্দটি শিথিল করে জটিলতা বাড়িয়ে তোলেন।


3

ফিনান্সে সিএপিএম (মূলধন সম্পদ মূল্য নির্ধারণের মডেল) একটি আন্ডারফিট মডেলের একটি সর্বোত্তম উদাহরণ। এটি সুন্দর তত্ত্বে নির্মিত হয়েছিল যে "বিনিয়োগকারীরা কেবল ঝুঁকির জন্য অর্থ প্রদান করে যে তারা বৈচিত্র্য আনতে পারে না" তাই প্রত্যাশিত অতিরিক্ত আয়গুলি বাজারের রিটার্নের সাথে সম্পর্কের সমান।

সূত্র হিসাবে [0] রা = আরএফ + বি (আরএম - আরএফ) যেখানে রা সম্পদের প্রত্যাশিত প্রত্যাশা, আরএফ হ'ল ঝুঁকি মুক্ত হার, আরএম হ'ল বাজারের হার, এবং বিটা হল ইক্যুইটি প্রিমিয়ামের সাথে সম্পর্কিত (আরএম - আরএফ)

এটি সুন্দর, মার্জিত এবং ভুল। বিনিয়োগকারীদের মনে হয় ছোট স্টক এবং মূল্য (বই দ্বারা বাজারে নির্ধারিত বা লভ্যাংশের ফলন) স্টকের উচ্চতর হার প্রয়োজন।

ফামা এবং ফরাসী [1] মডেলটির কাছে একটি আপডেট উপস্থাপন করেছে, যা আকার এবং মানের জন্য অতিরিক্ত বিটাস যুক্ত করে।

তাহলে সাধারণ অর্থে আপনি কীভাবে জানেন? যখন আপনি যে ভবিষ্যদ্বাণী করছেন সেগুলি ভুল হয় এবং যৌক্তিক ব্যাখ্যা সহ অন্য পরিবর্তনশীল ভবিষ্যদ্বাণীটির গুণমানকে বাড়িয়ে তোলে। কেউ বুঝতে পারে যে কেন ছোট স্টকগুলি ঝুঁকিপূর্ণ, অ-বৈচিত্র্যযোগ্য ঝুঁকির চেয়ে আলাদা। এটি একটি ভাল গল্প, ডেটা সমর্থিত।

[0] http://www.investopedia.com/terms/c/capm.asp [1] http://en.wikedia.org/wiki/Fama%E2%80%93 ফ্রেঞ্চ_থ্রি- ফ্যাক্টর_মডেল

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.