কোনও গাউসিয়ান প্রক্রিয়া অত্যধিক মানানসই কিনা তা আপনি কীভাবে সনাক্ত করতে পারেন?


12

আমি ক্রস-বৈধতার পরিবর্তে ডেটার প্রান্তিক স্বাচ্ছন্দ্যকে সর্বোচ্চ করে প্যারামিটারগুলির সাথে একটি এআরডি কার্নেল দিয়ে গাউসিয়ান প্রক্রিয়াটি প্রশিক্ষণ দিচ্ছি।

আমি সন্দেহ করি যে এটি অত্যধিক মানানসই। আমি কীভাবে এই সন্দেহটিকে বায়েশীয় প্রসঙ্গে পরীক্ষা করতে পারি?

উত্তর:


12

সবচেয়ে সহজ কাজটি হ'ল নন-এআরডি সমতুল্য কোভারিয়েন্স ফাংশন (সাধারণত আরবিএফ) দিয়ে কোনও গাউসীয় প্রক্রিয়া ফিট করা এবং পরীক্ষার ত্রুটির হারের তুলনা করা। হাইপার-প্যারামিটারগুলি সুর করার ক্ষেত্রে অতিরিক্ত-ফিট করার কারণে অনেক সমস্যার জন্য একটি এআরডি কোভেরিয়েন্স ফাংশন একটি নন-এআরডি কোভারিয়েন্স ফাংশনের চেয়ে খারাপ সম্পাদন করে । যেহেতু আরবিএফ কোভেরিয়েন্স এআরডি কোভেরিয়েন্সের একটি বিশেষ কেস, আরবিএফ আরও ভাল পারফরম্যান্স করে, এটি দৃ a় ইঙ্গিত দেয় যে এআরডি কার্নেল অতিরিক্ত-ফিট করে (এটি সম্পর্কিত আরবিএফ কোভেরিয়েন্সের জন্য অনুকূল মানগুলিতে এআরডি সহগকে অনুকূলকরণ শুরু করুন, এটি হল দ্রুত এবং এটিও নিশ্চিত করতে সহায়তা করে যে এআরডি কোভেরিয়েন্সের সমস্যাটি কেবল প্রান্তিক সম্ভাবনার স্থানীয় মিনিমার কারণে নয়)। এটি সাধারণত প্রশংসিত হওয়ার চেয়ে অনেক বড় সমস্যা।

আমি এ সম্পর্কে কয়েকটি কাগজ লিখেছি:

জিসি কাওলি এবং এনএলসি টালবট, হাইপার-প্যারামিটারগুলিকে নিয়মিতকরণের মাধ্যমে বায়সিয়ান নিয়মিতকরণের মাধ্যমে মডেল নির্বাচনের সময় অতিরিক্ত-ফিটিং প্রতিরোধ করা, মেশিন লার্নিং রিসার্চ জার্নাল, খণ্ড 8, পৃষ্ঠা 841-861, এপ্রিল 2007 ( পিডিএফ )

এবং

জিসি কাওলি এবং এনএলসি টালবট, মডেল নির্বাচনের ওভার-ফিটিং এবং পারফরম্যান্স মূল্যায়নে পরবর্তী নির্বাচনের পক্ষপাত, মেশিন লার্নিং রিসার্চ জার্নাল, ২০১০। গবেষণা, খন্ড 11, পৃষ্ঠা 2079-2107, জুলাই 2010 ( পিডিএফ )

প্রথমটিতে জিপি সহ কিছু পরীক্ষা-নিরীক্ষা অন্তর্ভুক্ত রয়েছে, যা দেখায় যে মডেল নির্বাচনের ক্ষেত্রে ওভার-ফিটিং প্রান্তিক সম্ভাবনা সর্বাধিকীকরণ ভিত্তিক মডেল নির্বাচনের সাথে জিপিদেরও একটি সমস্যা।

প্রান্তিক সম্ভাবনা অনুকূলকরণের প্রক্রিয়ায় প্রতিটি পদক্ষেপে জিপি পরীক্ষার ত্রুটির মূল্যায়ন করা আরও বিশদ বিশ্লেষণ হবে। এটি অত্যন্ত সম্ভবত যে আপনি ওভার-ফিটিংয়ের ক্লাসিক হলের চিহ্ন পাবেন, যেখানে মডেল নির্বাচনের মানদণ্ড একঘেয়েভাবে হ্রাস পাচ্ছে, তবে পরীক্ষার ত্রুটিটি প্রাথমিকভাবে হ্রাস পেয়েছে, তবে মডেল নির্বাচনের মানদণ্ডটি ওভার-অপ্টিমাইজড হওয়ার কারণে আবার উত্থিত হওয়া শুরু হয় (সিএফ ২০১০ জেএমএলআর কাগজে চিত্র 2 এ)।


দুর্দান্ত ধন্যবাদ - আমি এখন প্রথমটি পড়ছি। প্রান্তিক সম্ভাবনায় মডেল জটিলতা শব্দটি ওভারফিটিং প্রতিরোধের পক্ষে যথেষ্ট না হলে আপনি কি আবার এআরডি-র মতো অনেকগুলি পরামিতিগুলি দিয়ে কার্নেলগুলি দিয়ে ওভার-ফিটিং নিয়মিত করার আরও কার্যকর উপায়টি পেরিয়ে এসেছেন?
নিকপনলাইন

2
আমি সন্দেহ করি যে সবচেয়ে শক্তিশালী কাজ হ'ল মার্কভ চেইন মন্টি কার্লো পদ্ধতি ব্যবহার করে হাইপার-প্যারামিটারগুলির চেয়ে প্রান্তিককরণ করা। জিপি-র যে আকারের ডেটাসেট ব্যবহার করা হয় তার জন্য (কয়েক হাজার প্যাটার্ন পর্যন্ত) আমার মনে হয় যে প্রান্তিক সম্ভাবনা বেশি লাগানো অবশ্যম্ভাবী all আইএমএইচও অপ্টিমাইজেশন হ'ল পরিসংখ্যানগুলিতে সমস্ত অশুভের মূলে, যখনই আপনি কোনও জিনিসকে অপ্টিমাইজ করেন যখন অতিরিক্ত ওজনের ফিটনেসের ঝুঁকি রয়েছে। বায়েশিয়ানদের দৃষ্টিভঙ্গি সেই দিক থেকে অনেক ভাল, তবে আপনি তার পরিবর্তে অসুবিধাগুলির ঝুঁকি চালাচ্ছেন কারণ
প্রিরিয়াররা

@ ডিক্রানমারসুপিয়াল কীভাবে ভেরিয়েশনাল জিপি পদ্ধতি ব্যবহার করে অতিরিক্ত পোশাক এড়ানো যায় সে সম্পর্কে কোনও সর্বশেষ গবেষণা রয়েছে?
imsrgadich
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.