আমি সম্প্রতি এই কাগজপত্রগুলিতে বর্ণিত পেরিটো স্মুথড ইম্পেরিয়াল স্যাম্পলিং লেভ-ওয়ান-আউট ক্রস-বৈধকরণ (পিএসআইএস-এলইউ) ব্যবহার শুরু করেছি:
- Vehtari, এ।, এবং জেলম্যান, এ (2015)। পেরেটো গুরুত্বের নমুনা ছোঁয়া। আরএক্সিব প্রিপ্রিন্ট ( লিঙ্ক )
- Vehtari, এ।, জেলম্যান, এ।, এবং গ্যাব্রি, জে। (2016)। লেভেল-ওয়ান-আউট ক্রস-বৈধকরণ এবং ডব্লিউএআইসি ব্যবহার করে ব্যবহারিক বায়েসিয়ান মডেল মূল্যায়ন। আরএক্সিব প্রিপ্রিন্ট ( লিঙ্ক )
এটি নমুনা ছাড়াই মডেল মূল্যায়নের জন্য অত্যন্ত প্ররোচিত পদ্ধতির প্রতিনিধিত্ব করে কারণ এটি একটি একক এমসিসিএম রান দিয়ে এলইউ-সিভি সম্পাদন করতে দেয় এবং এটি ডব্লিউএআইসি-র মতো বিদ্যমান তথ্যের মানদণ্ডের তুলনায় আরও ভাল।
পিএসআইএস-এলইওর একটি নির্ণয়ের রয়েছে যা আপনাকে জানাতে পারে যে অনুমান নির্ভরযোগ্য কিনা, অর্থাত্ পেরিটো বিতরণগুলির i দ্বারা দেওয়া হয় গুরুত্বের ওজনের দৈর্ঘ্যের অভিজ্ঞতা অভিজ্ঞতাগুলির লেজগুলিতে লাগানো (ডাটা পয়েন্টে এক ওজন)। সংক্ষেপে, যদি একটি আনুমানিক ওজন , খারাপ জিনিসগুলি ঘটতে পারে।
দুঃখের সাথে, আমি আবিষ্কার করেছি যে আমার এই পদ্ধতির প্রয়োগটিতে আমার সমস্যার জন্য, বেশিরভাগ মডেলের আগ্রহের জন্য আমি দেখতে পাই যে \ টুপি {কে} _ আই i জিজি 0.7 এর একটি বৃহত ভগ্নাংশ । আশ্চর্যজনকভাবে, কিছু এলইও-র লগ-সম্ভাবনা যথেষ্ট স্পষ্টতই অযৌক্তিক ছিল (অন্যান্য ডেটাসেটের তুলনায়)। ডাবল-চেক হিসাবে, আমি একটি traditionalতিহ্যবাহী (এবং সময় সাশ্রয়ী) 10-গুণ ক্রস-বৈধতা সম্পাদন করে দেখলাম যে প্রকৃতপক্ষে PSIS-LOO ভীষণভাবে ভুল ফলাফল দিচ্ছিল (উলটে, ফলাফলগুলি 10 এর সাথে খুব ভাল চুক্তিতে ছিল) - মডেলগুলির জন্য ফোল্ডার সিভি যা সমস্ত )। রেকর্ডের জন্য, আমি আকি Vetari দ্বারা PSIS-LOO এর ম্যাটল্যাব বাস্তবায়নটি ব্যবহার করছি ।
সম্ভবত আমি আমার খুব দুর্ভাগ্য যে আমার বর্তমান এবং প্রথম যে সমস্যাটিতে আমি এই পদ্ধতিটি প্রয়োগ করি তা পিএসআইএস-এলইউর পক্ষে "কঠিন" তবে আমি সন্দেহ করি যে এই ক্ষেত্রেটি তুলনামূলকভাবে সাধারণ হতে পারে। খনি হিসাবে যেমন ক্ষেত্রে, Vehtary, Gelman এবং গ্যাব্রি কাগজ সহজভাবে বলে:
পিএসআইএসের অনুমানের সীমাবদ্ধ বৈকল্পিকতা থাকলেও, যখন তবে ব্যবহারকারীকে সমস্যাযুক্ত জন্য সরাসরি থেকে নমুনা বিবেচনা করা উচিত , ফোল্ড ক্রস- বৈধকরণ, বা আরও শক্তিশালী মডেল ব্যবহার করুন।
এগুলি সুস্পষ্ট তবে সত্যিই আদর্শ সমাধান নয় কারণ এগুলি সর্বদা গ্রাস করা হয় বা অতিরিক্ত ফিডিংয়ের প্রয়োজন হয় (আমি প্রশংসা করি যে এমসিএমসি এবং মডেল মূল্যায়নগুলি হ'ল ফিডলিংয়ের বিষয়ে, তবে আরও কম ভাল)।
PSIS-LOO কে ব্যর্থ হতে বাধা দেওয়ার জন্য আমরা আগে থেকে প্রয়োগ করতে পারি এমন কোনও সাধারণ পদ্ধতি কি ? আমার কয়েকটি অস্থায়ী ধারণা রয়েছে, তবে আমি অবাক হয়েছি যে ইতিমধ্যে যদি লোকেরা গ্রহণ করে চলেছে এমন একটি অভিজ্ঞতামূলক সমাধান রয়েছে।