বায়েশিয়ান মডেলগুলিতে ক্রস-বৈধকরণের স্থায়িত্ব


19

আমি কে-ফোল্ড ক্রস-বৈধকরণ (কে = 5) ব্যবহার করে জেজিএসে একটি বয়েসিয়ান এইচএলএম ফিট করছি। আমি জানতে চাই প্যারামিটারের অনুমান কিনা চাই সব ভাঁজ জুড়ে স্থিতিশীল আছে। এটি করার সর্বোত্তম উপায় কী?β

একটি ধারণা হ'ল পোস্টারিয়রগুলির পার্থক্যগুলি খুঁজে বের করা এবং 0 টি পার্থক্যের 95% সিআই-তে রয়েছে কিনা তা দেখতে। অন্য কথায়, (এবং তারপরে সমস্ত জোড়া ভাঁজগুলির জন্য পুনরাবৃত্তি) এর 95% ব্যবধানে 0 হয় ।ββk=1βk=2

আরেকটি ধারণা বিভিন্ন এমসিএমসি চেইন প্রতিটি ভাঁজ থেকে অধোদেশ চিকিত্সা, এবং Gelman এর গনা হয় এই সিউডো-চেইন জুড়ে (সম্ভাব্যআর^

এইগুলির মধ্যে একটি কি পছন্দনীয় এবং এর বিকল্পগুলিও রয়েছে?


1
বিশ্বাসযোগ্য পার্থক্যের মধ্যে শূন্য কিনা তা দেখতে আপনি আশ্চর্য বোধ করেন যেহেতু আপনি অবশ্যই ভাঁজগুলির মধ্যে কিছু পার্থক্য রাখবেন বলে আশা করছেন। একটি পরামর্শ প্রতিটি ভাড়ার জন্য point এর বিন্দু অনুমান গণনা করা এবং এগুলির বিস্তারটি লক্ষ্য করা। β
রাসমুস বুথ

3
ক্রস-বৈধতা এবং বয়েসিয়ান স্টাফ সম্পর্কে কেবল একটি সাধারণ মন্তব্য: কেবল ডাব্লিউএআইসি গণনা করা হয় না কেন? এটি LOOCV এর মতো asympototically সমতুল্য এবং আপনি এখনও আপনার সমস্ত ডেটা ব্যবহার করতে পারেন।
ব্রাশ ভারসাম্য

1
আপনি কীভাবে সিমুলেশন তৈরি করবেন ? β=1-β=2
স্টাফেন লরেন্ট 11 ই

আমার প্রাক্তন কারখানায় আমাদের পরীক্ষাগুলিতে আমাদের প্রমাণ করতে হয়েছিল যে 0% ফলন হ্রাস 95% সিআই-তে ছিল। পর্যাপ্ত, স্বতন্ত্র নমুনা এবং দ্বিপদী পরীক্ষার প্রকৃতির প্রশ্নগুলি। আপনার নমুনার আকারগুলি কি কি আপনি একটি ধারণা দিতে পারেন?
এনগ্রিস্টুডেন্ট -

উত্তর:


2

আমি জানি না এটি কোনও মন্তব্য হিসাবে বা উত্তর হিসাবে যোগ্য কিনা। আমি এখানে রাখছি কারণ এটি একটি উত্তর মত মনে হচ্ছে।

কে-ভাঁজ ক্রস-বৈধকরণে আপনি আপনার ডেটা কে গ্রুপে বিভক্ত করছেন। যদি আপনি এমনকি "বেসিকগুলি" coveringেকে রাখেন তবে আপনি প্রতিটি বি বিনের জন্য অবিচ্ছিন্নভাবে সদস্য নির্বাচন করছেন।

আমি যখন ডেটার কথা বলি, তখন আমি প্রতিটি সারিকে একটি নমুনা হিসাবে এবং প্রতিটি কলামকে একটি মাত্রা হিসাবে ভাবি। পরিবর্তনশীল গুরুত্ব, কলামের গুরুত্ব নির্ধারণ করতে আমি বিভিন্ন পদ্ধতি ব্যবহার করে অভ্যস্ত।

আপনি যদি একটি চিন্তার অনুশীলন হিসাবে, "পাঠ্যপুস্তক" ইউনিফর্মটি এলোমেলোভাবে ছেড়ে চলে যান এবং কোন সারিটি গুরুত্বপূর্ণ তা নির্ধারণ করেন? হতে পারে তারা একবারে একটি একক চলককে অবহিত করে তবে তারা আরও অবহিত করে। এমন কিছু সারি রয়েছে যা অন্যের চেয়ে কম গুরুত্বপূর্ণ? পয়েন্টগুলির অনেকগুলি তথ্যমূলক হতে পারে, খুব কমই হতে পারে।

ভেরিয়েবলের গুরুত্ব সম্পর্কে জানা, আপনি সম্ভবত তাদের গুরুত্ব দিয়ে বিনিন করতে পারেন। সম্ভবত আপনি সর্বাধিক গুরুত্বপূর্ণ নমুনাগুলি সহ একটি একক বিন তৈরি করতে পারেন। এটি আপনার "কে" এর আকার নির্ধারণ করতে পারে। এইভাবে, আপনি "সর্বাধিক তথ্যবহুল" কাঠের বালতিটি নির্ধারণ করছেন এবং এটি অন্যের সাথে এবং কমপক্ষে তথ্যমূলক বালতির বিপরীতে তুলনা করছেন।

এটি আপনাকে আপনার মডেল পরামিতিগুলির সর্বাধিক পরিবর্তনের ধারণা দিতে পারে। এটি কেবল একটি ফর্ম।

Kth bucket বিভক্ত করার দ্বিতীয় উপায় হ'ল দৈর্ঘ্য এবং প্রভাবের দিকনির্দেশ। সুতরাং আপনি একটি বালতিতে একটি দিকের প্যারামিটার বা পরামিতিগুলির দমন করতে পারেন এমন নমুনাগুলি রেখে দিতে পারেন এবং একই পরামিতি বা পরামিতিগুলিকে বিপরীত দিকে আলাদা বালতিতে ফেলেছেন samples

এই ফর্মের প্যারামিটারের প্রকরণটি ভেরিয়েবলগুলিকে একটি বৃহত্তর সুইপ দিতে পারে, তথ্য ঘনত্বের ভিত্তিতে নয়, তবে তথ্য ব্রিডের ভিত্তিতে।

ভাগ্য সুপ্রসন্ন হোক.


0

এটি একটি সম্পূর্ণ উত্তর নাও হতে পারে, তবে 0 0 বিভিন্ন পার্থক্যের জন্য 95% সিআই-তে না থাকলে এটি 0.05 স্তরে অভিন্ন নয় তা বলা নিরাপদ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.