অপ্রয়োজনীয় বিটা প্রিয়ারদের মধ্যে নির্বাচন করা


17

দ্বিপদী প্রক্রিয়া (হিট / মিস) এর সাথে কাজ করার জন্য আমি বিটা বিতরণের জন্য অপ্রাতিষ্ঠানিক প্রিয়ারদের সন্ধান করছি। প্রথমে আমি ব্যবহার করার কথা ভেবেছিলাম যা একটি অভিন্ন পিডিএফ তৈরি করে, বা জেফরি পূর্বে । তবে আমি প্রকৃতপক্ষে প্রিরিয়ারদের সন্ধান করছি যা উত্তরোত্তর ফলাফলের সর্বনিম্ন প্রভাব ফেলেছে এবং তারপরে আমি পূর্বে একটি অনুচিত ব্যবহার করার কথা ভেবেছিলাম । এখানে সমস্যাটি হ'ল আমার উত্তর বিতরণ কেবলমাত্র যদি আমার কমপক্ষে একটি হিট এবং একটি মিস হয় তবে কাজ করে। এই আমি তখন খুব ছোট ধ্রুবক ব্যবহার সম্পর্কে চিন্তা পরাস্ত করতে চান , শুধু যে আশ্বাস অবর এবং হতে হবে ।α=1,β=1α=0.5,β=0.5α=0,β=0α=0.0001,β=0.0001αβ>0

এই পদ্ধতির গ্রহণযোগ্য কিনা তা কি কেউ জানেন? আমি এইগুলি পূর্বে পরিবর্তনের সংখ্যাসূচক প্রভাবগুলি দেখতে পাচ্ছি, তবে কেউ আমাকে প্রিয়ার হিসাবে এই ধরণের ছোট ধাপগুলি রাখার এক ধরণের ব্যাখ্যা দিতে পারে?


1
প্রচুর পরিমাণে হিট এবং মিস হওয়া সহ বড় বড় নমুনাগুলির জন্য, এটি কিছুটা তফাত করে। ছোট নমুনাগুলির জন্য, বিশেষত যদি কমপক্ষে একটি হিট এবং একটি মিস না হয় তবে এটি একটি বড় পার্থক্য করে; এমনকি আপনার "খুব ছোট ধ্রুবক" এর আকারও যথেষ্ট প্রভাব ফেলতে পারে। আমি এ কী চিন্তার পরীক্ষা সুপারিশ করবে আপনি হতে পারে জন্য অবর ধরনের কি একটি নমুনা আকার পর জ্ঞান করে তোলে : এই তোমার মত জেফ্রি যে কিছু প্ররোচিত পারে গুলি পূর্বে যুক্তিযুক্ত1
হেনরি

এবং সেখানে একটি কাগজ কারমান পরামর্শ দিয়েছে 1/3 এবং 1/3, খ
বিজন

Pos উত্তর ফলাফলের সর্বনিম্ন প্রভাব 'বলতে কী বোঝ? কিসের তুলনায়?
উইল

আমি আপনার প্রশ্নের বিন্যাস এবং শিরোনাম উন্নত করেছি, সম্পাদনাগুলি ফিরে বা পরিবর্তন করতে নির্দ্বিধায়।
টিম

উত্তর:


33

প্রথমত, অপ্রয়োজনীয় পূর্বের মতো কোনও জিনিস নেই । নীচে আপনি বিভিন্ন ডেটা দেওয়া পাঁচটি পৃথক "অননুমোদিত" প্রিয়ার (প্লটের নীচে বর্ণিত) এর ফলে পোস্টারিয়র ডিস্ট্রিবিউশনগুলি দেখতে পাবেন। আপনি পরিষ্কারভাবে দেখতে পাচ্ছেন যে, "অপ্রয়োজনীয়" প্রবীণদের পছন্দ উত্তরোত্তর বিতরণকে প্রভাবিত করেছিল, বিশেষত এমন ক্ষেত্রে যেখানে ডেটা নিজেই খুব বেশি তথ্য সরবরাহ করে না

অপ্রাতিষ্ঠানিক প্রেরকদের থেকে পোস্টারিয়র

α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0α=β=εε>0

αβyn

θyB(α+y,β+ny)

α,βα=β=1n

প্রথম দর্শনে, হালদানে আগে, সবচেয়ে "অবজ্ঞাত" বলে মনে হয়, যেহেতু এটি উত্তরোত্তর দিকে পরিচালিত করে, এটি সর্বাধিক সম্ভাবনার অনুমানের ঠিক সমান

α+yα+y+β+ny=y/n

y=0y=n

"অবজ্ঞাতনামা" প্রিরিয়ারগুলির প্রত্যেকের পক্ষে এবং বিপক্ষে বিভিন্ন যুক্তি রয়েছে (দেখুন কারমান, ২০১১; টুয়েল এট আল, ২০০৮)। উদাহরণস্বরূপ, টুয়েল এট আল দ্বারা আলোচিত হিসাবে,

101

অন্যদিকে, ছোট ডেটাসেটের জন্য অভিন্ন প্রিয়ারগুলি ব্যবহার করা খুব প্রভাবশালী হতে পারে (সিউডোকাউন্টগুলির ক্ষেত্রে এটি ভাবেন)। আপনি একাধিক কাগজপত্র এবং হ্যান্ডবুকগুলিতে এই বিষয়ে আরও অনেক তথ্য এবং আলোচনার সন্ধান করতে পারেন।

দুঃখিত, তবে এখানে কোনও একক "সেরা", "সর্বাধিক তথ্যহীন", বা "এক-আকারের ফিটস-সমস্ত" প্রিয়ার নেই। তাদের প্রত্যেকে মডেলটিতে কিছু তথ্য নিয়ে আসে।

কারমান, জে। (২০১১) নিরপেক্ষ ননফর্মাল এবং তথ্যবহুল সংযুক্তি বিটা এবং গামা পূর্বে বিতরণ। বৈদ্যুতিন জার্নাল অফ স্ট্যাটিস্টিকস, 5, 1450-1470।

টুয়েল, এফ, গেরলাচ, আর। এবং মেনজারসেন, কে। (২০০৮)। বেয়েস-ল্যাপ্লেস, জেফ্রি এবং অন্যান্য পুরষ্কারগুলির একটি তুলনা। আমেরিকান পরিসংখ্যানবিদ, 62 (1): 40-44।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.