স্কেল পরামিতিগুলির জন্য দুর্বলভাবে তথ্যবহুল পূর্ব বিতরণ


21

আমি স্কেল প্যারামিটারগুলির (সাধারণ বিতরণ, টি বিতরণ ইত্যাদির জন্য) পূর্বের বিতরণ হিসাবে লগের সাধারণ বিতরণগুলি ব্যবহার করছি যখন স্কেলটি কী হবে সে সম্পর্কে আমার কোনও ধারণা আছে তবে আমি জানি না বলে বলার দিক থেকে ভুল করতে চাই এটি সম্পর্কে অনেক। আমি এটি ব্যবহার করি কারণ সে ব্যবহারটি আমার কাছে স্বজ্ঞাত জ্ঞান তৈরি করে, তবে আমি অন্যকে এটি ব্যবহার করতে দেখিনি। এর কি কোনও লুকানো বিপদ আছে?


1
সাধারণের কনজুগেট প্রিয়ার থাকে: en.wikedia.org/wiki/Normal-gamma_distribration । আপনি এগুলি ব্যবহার করতে আরও সহজ পেতে পারেন।
whuber

মজাদার. আমি সংখ্যাসূচক জিনিসগুলি করছি, এই বিতরণগুলিতে কংগ্রেসিটি ছাড়াও কোনও সুবিধা আছে?
জন সালভাটিয়ার

5
আসলেই আমার অঞ্চল নয় তবে এটি 'প্রাসঙ্গিক' হতে পারে কি? গ্যালম্যান এ। শ্রেণিবিন্যাসের মডেলগুলিতে বৈকল্পিক পরামিতির জন্য বিতরণ Prior বায়েশিয়ান অ্যানালাইসিস 2006; 1: 515-533। dx.doi.org/10.1214/06-BA117A
on

পেরেজ এবং পেরিকির প্রস্তাবিত এই স্কেলড-বিটা 2 বিতরণটি আমি পেয়েছি । 2

সাধারণের মতো নির্দিষ্ট বিতরণের জন্য সংযুক্ত প্রিয়ারগুলি কেবল প্রিয়ার যা ডেটা সেট করে উত্তরোত্তর বিতরণ হিসাবে সেই বিতরণে নিয়ে যায়। আপনি যদি পূর্বে একটি কঞ্জুগেট ব্যবহার করেন তবে উত্তরোত্তর গণনা করার জন্য আপনাকে ইন্টিগ্রেশন করার গণ্ডগোলের মধ্যে পড়তে হবে না। এটি জিনিসগুলিকে সুবিধাজনক করে তোলে তবে আজকাল এমসিএমসি বিভিন্ন প্রকার সম্ভাব্য প্রিয়ারকে ব্যবহার করা আরও সহজ করে তোলে।
মাইকেল আর চেরনিক

উত্তর:


20

আমি হালকা তথ্যবহুল বিতরণের জন্য "দ্বিতীয় ধরণের বিটা বিতরণ" ( সংক্ষেপে বিটা 2 ) ব্যবহার করার পরামর্শ দিচ্ছি এবং যদি আপনার দৃ prior় বিশ্বাস থাকে তবে কনজুগেট ইনভার্স গামা বিতরণ ব্যবহার করার পরামর্শ দেব । আমি এটি বলার কারণটি হ'ল পূর্বের কনজুগেটটি এই অর্থে দৃ non় নয় যে, যদি পূর্ব এবং ডেটা দ্বন্দ্ব হয় তবে পূর্বের উত্তরোত্তর বিতরণে সীমাহীন প্রভাব ফেলে। এই জাতীয় আচরণ হ'ল আমি "ডগমেটিক" বলব, এবং হালকা পূর্বের তথ্য দ্বারা ন্যায়সঙ্গত নয় ।

যে সম্পত্তি দৃust়তা নির্ধারণ করে তা হ'ল পূর্ব এবং সম্ভাবনার লেজ-আচরণ। প্রযুক্তিগত বিবরণরেখার একটি খুব ভাল নিবন্ধ এখানে । উদাহরণস্বরূপ, একটি সম্ভাবনা (ক টি-ডিস্ট্রিবিউশান বলে) নির্বাচন করা যেতে পারে যেমন যে একটি পর্যবেক্ষণ যেমন (অর্থাত ইচ্ছামত বড় হয়ে) এটিকে একটি অবস্থান প্যারামিটার (একই ভাবে বিশ্লেষণ থেকে বাতিল করা হয় যে আপনার intuitively, would যেমন একটি পর্যবেক্ষণ দিয়ে না)। "ছাড়" এর হার বিতরণের লেজগুলি কতটা ভারী তা নির্ভর করে।yi

শ্রেণিবদ্ধ মডেলিং প্রসঙ্গে অ্যাপ্লিকেশন দেখানো কিছু স্লাইডগুলি এখানে একটি কাগজ সহ পাওয়া যাবে (বিটা 2 বিতরণের গাণিতিক ফর্মটি দেখায় ) ।

যদি আপনি শ্রেণিবিন্যাসের মডেলিং প্রসঙ্গে না থাকেন তবে আমি পূর্ববর্তী (বা আপনি যে ফলাফল তৈরি করছেন) তুলনা করার পরামর্শ দিচ্ছি তবে পি ( σ ) 1 দ্বারা প্রদত্ত স্কেল প্যারামিটারের জন্য জেফরি ব্যবহার করুন । উভয় পরামিতি শূন্যে রূপান্তরিতহওয়ায় এটি বিটা2ঘনত্বেরসীমা হিসাবে তৈরি করা যেতে পারে। একটি আনুমানিক জন্য আপনি ছোট মান ব্যবহার করতে পারেন। তবে সমাধানটিবিশ্লেষণাত্মকভাবে কার্যকরকরার চেষ্টা করবোযদি সম্ভব হয় (এবং যদি সম্পূর্ণ বিশ্লেষণাত্মক সমাধান না হয় তবে বিশ্লেষণাত্মক সমাধানটি যতটা সম্ভব আপনি যতটা সম্ভব এগিয়ে নিয়ে যেতে পারেন), কারণ আপনি কেবল নিজেকে কিছুটা গণনার সময় সাশ্রয় করবেন না, তবে আপনি এছাড়াও সম্ভবত করারবুঝতেকি আপনার মডেল ভালো ঘটছে।p(σ)1σ

আরও একটি বিকল্প হ'ল প্রতিরোধের আকারে আপনার পূর্বের তথ্য নির্দিষ্ট করা (যার অর্থ এম এর সমান)M , ভ্যারিয়েন্স করার সমান , IQR করার সমান আমি প্রশ্ন আর মান সঙ্গে ইত্যাদির এম , ভি , আমি প্রশ্ন আর নিজেকে দ্বারা নির্দিষ্ট), এবং তারপরে জেফ্রির "আক্রমণকারী পরিমাপ" এম ( σ ) = 1 এর সাথে সর্বাধিক এনট্রপি বিতরণ (সর্বাধিক এন্ট্রপি কী এবং এটি কী নয় তার ভাল ব্যাখ্যার জন্য এডউইন জেইনস বা ল্যারি ব্রেথারস্টের কোনও কাজ অনুসন্ধান করুন ) ব্যবহার করুনVIQRM,V,IQRm(σ)=1σ

ম্যাকসেন্ট হ'ল "রোলস রইস" সংস্করণ, অন্যদিকে বিটা 2 "সিডান" সংস্করণ। এর কারণ হ'ল ম্যাকসেন্ট বিতরণে "আপনি অন্তর্ভুক্ত করেছেন" সেই প্রতিবন্ধকতাগুলিতে "কমপক্ষে" বিষয়টিকে ধরে রাখে (উদাহরণস্বরূপ, কোনও সীমাবদ্ধতার অর্থ আপনি কেবল জেফরি পেয়ে যাবেন না), বিটা 2 বিতরণে কিছু "লুকানো" বৈশিষ্ট্য থাকতে পারে যা আপনার নির্দিষ্ট ক্ষেত্রে কাঙ্ক্ষিত হতে পারে বা নাও হতে পারে (যেমন, পূর্বের তথ্য যদি ডেটার চেয়ে বেশি নির্ভরযোগ্য হয় তবে বিটা 2 খারাপ)।

Maxent বিতরণের অন্যান্য চমৎকার সম্পত্তি যে যদি ডাটা উৎপাদিত প্রক্রিয়া অপারেটিং কোন অনির্দিষ্ট সীমাবদ্ধতার হয় তারপর Maxent বন্টন হয় সিংহভাগ সম্ভবত বন্টন যে আপনার দেখতে হবে (আমরা এক বিলিয়ান এবং ট্রিলিয়ান উপর মতভেদ উপায় কথা বলছি)। সুতরাং, আপনি যে বিতরণটি দেখছেন তা যদি ম্যাক্সেন্ট না হয় তবে সম্ভবত অতিরিক্ত বাধাও রয়েছে যা আপনি প্রকৃত প্রক্রিয়াটির জন্য অপারেটিং নির্দিষ্ট করেছেন না এবং পর্যবেক্ষণকৃত মানগুলি সেই সীমাবদ্ধতাটি কী হতে পারে তা সম্পর্কে একটি সূত্র সরবরাহ করতে পারে।


পছন্দ করুন আপনি কি জানেন যে তৃতীয় অনুচ্ছেদে আপনি উল্লিখিত কাগজপত্রগুলি কোথায় পাব? লিঙ্কগুলি কাজ করছে না।

1
কাগজের জন্য কাজ করে এমন একটি এখানে । এটি একটি সম্মেলনে ছিল "উদ্দেশ্য বায়েস 09" ওয়েবসাইট (ভ্যালেন্সিয়া সভা) meetings আমি মনে করি না যে স্লাইডগুলি আর উপলভ্য হবে কারণ সম্মেলনের জন্য ওয়েবসাইটটি নামানো হয়েছে ... :( করুণা, এটি স্লাইডগুলির একটি ভাল সেট ছিল That এই ঘোড়া পূর্বটি আপনার সরবরাহিত লিঙ্কটিতে আকর্ষণীয় দেখায় না
সম্ভাব্যতা

@ প্রোব্যাবিলিটিস্লোগিক সম্ভবত আমি কিছু মিস করছি তবে আমি B e t a 2 এর একটি উল্লেখ খুঁজে পাচ্ছি নাBeta2 বিএ কাগজে।

@ প্রলিনেটর আমি কি ধরে নিতে পারি যে আপনি কেবল সঠিক প্রিয়ার চান? আপনি এটি বলেননি তবে আপনি যদি আগে থেকেই উল্লিখিত জেফরিয়ের প্রিয়ারদের অনুচিত বন্দীদের অনুমতি দেন তবে আমি ডেনিস লিন্ডলি বা পরিসংখ্যান এনসাইক্লোপিডির বই জেফরিজ সম্ভাবনার তত্ত্বকে উদ্ধৃত করতে পারতাম। যেভাবে অনুরোধটি উত্তরটি খুঁজে পেতে গুগল ব্যবহার করে পরীক্ষা করতে পারে এবং যদি এটি খুঁজে না পাওয়া যায় তবে আপনি যে উত্সাহিত করেছেন তার বাইরে সাহিত্যে সম্ভবত কিছুই নেই।
মাইকেল আর চেরনিক

@ মিশেল চের্নিক হ্যাঁ, আপনি ঠিক বলেছেন, আমি কেবল যথাযথ প্রিয়ারদের নিয়েই আগ্রহী। এর কারণ হ'ল যথাযথ প্রিরিয়ারদের জন্য (১) উত্তরোত্তরটির অস্তিত্ব নির্দিষ্ট মডেলগুলির মধ্যে সীমাবদ্ধ নয় এবং (২) আমি পরীক্ষা করতে চেয়েছিলাম যে আমি আর একটি আকর্ষণীয় প্রস্তাব অনুপস্থিত করছি না। আমি আপনার সাথে একমত যে জেলমানস, পেরিকির এবং গামা প্রিয়ার্স সাহিত্যে সর্বাধিক জনপ্রিয় তবে আমি এটিও লক্ষ করেছি যে 'শক্তিশালী' তথ্য নির্ধারণের জন্য ভারী-লেজযুক্ত প্রিয়ার প্রস্তাব করার প্রবণতা রয়েছে।

13

ড্যানিয়েলসের নীচের কাগজটি বিভিন্ন সংকোচনের প্রিয়ারের সাথে বৈচিত্রের জন্য তুলনা করে। এগুলি যথাযথ প্রিয়ার তবে আমি নিশ্চিত নই যে কয়জনকে অ-তথ্যমূলক বলা যেতে পারে। তবে, তিনি অ-তথ্য-ভিত্তিক প্রিরিয়ারগুলির তালিকাও সরবরাহ করেন (সমস্ত সঠিক নয়)। নীচে রেফারেন্স দেওয়া আছে।

এমজে ড্যানিয়েলস (১৯৯৯), শ্রেণিবিন্যাসের মডেলগুলির ভিন্নতার জন্য পূর্ববর্তী , কানাডিয়ান জে স্ট্যাটাস। , খণ্ড। 27, না। 3, পিপি 567–578।

গতকাল দেশের সর্বোচ্চ তাপমাত্রা

  1. K
  2. অবস্থান-স্কেল :τ2
  3. ডান-আক্রমণকারী হার :τ1
  4. জেফ্রি ' : 1/(σ2+τ2)
  5. যথাযথ জেফরি ' : σ/(2(σ2+τ2)3/2)
  6. ইউনিফর্ম সঙ্কুচিত : σ2/(σ2+τ2)
  7. σ/(2τ(σ+τ)2)

সম্পর্কিত শিরাতে আরও একটি সাম্প্রতিক কাগজ নীচে রয়েছে।

উ। গেলম্যান (2006), শ্রেণিবিন্যাসের মডেলগুলিতে বৈকল্পিক পরামিতিগুলির পূর্ব বিতরণ , বায়েসিয়ান অ্যানালাইসিস , খণ্ড। 1, না। 3, পিপি 515–533।


2
(+1) এটি একটি ভাল অনুসন্ধান। আমি ড্যানিয়েলস কাগজে একটি স্থিতিশীল লিঙ্কের পাশাপাশি আরও একটি রেফারেন্স যুক্ত করেছি যা এটির পরিপূরক বলে মনে হচ্ছে।
কার্ডিনাল

4

(প্রশ্নটি বাসি, তবে বিষয়টি নয়)

ব্যক্তিগতভাবে, আমি মনে করি আপনার অন্তর্দৃষ্টি কিছুটা অর্থবোধ করে। এর অর্থ হ'ল, যদি আপনার বিবাহের গণিতের সুসংবাদ প্রয়োজন না হয় তবে আপনি কোনও অবস্থান প্যারামিটারের জন্য যে পরিমাণ বিতরণ ব্যবহার করবেন না কেন, আপনাকে স্কেল প্যারামিটার লগ করার জন্য একই ব্যবহার করা উচিত। সুতরাং, আপনি যা বলছেন তা হ'ল: সাধারণ পূর্বের সমতুল্য ব্যবহার করুন।

আপনি কি কোনও অবস্থানের প্যারামিটারের জন্য স্বাভাবিক কোনও পূর্ব ব্যবহার করবেন? বেশিরভাগ লোকেরা বলবেন, যদি না আপনি বৈকল্পিককে বিশাল করে তোলেন, তবে সম্ভবত এটি অন্যান্য উত্তরগুলিতে (সীমাহীন প্রভাব) ব্যাখ্যা করার কারণে কিছুটা "খুব কট্টরবাদী"। আপনি যদি বোধগম্য বেইস করছেন তবে এর ব্যতিক্রম হবে; এটি হ'ল আপনার ডেটা ব্যবহার করে আপনার পূর্বের পরামিতিগুলি অনুমান করতে।

আপনি যদি "দুর্বল তথ্যবহুল" হতে চান তবে আপনি সম্ভবত মোটা লেজযুক্ত একটি বিতরণ বেছে নিতে চান; সুস্পষ্ট প্রার্থীরা টি বন্টন হয়। গেলম্যানের সর্বশেষ পরামর্শটি 3-7 এর ডিএফ ব্যবহার করতে হবে বলে মনে হচ্ছে। (নোট করুন যে লিঙ্কটিও আমার পরামর্শটিকে সমর্থন করে যে আপনি স্কেলের লগের জন্য একই কাজটি করতে চান যা আপনি অবস্থানের জন্য করবেন) সুতরাং লগনরমালের পরিবর্তে আপনি লগ-ছাত্র-টি ব্যবহার করতে পারেন। স্ট্যান এ সম্পন্ন করার জন্য, আপনি যেমন কিছু করতে পারেন:

real log_sigma_y; //declare at the top of your model block
//...some more code for your model
log_sigma_y <- log(sigma_y); increment_log_prob(-log_sigma_y);
log_sigma_y ~ student_t(3,1,3); //This is a 'weakly informative prior'.

তবে আমি মনে করি যে যদি উপরের কোডটি আপনার পক্ষে খুব জটিল হয় তবে আপনি সম্ভবত দুটি ক্যাভ্যাট সহ একটি লগনরমাল পূর্বে চলে যেতে পারেন। প্রথমত, "আপনি কীভাবে অনিশ্চিত হন" তার মোটামুটি অনুমানের চেয়ে কয়েকগুণ প্রশস্ত হয়ে ওঠুন; আপনি একটি দুর্বল তথ্যমূলক আগে চান, একটি দৃ a় তথ্যমূলক না। এবং দ্বিতীয়ত, একবার আপনি নিজের মডেলটি ফিট করে নিলে প্যারামিটারের পরবর্তী মধ্যস্থতা পরীক্ষা করে দেখুন এবং নিশ্চিত হন যে এটির লগটি লগনারমের কেন্দ্র থেকে খুব বেশি দূরে নয়। "খুব বেশি দূরে নয়" সম্ভবত এর অর্থ: দুটি স্ট্যান্ডার্ড বিচ্যুতির চেয়ে কম, এবং সম্ভবত একটি এসডির চেয়ে বেশি নয়।


2

শ্রেণিবদ্ধ মডেল স্কেল পরামিতিগুলির জন্য, আমি প্রায়শই ভাঁজযুক্ত, ননসেন্ট্রাল টি-বিতরণ ব্যবহারের অ্যান্ড্রু গেলম্যানের পরামর্শ ব্যবহার করে শেষ করেছি । এটি আমার জন্য বেশ সুন্দরভাবে কাজ করেছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.