একটি অনুচিত বিতরণ থেকে নমুনা (এমসিসিএম ব্যবহার করে এবং অন্যথায়)


15

আমার প্রাথমিক প্রশ্নটি: আপনি কীভাবে অনুচিত বিতরণ থেকে নমুনা পাবেন? এমনকি এটি একটি অনুচিত বিতরণ থেকে নমুনা বুদ্ধি করে?

শিয়ান'র মন্তব্য এখানে প্রশ্নের ধরণের ঠিকানা দেয় তবে আমি এই বিষয়ে আরও কিছু বিবরণ খুঁজছিলাম।

এমসিএমসির সাথে আরও নির্দিষ্ট:

এমসিমিসি এবং কাগজপত্র পড়ার বিষয়ে কথা বলার ক্ষেত্রে, লেখকরা যথাযথ উত্তরোত্তর বিতরণ পাওয়ার উপর জোর দেয়। বিখ্যাত জিয়ের (1992) পেপার রয়েছে যেখানে লেখক তাদের উত্তরোত্তর যথাযথ (অন্যথায় একটি দুর্দান্ত কাগজ) সঠিক কিনা তা পরীক্ষা করতে ভুলে গিয়েছিলেন।

কিন্তু, একটি আমরা একটি সম্ভাবনা আছে অনুমান করা এবং একটি অপ্রকৃত পূর্বে বন্টন যেমন যে ফলে অবর এছাড়াও অপ্রকৃত, এবং এমসিএমসি বন্টন থেকে নমুনা ব্যবহার করা হয়। এই ক্ষেত্রে, নমুনাটি কী নির্দেশ করে? এই নমুনায় কোন দরকারী তথ্য আছে? আমি জানি যে এখানে মার্কোভ চেইনটি হয় ক্ষণস্থায়ী বা নাল পুনরাবৃত্ত হয়। যদি এটি নাল-পুনরাবৃত্তি হয় তবে কোনও ইতিবাচক টেকওয়েস আছে ?(এক্স|θ)θ

অবশেষে, এখানে নীল জি এর উত্তরে তিনি উল্লেখ করেছেন

আপনি সাধারণত পোস্টারিয়র থেকে নমুনা করতে পারেন (এমসিএমসি ব্যবহার করে) এমনকি এটি অনুপযুক্ত।

তিনি উল্লেখ করেন যে এই ধরণের নমুনা গভীর শেখার ক্ষেত্রে সাধারণ। এটি যদি সত্য হয় তবে এটি কীভাবে বোঝায়?


1
এই jstor.org/stable/pdf/2246228.pdf?_=1462943547901 আকর্ষণীয় হতে পারে
peuhp

@Pehh নিশ্চয়ই সহায়ক। আমি কাগজটি থেকে যা বুঝতে পারি তা হ'ল যদি নমুনাগুলি থেকে মূল্যায়ন করা ফাংশনগুলি সংহত হয়, তবে একটি অনুচিত উত্তরোত্তর থেকে নমুনা বোঝা যায়। আমার ব্যাখ্যাটি কি সঠিক?
গ্রিনপার্কার

3
হ্যাঁ. একটি অপ্রকৃত অবর, যেখানে অন্যায় চর্বি মুদ্রার উলটা পিঠ কারণে একটি তুচ্ছ মামলা, এবং একটি ফাংশন যে শূন্য বাহিরে সমান বিবেচনা করুন এবং উপর integrability জন্য সব চমৎকার বৈশিষ্ট্য আছে । উত্তরোত্তর অনুপযুক্ত যে সত্যটি পোস্টেরিয়রের একমাত্র অংশ হিসাবে গুরুত্বপূর্ণ তা অপ্রাসঙ্গিক কারণ এটি অংশ । [ 0 , 1 ] [ 0 , 1 ][0,1][0,1][0,1]
জোবোম্যান

উত্তর:


10

কোনও অনুচিত পোস্টেরিয়র (ঘনত্ব) থেকে নমুনা নেওয়া কোনও সম্ভাব্য / তাত্ত্বিক দৃষ্টিকোণ থেকে বোঝা যায় না। এর কারণ হ'ল ফাংশন এফের প্যারামিটার জায়গার উপরে সীমাবদ্ধ অবিচ্ছেদ্য নেই এবং ফলস্বরূপ, একটি (সীমাবদ্ধ পরিমাপ) সম্ভাব্যতা মডেল ( Ω , σ , পি ) (স্পেস, সিগমা-বীজগণিত, সম্ভাব্যতা পরিমাপ ) এর সাথে যুক্ত করা যাবে না )।(Ω,σ,পি)

আপনার যদি একটি অনুপযুক্ত পূর্বে একটি মডেল থাকে যা একটি অনুচিত উত্তরোত্তর দিকে পরিচালিত করে, তবে অনেক ক্ষেত্রে আপনি এমসিএমসি ব্যবহার করে এখনও এটি থেকে নমুনা নিতে পারেন, উদাহরণস্বরূপ মেট্রোপলিস-হেস্টিংস এবং "উত্তরবর্তী নমুনাগুলি" যুক্তিসঙ্গত বলে মনে হতে পারে। এটি প্রথম নজরে আকর্ষণীয় এবং বিপরীতে দেখায় looks তবে এর কারণ হ'ল এমসিএমসি পদ্ধতিগুলি অনুশীলনে কম্পিউটারের সংখ্যাসূচক সীমাবদ্ধতায় সীমাবদ্ধ এবং তাই কম্পিউটারের জন্য সমস্ত সমর্থন সীমাবদ্ধ (এবং পৃথক!)। তারপরে, এই বিধিনিষেধের অধীনে (সীমাবদ্ধতা এবং বিচক্ষণতা) ​​উত্তরোত্তর বেশিরভাগ ক্ষেত্রেই যথাযথ।

হবার্ট এবং কেসেলার একটি দুর্দান্ত রেফারেন্স রয়েছে যা একটি উদাহরণ (কিছুটা আলাদা প্রকৃতির) উপস্থাপন করে যেখানে আপনি কোনও উত্তরকালের জন্য গিবস স্যাম্পলার তৈরি করতে পারেন, উত্তরোত্তর নমুনাগুলি পুরোপুরি যুক্তিসঙ্গত দেখায়, তবে উত্তরটি অনুপযুক্ত!

http://www.jstor.org/stable/2291572

একটি অনুরূপ উদাহরণ সম্প্রতি এখানে উপস্থিত হয়েছে । প্রকৃতপক্ষে, হাবার্ট এবং কেসেলা পাঠককে হুঁশিয়ারি উচ্চারণ করেছেন যে উত্তরাধিকারের অনুপযুক্ততা সনাক্ত করতে এমসিসিএম পদ্ধতিগুলি ব্যবহার করা যাবে না এবং যে কোনও এমসিসিএম পদ্ধতি প্রয়োগের আগে এটি আলাদাভাবে পরীক্ষা করা উচিত। সংক্ষেপে:

  1. মেট্রোপলিস-হেস্টিংসের মতো কিছু এমসিসিএম স্যাম্পেলারগুলি কম্পিউটারের প্যারামিটারের সীমাটি সীমাবদ্ধ করে এবং dicretizes করার কারণে একটি অনুচিত উত্তরোত্তর থেকে নমুনা ব্যবহার করতে পারে (তবে হওয়া উচিত নয়)। আপনি শুধু যদি বিশাল নমুনা, আপনি পারে কিছু অদ্ভুত জিনিস প্রতিপালন করতে সক্ষম হবেন। আপনি এই সমস্যাগুলি কীভাবে সনাক্ত করতে পারেন তা আপনার নমুনায় নিযুক্ত "যন্ত্র" বিতরণের উপরও নির্ভর করে। দ্বিতীয় পয়েন্টটির জন্য আরও বিস্তৃত আলোচনা দরকার, তাই আমি এটিকে এখানে রেখেই পছন্দ করি।
  2. (হবার্ট এবং কেসেলা)। আপনি যে কোনও মডেলটির জন্য একটি গীবস স্যাম্পলার (শর্তসাপেক্ষ মডেল) নির্মাণ করতে পারেন তা পূর্ববর্তী (যুগ্ম মডেল) সঠিক নয় তা বোঝায় না।
  3. উত্তরোত্তর নমুনাগুলির একটি আনুষ্ঠানিক সম্ভাব্য ব্যাখ্যার জন্য উত্তরের স্বত্বের প্রয়োজন হয়। রূপান্তর ফলাফল এবং প্রমাণগুলি কেবলমাত্র যথাযথ সম্ভাবনা বিতরণ / ব্যবস্থা গ্রহণের জন্য প্রতিষ্ঠিত।

পিএস (গালে কিছুটা জিহ্বা): মেশিন লার্নিংয়ে লোকেরা যা করেন তা সর্বদা বিশ্বাস করবেন না। যেমনটি প্রফেসর ব্রায়ান রিপলি বলেছিলেন: "মেশিন লার্নিং হ'ল পরিসংখ্যানকে মডেল ও অনুমানের যে কোনও পরীক্ষা করা"।


(+1) দুর্দান্ত উত্তর, এবং আমি যা ভাবছিলাম তার বেশিরভাগের সাথে একমত হয় না। আমি হবার্ট + কেসেলা রেফারেন্স পড়ব। আপনি কি জানতে পেরেছিলেন যে মার্কোভ চেইন নাল পুনরাবৃত্তি হলে আরও ভাল কিছু ঘটতে পারে? এছাড়াও, পিএস মন্তব্য সহ একমত।
গ্রিনপার্কার

@ গ্রিনিপারকার নুল বারবারের মার্কোভ চেইনের কোনও স্থির বন্টন নেই। তারপরে, তারা MCMC এর প্রসঙ্গে (যেখানে আপনি লক্ষ্য বিতরণের সমান স্থির বন্টন সহ মার্কভ চেইনগুলি তৈরি করেন), উদাহরণস্বরূপ এখানে এবং এখানে দেখুন
রড

5

উপরে রডের দুর্দান্ত উত্তরটি থেকে একটি বিকল্প, আরও প্রয়োগ করা, দেওয়া -

+ +/-10100

1/এক্সপূর্ববর্তী - আমি গণনার জন্য ব্যবহার করি, যার উপরের বাউন্ড নেই এবং এটির "অতিরিক্ত বৈশিষ্ট্য" যেখানে এটি সান ফ্রান্সিসকো-র জনসংখ্যার শূন্যের সমান ... "এতে" অতিরিক্ত বৈশিষ্ট্য "প্রয়োগ করা হয়েছে একটি পদক্ষেপ নমুনা প্রজন্মের পরবর্তী। বাস্তব পূর্বে এক যে এমসিএমসি গণনার ব্যবহৃত নয় (আমার উদাহরণে।)

সুতরাং নীতিগতভাবে আমি প্রয়োগকৃত কাজে অনুচিত বিতরণ থেকে এমসিসিএম-উত্পাদিত নমুনাটি ব্যবহারের ক্ষেত্রে বেশ ঠিক হয়ে যাব, তবে কীভাবে এই অনুপাতটি ঘটেছিল এবং কীভাবে এলোমেলো নমুনা এতে প্রভাব ফেলবে সেদিকে আমি অনেক মনোযোগ দিচ্ছি । আদর্শভাবে, এলোমেলো নমুনা এটি দ্বারা প্রভাবিত হবে না, যেমন আমার হট-কুকুরের উদাহরণ হিসাবে, যেখানে যুক্তিসঙ্গত বিশ্বে আপনি সান ফ্রান্সিসকোতে সংখ্যার চেয়ে বেশি লোক এলোমেলো সংখ্যা জেনারেট করতে পারবেন না ...

আপনার সত্যটি সম্পর্কেও সচেতন হওয়া উচিত যে আপনার ফলাফলগুলি পোস্টেরিয়রের বৈশিষ্ট্যটির জন্য যথেষ্ট সংবেদনশীল হতে পারে যা এটি পরবর্তীকালে কিছুটা সংখ্যক অংশে ছাঁটাই করে ফেললেও (অথবা যে কোনও পরিবর্তন আপনার মডেলটির জন্য উপযুক্ত) the ) আপনি চাইছেন যে আপনার ফলাফলগুলি সামান্য পরিবর্তনগুলির দিকে দৃust় হতে পারে যা আপনার উত্তরকে যথাযথ থেকে যথাযথ দিকে সরিয়ে দেয়। এটি নিশ্চিত করা আরও কঠিন হতে পারে তবে আপনার ফলাফলগুলি আপনার অনুমানের প্রতি দৃ .়, বিশেষত সুবিধার্থে যা কার্যকর হয়েছে তা নিশ্চিত করার বৃহত্তর সমস্যার অংশ।


+1, আকর্ষণীয় কৌশল। আপনি আপনার বাস্তব পূর্ববর্তী হিসাবে কাটা প্রদান করতে পারে। আমি ভাবছিলাম এমএমসিসি করার সময় এটি আপনার অনেকগুলি গণনা ব্যানজ্যাক্স না করে এবং প্রায় অনুমানের ব্যবহার নিয়ে আলোচনা করার প্রয়োজন এড়াতে পারে।
অনুমান

@ ধারণা - অবশ্যই, এই ক্ষেত্রে! এটি কেবল একটি সাধারণ উদাহরণ, বিন্দুটি বোঝানোর উদ্দেশ্যে বোঝানো হয়েছিল যে ক) এমসিসিএম গণনাতে ব্যবহৃত পূর্বের মধ্যে পার্থক্য থাকতে পারে এবং প্রকৃত পূর্ব, খ) পার্থক্যটি এমসিসিএম নমুনার পোস্ট-প্রসেসিংয়ের মাধ্যমে সমাধান করা যেতে পারে (থেকে "রেজোলিউশন") এর একটি যুক্তিসঙ্গত ডিগ্রি, এবং গ) এমসিসিএম গণনায় পূর্বে ব্যবহৃত ফলাফলগুলির অপ্রয়োজনীয়তা পোস্ট-প্রসেসিং সম্পন্ন হওয়ার পরে ফলাফলের অযোগ্যতা বোঝায় না।
jboman
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.