অনুপযুক্ত মিশ্রণগুলি থেকে সঠিক নমুনা


10

ধরুন আমি ধারাবাহিক বিতরণ থেকে নমুনা নিতে চাই । আমার যদি ফর্মটিতে একটি এক্সপ্রেশন থাকেপিp(x)p

p(x)=i=1aifi(x)

যেখানে , এবং f_i এমন বিতরণ যা সহজেই নমুনা থেকে নেওয়া যায়, তারপরে আমি পি দ্বারা সহজেই নমুনা তৈরি করতে পারি :ai0,iai=1fip

  1. সম্ভাব্যতা a_i সহ আমি একটি লেবেল নমুনা দিচ্ছিiai
  2. স্যাম্পলিং Xfi

ai মাঝে মাঝে নেতিবাচক থাকলে এই প্রক্রিয়াটি কি সাধারণ করা সম্ভব ? আমার সন্দেহ হয় আমি কোথাও এটি দেখেছি - সম্ভবত কোনও বইতে, সম্ভবত কোলমোগোরভ বিতরণের জন্য - সুতরাং আমি উত্তর হিসাবে কোনও রেফারেন্স গ্রহণ করতে পেরে পুরোপুরি খুশি হব।

যদি কংক্রিটের খেলনার উদাহরণ সহায়ক হয় তবে আসুন আমি

p(x,y)exp(xyαxy)x,y>0
পরে নমুনা নিতে চাই প্রযুক্তিগত কারণে \ আলফা take নিন (0, 2)α(0,2) যা খুব বেশি গুরুত্বপূর্ণ নয়, জিনিসগুলির দুর্দান্ত পরিকল্পনায়।

নীতিগতভাবে, আমি এটির পরে নিম্নলিখিত যোগ হিসাবে প্রসারিত করতে পারি:

p(x,y)n=0(1)nαn(n2)!(n2)!n!(xn/2ex(n2)!)(yn/2ey(n2)!).

(x,y) -terms ভিতরে সমষ্টি তারপর স্বাধীনভাবে থেকে গামা র্যান্ডম variates নমুনা করা যেতে পারে। আমার সমস্যা স্পষ্টতই সহগগুলি "মাঝে মধ্যে" নেতিবাচক হয়।

সম্পাদনা করুন 1 : আমি নির্মল যে আমি জেনারেট করতে প্রার্থনা করছি সঠিক নমুনা থেকে p বরং অধীনে প্রত্যাশা গণক চেয়ে p । যারা আগ্রহী তাদের জন্য, এমন কিছু পদ্ধতির মন্তব্যগুলিতে ইঙ্গিত দেওয়া হয়েছে।

সম্পাদনা 2 : আমি রেফারেন্সটি পেয়েছি যা দেব্রয়ের 'অ-ইউনিফর্ম র‌্যান্ডম ভেরিয়েট জেনারেশন' এ এই সমস্যাটির জন্য একটি বিশেষ পদ্ধতির অন্তর্ভুক্ত । অ্যালগরিদমটি 'বিতরণের সংমিশ্রণ থেকে নমুনা নেওয়ার বিষয়ে একটি নোট', বিগনামি এবং ডি ম্যাটেইসের । পদ্ধতিটি কার্যকরভাবে অঙ্কের ধনাত্মক শর্তাবলী দ্বারা উপরের থেকে ঘনত্বকে আবদ্ধ করা এবং তারপরে এই খামের উপর ভিত্তি করে প্রত্যাখ্যানের নমুনা ব্যবহার করুন। এটি @ শি'ানের উত্তরে বর্ণিত পদ্ধতির সাথে মিলে যায়।


1
আপনি শুধু পরম মান ব্যবহার করে কেন নমুনা না পারেন , এবং তারপর আপনার negating নমুনা? অন্য কথায় সংজ্ঞায়িত করুন(ধরে নিলাম এটি সসীম) এবং তারপরে দ্বারা আপনার যোগফলটিকে পুনর্নবীকরণ করুন । aiXfiZ:=i=1|ai|Z
অ্যালেক্স আর।

2
@AlexR। যদি আমি আপনাকে বুঝতে পারি তবে এর একটি সংস্করণ অধীনে প্রত্যাশা গণনা করার জন্য ব্যবহারিক হবে , তবে এখনও থেকে সঠিক নমুনা আঁকার জন্য নয় । অবশ্যই এটি একটি প্রাসঙ্গিক সমস্যার উত্তর, যদিও আমি যা খুঁজছি তা ঠিক তা নয়। pp
8r8

4
এটি সেই নমুনার সাথে আপনি কী করতে চান তার উপর নির্ভর করে। উদাহরণস্বরূপ, গণনা মুহুর্তের উদ্দেশ্যে, ঘনত্বের মিশ্রণগুলি থেকে নমুনা সাধারণকরণ করা সহজতর বলে মনে হয় অতিরিক্তভাবে নেতিবাচক সহগ সহ একটি উপাদান থেকে নির্বাচিত যে কোনও পয়েন্টকে "নেতিবাচক" বিন্দু হিসাবে চিহ্নিত করে এবং মুহুর্তের অনুমানের সাথে তার অবদানকে নেতিবাচকভাবে ওজন করে। একইভাবে আপনি এই ধরণের নেতিবাচক ওজন সহ একটি কে.ডি.ই. নির্মাণ করতে পারেন, তবে এর মানগুলি নেতিবাচক হওয়ার সম্ভাবনা আপনি যদি মেনে নিতে পারেন! (সিসি @
শি'আন

1
কোনও বিতরণের একটি "সঠিক" নমুনা কী হবে? আবার, কীভাবে এবং কীভাবে আপনি নেতিবাচক ওজনের সাথে মিশ্রণটি কাজে লাগাতে পারেন তা কীভাবে আপনি নমুনাটি ব্যবহার করার ইচ্ছুক তা নীচে নেমে আসে।
whuber

1
এটি আপনার প্রশ্নের উত্তর দিতে না, কিন্তু আপনি লগ সম্ভাব্যতা থেকে স্যাম্পলিং সম্পর্কে পড়া আগ্রহী হতে পারেন stats.stackexchange.com/a/260248/35989
টিম

উত্তর:


5

আমি এই প্রশ্নটি নিয়ে হতবাক হয়েছি তবে সন্তোষজনক সমাধান নিয়ে আসিনি।

সম্ভাব্য ব্যবহারের জন্য একটি সম্পত্তি হ'ল, যদি কোনও ঘনত্ব যেখানে একটি ঘনত্ব যেমন , থেকে অনুকরণ করে এবং সম্ভাব্যতার সাথে এই অনুকরণগুলি প্রত্যাখ্যান করে থেকে । বর্তমান ক্ষেত্রে, হ'ল ধনাত্মক ওজনের উপাদানগুলির এবং হ'ল বাকী অংশ হ'ল

f(x)=g(x)ωh(x)1ωω>0
gg(x)ωh(x)gωh(x)/g(x)fg
g(x)=αi>0αifi(x)/αi>0αi
ωh
h(x)=αi<0αifi(x)/αi<0αi
এটি প্রকৃতপক্ষে ডিভ্রয়ের সিমুলেশন বাইবেলে পাওয়া গেছে, অ-ইউনিফর্ম এলোমেলো পরিবর্তনশীল প্রজন্মের বিভাগ II.7.4, তবে সাধারণ গ্রহণ-প্রত্যাখ্যান যুক্তি থেকে অনুসরণ করা হয়েছে।

এই পদ্ধতির প্রথম , নির্বাচিত উপাদানটি থেকে প্রথম অনুকরণ করা সত্ত্বেও, প্রত্যাখ্যানের পদক্ষেপের জন্য এবং উভয় উভয়ের গণনা করতে হবে। যদি কোনও বদ্ধ ফর্ম সংস্করণ না দিয়ে অঙ্কগুলি অসীম হয়, এটি গ্রহণযোগ্য-প্রত্যাখাত পদ্ধতিটি কার্যকর করা অসম্ভব করে তোলেfigh

দ্বিতীয় যেহেতু উভয় ওজন একই ক্রমের প্রত্যাখ্যান হারকোন উচ্চতর সীমা আছে। আসলে সাথে যুক্ত সিরিজটি যদি একেবারে রূপান্তর না করে তবে গ্রহণযোগ্যতা সম্ভাবনা শূন্য! এবং এই পরিস্থিতিতে পদ্ধতিটি প্রয়োগ করা যায় না।

αi>0αi=1αi<0αi
1ϱaccept=αi<0|αi|/i|αi|
αi

মিশ্রণের উপস্থাপনের ক্ষেত্রে, কে প্রথমে উপাদানটি চয়ন করা যায় এবং তারপরে উপাদানটির জন্য পদ্ধতিটি প্রয়োগ করা যেতে পারে। তবে এটি সম্ভাব্য অসীম যোগফল থেকে অপরিহার্যভাবে সম্ভব নয় বলে ফিট করে এমন সনাক্ত করে এটি প্রয়োগ করা সূক্ষ্ম হতে পারে ।f

f(x)=i=1αigi(x)ωih(xi)1ωiωi>0
(gi,hi)gi(x)ωih(xi)>0

আমি মনে করি সিরিজের উপস্থাপনা থেকেই আরও কার্যকর সমাধান আসতে পারে। ডিভ্রয়ে, অ-ইউনিফর্ম এলোমেলো পরিবর্তনশীল জেনারেশন , বিভাগ IV.5 এ সিরিজ পদ্ধতিগুলির একটি বিশাল পরিসীমা রয়েছে। উদাহরণস্বরূপ, লক্ষ্যমাত্রা যখন 'এর বিকল্প ধারাবাহিক উপস্থাপনের জন্য নিম্নলিখিত অ্যালগরিদম s এর সাথে শূন্যে এবং ঘনত্ব হ'ল:

f(x)=κh(x){1a1(x)+a2(x)}
ai(x)nhদেবরোয়ের বিকল্প সিরিজ পদ্ধতি

গ্লেন-রাহে পদ্ধতির উদাহরণ হিসাবে, এমসিসিএমির পক্ষপাতদুষ্ট অনুমানকারীদের ডিবিজিংয়ের প্রসঙ্গে সম্প্রতি এই সমস্যাটি বিবেচনা করা হয়েছে । এবং রাশিয়ান রুলেট অনুমানকারী (বার্নোল্লি কারখানার সমস্যার সাথে সংযোগ সহ) এবং নিরপেক্ষ এমসিএমসি পদ্ধতি । তবে সাইন ইস্যু থেকে কোনও রেহাই পাওয়া যায় না ... সিউডো-প্রান্তিক পদ্ধতিগুলির মতো ঘনত্বের অনুমান করার সময় যা এর ব্যবহারকে চ্যালেঞ্জিং করে তোলে।

আরও চিন্তাভাবনা করার পরে, আমার উপসংহারটি এই যে এই সিরিজটি থেকে একটি প্রকৃত সিমুলেশন তৈরি করার মতো জেনেরিক পদ্ধতি নেই [বরং মিশ্রণ যেটি ভুল নাম হিসাবে দেখা যায়], সিরিজের উপাদানগুলিতে আরও> কাঠামো চাপিয়ে না রেখে, দেবরোয়ের বাইবেলের উপরের অ্যালগরিদম । প্রকৃতপক্ষে, যেহেতু বেশিরভাগ (?) ঘনত্বগুলি উপরের ধরণের ধারাবাহিক প্রসারণের অনুমতি দেয়, এটি অন্যথায় এক ধরণের সার্বজনীন সিমুলেশন মেশিনের অস্তিত্বকে বোঝায় ...


ধন্যবাদ! আমি অতিরিক্ত রেফারেন্স প্রশংসা করি।
8r8

1
খুব পুঙ্খানুপুঙ্খ প্রতিক্রিয়া এবং রেফারেন্সের জন্য অতিরিক্ত ধন্যবাদ। আমি এই উত্তরটি গ্রহণ করতে পেরে খুশি কারণ এটি থেকে সুনির্দিষ্ট সময় হিসাবে সঠিক নমুনা তৈরি করতে সফল হয় । আমি সম্ভবত কিছুটা হলেও সমস্যাটি নিয়ে ভাবতে থাকব; আমার কাছে কেবলমাত্র অতিরিক্ত ধারণাটি ছিল যা আশাব্যঞ্জক বলে মনে হয় তা হল নমুনা হিসাবে নমুনা দেখা , এবং কিছু জ্যামিতিক থাকতে পারে অন্তর্দৃষ্টি যা এই বৈশিষ্ট্যটির জন্য দরকারী (আমি তে স্লাইস স্যাম্পলারের মতো ভাবছি )। চিয়ার্স! pp=λgμhXgλgμh{(x,y):μh(x)<y<λg(x)}
8r8

1
আমি শর্তসাপেক্ষ নমুনাটি বেশ খারাপভাবে ব্যাখ্যা করেছি; সেট-ভিত্তিক বৈশিষ্ট্যটি কিছুটা পরিষ্কার (আমার মতে)। আমার মূল বক্তব্যটি হ'ল যদি আপনি চূড়ান্ত লাইনের দ্বি-মাত্রিক সেট থেকে একত্রে নমুনা করতে পারেন তবে এটি অনুসরণ করে যে স্থানাঙ্কের সঠিক বিতরণ রয়েছে। এই বৈশিষ্ট্যটি আর সমষ্টি ভিত্তিক অযৌক্তিক মিশ্রণের জন্য কার্যকর হতে পারে কিনা তা এখনও দেখার জন্য। (x,y)x
8r8

1
আমি একটি স্লাইস স্যাম্পেলার সম্পর্কেও ভাবছিলাম, তবে এটি সিমুলেশন অর্থে "সঠিক" নয়।
শি'য়ান

1

আমার কাজ করতে পারে এমন একটি ধারণার খসড়া রয়েছে। এটি সঠিক নয় , তবে আশাবাদী অসম্পূর্ণভাবে সঠিক। এটিকে সত্যিকারের কঠোর পদ্ধতিতে রূপান্তর করতে, যেখানে আনুমানিক নিয়ন্ত্রণ করা হয় বা এটির কিছু প্রমাণিত হতে পারে, সম্ভবত সেখানে প্রচুর কাজ প্রয়োজন।

প্রথমত, শি'আন দ্বারা উল্লিখিত হিসাবে আপনি একদিকে ধনাত্মক ওজন এবং অন্যদিকে নেতিবাচক ওজনকে গোষ্ঠীভুক্ত করতে পারেন, যাতে শেষ পর্যন্ত সমস্যাটির মাত্র দুটি বিতরণ হয় এবং :gh

p=λgμh

সঙ্গে । মনে রাখবেন যে আপনার কাছে ।λμ=1λ1

আমার ধারণাটি নিম্নলিখিত। আপনি থেকে নমুনা পর্যবেক্ষণ চান । না:Np

  • থেকে নমুনা মানগুলি এবং সেগুলি একটি তালিকায় সঞ্চয় করেλNg
  • থেকে নমুনাযুক্ত প্রতিটি মানগুলির জন্য , তাদের নিকটতম (অবশিষ্ট) প্রতিবেশীকে তালিকা থেকে সরিয়ে দিন।μNh

শেষে আপনি পয়েন্ট পাবেন। একেবারে নিকটতম প্রতিবেশী হওয়ার দরকার নেই , তবে কেবল একটি পয়েন্ট যা "যথেষ্ট কাছে"। প্রথম পদক্ষেপটি উত্পাদিত পদার্থের মতো। দ্বিতীয় ধাপটি এন্টিমেটার উত্পন্ন করার মতো এবং এটি সংঘর্ষে পড়ুন এবং পদার্থের সাথে বাতিল হতে দিন। এই পদ্ধতি সঠিক নয়, কিন্তু আমি বিশ্বাস করি, কিছু অবস্থার অধীনে, এটা এসিম্পটোটিকভাবে সঠিক বৃহৎ জন্য (এটা ছোট প্রায় সঠিক করতে আপনি একটি বড় ব্যবহার করতে হবে প্রথম এবং তারপর চূড়ান্ত তালিকায় একটি ছোট র্যান্ডম অংশ নিতে) । আমি একটি খুব অনানুষ্ঠানিক যুক্তি দিচ্ছি যা প্রমাণের চেয়ে বেশি ব্যাখ্যা।(λμ)N=NNnN

বিবেচনা করুন পর্যবেক্ষণ স্থান এবং একটি ছোট আয়তনের প্রায় Lebesgue ভলিউমের সাথে । থেকে স্যাম্পলিং পর , তালিকা উপাদান যে হয় সংখ্যা approximatively হয় । দ্বিতীয় পদক্ষেপের পরে, আনুমানিকভাবে এটি থেকে সরানো হবে এবং আপনি আনুমানিকভাবে পছন্দসই নম্বর । এর জন্য আপনাকে ধরে নিতে হবে যে ভলিউমের পয়েন্টগুলির সংখ্যা যথেষ্ট পরিমাণে বড়।xvxϵgvλNg(x)ϵμNh(x)ϵNp(x)ϵ

এই পদ্ধতিটি বৃহত মাত্রা বা এবং এর কিছু প্যাথলজিসমূহের বিরুদ্ধে প্রতিরোধ করার খুব কম সম্ভাবনা রয়েছে তবে এটি ছোট মাত্রা এবং পর্যাপ্ত মসৃণ, "পর্যাপ্ত অভিন্ন" বিতরণে কাজ করতে পারে।gh

একটি সঠিক পদ্ধতি সম্পর্কে নোট:

আমি প্রথমে এটি বিচ্ছিন্ন বিতরণের জন্য ভেবেছিলাম, এবং স্পষ্টভাবে সেই ক্ষেত্রে পদ্ধতিটি সঠিক নয়, যেহেতু এটি নমুনা তৈরি করতে পারে যার সম্ভাবনা 0 থাকে I আমার দৃ int় স্বীকৃতি আছে যে সীমাবদ্ধ প্রক্রিয়াজাতকরণের সময় দিয়ে একটি সঠিক পদ্ধতি সম্ভব নয়, এবং এটি এই অসম্ভবতা প্রমাণিত হতে পারে, কমপক্ষে পৃথক বিতরণের জন্য। গেমের নিয়ম হ'ল আপনাকে কেবলমাত্র এবং জন্য সঠিক "ওরাকল" স্যাম্পলার ব্যবহার করার অনুমতি দেওয়া হয়েছে তবে এবং ফাংশন হিসাবে এবং জানেন না । সরলতার জন্য বার্নোল্লি বিতরণে সীমাবদ্ধ। সঠিক পদ্ধতির অস্তিত্ব বার্নোল্লি কারখানার তত্ত্বের সাথে সম্পর্কিত : আপনি যদি একটি থেকে একটি তৈরি করতে পারতেনghghx(λpμq)p-coin এবং -coin, তাহলে আপনি একটি তৈরি করতে পারে নি A থেকে -coin -coin যার জন্য অসম্ভব হিসেবে পরিচিত ।qλppλ>1


1
আমি এটি বিবেচনা করেছি তবে এটি প্রত্যাখ্যান করেছি কারণ এটি প্রকাশের জন্য আমার প্রাথমিক প্রচেষ্টা কাজ করতে পারে তা উপলব্ধি করে যে এটি সর্বোপরি একটি সান্নিধ্য এবং সম্ভবত একটি দরিদ্র হয়ে উঠবে। হ্যাঁ, অসম্পূর্ণভাবে এটি কাজ করতে পারে, তবে এটি বিতরণ থেকে "সঠিক" নমুনা দেওয়ার জন্য ওপির অনুরোধটি পূরণ করবে না।
শুক্রবার

এই পদ্ধতির দক্ষতা হুবহু গ্রহণযোগ্য-প্রত্যাখ্যান পদ্ধতির মতো একই ক্রম।
শি'য়ান

1
একমত। তবু এগুলি বেশ আলাদা। গ্রহণ-প্রত্যাখ্যান পদ্ধতির জন্য ক্রিয়া হিসাবে এবং গণনা করা দরকার । আমি সত্যিকারের মিশ্রণের মতো "ওরাকল" স্যাম্পলার হিসাবে কেবলমাত্র এবং থেকে নমুনা ব্যবহারের দিকে মনোনিবেশ করেছি । আমি এটির যত বেশি চিন্তা করি, তত বেশি আমি নিশ্চিত হয়েছি যে স্যাম্পলিং ওরাকলগুলির উপর ভিত্তি করে একটি সঠিক পদ্ধতি উপস্থিত থাকতে পারে না। ghxgh
বেনোইট সানচেজ

1
আমি মনে করি যে সাধারণত সঠিক, কিন্তু বিশেষ ক্ষেত্রে যেখানে যেমন একটি সঠিক পদ্ধতির দরকারী শ্রেণীর হতে পারে না বিদ্যমান। কারণ (1) কিছু ক্ষেত্রে গণনা সহজ এবং (2) আপনাকে এবং উভয়ই গণনা করার দরকার নেই - আপনাকে কেবল এই অনুপাতটি গণনা করতে হবে। g/(g+h)gh
whuber

@ বেনোইটসানচেজ আপনার গভীর উত্তরের জন্য আপনাকে ধন্যবাদ; আমি বিশেষত (সম্ভাব্য) নির্ভুলতার অসম্ভবতা সম্পর্কে শেষে মন্তব্যগুলির প্রশংসা করি। আমি অতীতে বার্নোল্লি কারখানাগুলি পেরিয়ে এসেছি এবং সেগুলি বেশ চ্যালেঞ্জিং পেয়েছি; আমি বিষয়টি পুনরায় দেখার চেষ্টা করব এবং এটি কোনও অন্তর্দৃষ্টি দেয় কিনা তা দেখুন।
8r8
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.