একটি সরলতম থেকে অভিন্ন নমুনা


29

আমি এন এলোমেলো সংখ্যার অ্যারে তৈরির জন্য একটি অ্যালগরিদমের সন্ধান করছি, যেমন এন সংখ্যাগুলির যোগফল 1 এবং সমস্ত সংখ্যা 0 এবং 1 এর মধ্যে থাকে lie উদাহরণস্বরূপ, এন = 3, র্যান্ডম পয়েন্ট (x, y, z) ত্রিভুজের মধ্যে থাকা উচিত:

x + y + z = 1
0 < x < 1
0 < y < 1
0 < z < 1

আদর্শভাবে আমি এই অঞ্চলের প্রতিটি পয়েন্টের সমান সম্ভাবনা থাকতে চাই। যদি এটি খুব কঠিন হয় তবে আমি প্রয়োজনীয়তাটি ফেলে দিতে পারি। ধন্যবাদ।


লক্ষ্য বিতরণ কি? আপনি কি চেষ্টা করেছেন?
রাফায়েল

3
মনে রাখবেন যে সর্বদা প্রত্যাখ্যানের নমুনা রয়েছে : নমুনা ইউনিফর্ম সংখ্যা এবং যদি সংখ্যা 1 পর্যন্ত যোগ না করে তবে প্রত্যাখ্যান করুন । এখানে, পুনরাবৃত্তির প্রত্যাশিত সংখ্যা অস্বস্তিকরভাবে বেশি, সুতরাং আপনার অন্য কিছু করা উচিত। n1
রাফায়েল

উত্তর:


28

আসুন প্রথমে ধরে নিই যে আপনি এর মধ্যে নমুনা নিতে চান

x + y + z = 1
0 ≤ x ≤ 1
0 ≤ y ≤ 1
0 ≤ z ≤ 1

এটি কোনও তাত্পর্যপূর্ণ হয় না, যেহেতু নমুনা পয়েন্টটি এখনও আপনার সম্ভাব্য ক্ষেত্রটিতে উচ্চ সম্ভাবনার সাথে থাকবে area

এখন আপনি একটি সরলিকাস থেকে একটি পয়েন্ট নমুনা দিয়ে বাকি । 3 ডি উদাহরণে আপনি 3 ডি তে উপলব্ধ একটি 2 ডি সিমপ্লেক্স (ত্রিভুজ) পান।

এলোমেলোভাবে কীভাবে এক পয়েন্ট বাছাই করা যায় তা এই ব্লগ পোস্টে আলোচনা করা হয়েছিল (মন্তব্যগুলি দেখুন)।

আপনার সমস্যার জন্য এটির অর্থ আপনি বিরতি ( 0 , 1 ) থেকে 1 - 1 এলোমেলো নম্বর নিয়েছেন , তারপরে আপনি এন + 1 সংখ্যার একটি তালিকা পেতে 0 এবং 1 যুক্ত করেন । আপনি তালিকাটি সাজান এবং তারপরে আপনি পর পর দুটি উপাদানগুলির মধ্যে পার্থক্য রেকর্ড করেন। এটি আপনাকে এন সংখ্যার একটি তালিকা দেয় যা মোটামুটি 1 হবে । তাছাড়া এই নমুনাটি অভিন্ন। এই ধারণাটি ডোনাল্ড বি রুবিনে পাওয়া যাবে, দ্য বায়সিয়ান বুটস্ট্র্যাপ আন। পরিসংখ্যানবিৎ। 9, 1981, 130-134।n1(0,1)01n+1n1

উদাহরণস্বরূপ ( ) আপনার কাছে তিনটি এলোমেলো সংখ্যা রয়েছে তারপরে আপনি সাজানো ক্রমটি পাবেন এবং এটি পার্থক্য দেয় এবং নির্মাণের মাধ্যমে এই চারটি সংখ্যা 1 পর্যন্ত যোগফল।n=40.4 0.2 0.10 0.1 0.2 0.4 10.1 0.1 0.2 0.6

আরেকটি পদ্ধতির নিম্নলিখিতটি হ'ল হাইপারকিউব থেকে প্রথম নমুনা (যা আপনি ভুলে গেছেন x+y+z=1) এবং তারপরে নমুনা বিন্দুকে স্বাভাবিক করুন। সাধারণীকরণ হ'ল হাইপারকিউব থেকে ডি - ১- সিমপ্লেক্সে প্রক্ষেপণ । এটি স্বজ্ঞাতভাবে পরিষ্কার হওয়া উচিত যে সিমপ্লেক্সের কেন্দ্রে অবস্থিত পয়েন্টগুলির বাইরের চেয়ে বেশি "প্রাক-চিত্র-পয়েন্ট" রয়েছে-1 । অতএব, আপনি যদি হাইপারকিউব থেকে সমানভাবে নমুনা করেন তবে এটি আপনাকে সিমপ্লেক্সে অভিন্ন নমুনা দেয়। তবে, যদি আপনি হাইপারকিউব থেকে একটি উপযুক্ত এক্সপোনেনশিয়াল ডিস্ট্রিবিউশন সহ নমুনা করেন তবে এই প্রভাবটি বাতিল হয়ে যায়। চিত্রটি আপনাকে ধারণা দেয় যে উভয় পদ্ধতি কীভাবে নমুনা দেবে। তবে, "সর্টিং" পদ্ধতিটি এর সাধারণ ফর্মের কারণে আমি পছন্দ করি। এটি প্রয়োগ করাও সহজ।

দুটি নমুনা পদ্ধতির উদাহরণ


আমি নিষ্পাপ ধারণাটি অনুমান করি - ( 0 , 1 ) থেকে সংখ্যাগুলি আঁকুন এবং স্বাভাবিক করুন - ত্রুটিযুক্ত। n(0,1)
রাফায়েল

আমি আপনার প্রশ্নটি বর্ধিত উত্তরে সম্বোধন করেছি।
স্কুলজ

1
একটি সাধারণ প্রমাণ আছে যা দেখায় যে বাছাই করা একটি অভিন্ন বিতরণ দেয়? আমার সম্ভাব্যতার মধ্যে কেবল প্রাথমিক ব্যাকগ্রাউন্ড রয়েছে তাই কাগজটি আমার মাথার উপরে।
চাও শো

5
n(0,1)nn1(0,1)

1
@ ওরিয়েন্ট: দয়া করে আপনাকে একটি আলাদা পোস্টে প্রশ্ন জিজ্ঞাসা করুন এবং এর জন্য মন্তব্যগুলির অপব্যবহার করবেন না।
এ.সুলজ

8

এটি বিদ্যমান উত্তরগুলিতে যুক্ত করা।

দেবরোয়ে এই ধরণের প্রশ্নের জন্য একটি দুর্দান্ত রেফারেন্স। অধ্যায় 7 ইউনিফর্ম অর্ডার পরিসংখ্যান তৈরি করতে প্রয়োজনীয় অ্যালগরিদম দেয় যা ওপি পরে রয়েছে।

অভিন্ন অর্ডার পরিসংখ্যান উত্পন্ন করার জন্য, [ 0 , 1 ] এর নমুনা বাছাই করা করবে। এই পদ্ধতির O ( n লগ এন ) সময় নেয়। একটি দ্রুত উপায় (পুস্তকে উপলভ্য) একটি x পি ( 1 ) পিডিএফ থেকে এন র্যান্ডম সংখ্যা x 1 , , x এন নমুনা জড়িত । (এগুলি spacings অভিন্ন PDF এর)। তারপরে, মানগুলি ( y i ) 1 i ≤ প্রদান করুন ≤n[0,1]O(nlogn)nx1,,xnExp(1) যা স্বয়ংক্রিয়ভাবে সাজানো হয়, এহে()সময় সামগ্রিক। (আমি এ.এস.শুলজের উত্তরটি এখানে পরিলক্ষিত করছি - কেবল গণনা আরও সুস্পষ্ট করে তুলছি)।

(yi)1in=1ixj1nxj
O(n)

উপরে কোনও অ-ইউনিফর্ম পিডিএফ নমুনা করার জন্য বিপরীত সিডিএফ স্যাম্পলিংয়ের মাধ্যমে একই পদ্ধতির সাথে অভিযোজিত হতে পারে । একটি কৌশল আছে যা আপনাকে ক্যানোনিকাল সিমপ্লেক্স (অন্য 2 x + 3 y + z = 5 বলে ) ব্যতীত অন্য একটি সিম্পলেক্সের উপর সমানভাবে নমুনা তৈরি করতে সক্ষম করে ।[0,1]2x+3y+z=5


যদি আমি এখানে উত্তরটি অনুসরণ করি: স্ট্যাকওভারফ্লো / প্রশ্নগুলি / ২১০503০৩/২ তারপরে তাত্পর্যপূর্ণ বিতরণ থেকে এলোমেলো সংখ্যা উত্পন্ন করার জন্য লোগারিদমকে মূল্যায়ন করা জড়িত যা কিছুটা ধীর হতে পারে।
আর zu

3
X[0] = 0
for i = 1 to N-1
    X[i] = uniform(0,1)
X[n] = 1
sort X[0..N]
for i = 1 to N
    Z[i] = X[i] - X[i-1]
return Z[1..N]

এখানে, uniform(0,1)0 এবং 1 এর মধ্যে স্বতন্ত্রভাবে এবং সমানভাবে বিতরণ করা হয় এমন একটি আসল নম্বর প্রদান করে।


5
এটি ব্যাখ্যা ছাড়াই কোডে এ। শুলজের উত্তর, তাই না?
রাফেল

1

এই কাগজটি দেখুন : ইউনিট সিমপ্লেক্স থেকে স্মিথ, এন এবং ট্রাম্বল, আর ।


2
দয়া করে আপনার উত্তরটি একটি পঠনযোগ্য উপায়ে ফর্ম্যাট করুন: আপনি মানুষের জন্য লিখছেন, বাইবেটেক্স সংকলক নয়। এছাড়াও, যদি কাগজটি অনলাইনে পাওয়া যায় তবে আপনার লিঙ্ক সরবরাহ করা এটি আরও কার্যকর।
ডেভিড রিচারবি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.