কাটা বিতরণ বলতে কী বোঝায়?


14

গতিশীল সিস্টেমের একটি সাধারণ ডিফারেনশিয়াল সমীকরণ মডেলের সংবেদনশীলতা বিশ্লেষণ সম্পর্কে গবেষণা নিবন্ধে, লেখক একটি সাধারণ মডেল প্যারামিটারকে সাধারণ বিতরণ হিসাবে অর্থ প্রদান করে (যার অর্থ = 1e-4, std = 3e-5) এই পরিসীমাটি কেটে দেওয়া হয়েছে [0.5e -4 1.5e-4]। তারপরে তিনি মডেলটির সিমুলেশনের জন্য এই কাটা বিতরণ থেকে নমুনা ব্যবহার করেন। এই কেটে দেওয়া বিতরণ থেকে কাটা বিতরণ এবং নমুনা থাকার অর্থ কী?

আমি এটি করার দুটি উপায় নিয়ে আসতে পারি:

  • একটি সাধারণ বিতরণ থেকে নমুনা তবে সিমুলেশনের আগে নির্দিষ্ট রেঞ্জের বাইরে পড়া সমস্ত এলোমেলো মানগুলি উপেক্ষা করুন।
  • কোনওভাবে একটি বিশেষ "কাটা সাধারণ" বিতরণ পান এবং এটি থেকে নমুনা পান।

এই বৈধ এবং সমতুল্য পদ্ধতির হয়?

আমি প্রথম ক্ষেত্রে বিশ্বাস করি, যদি এক নমুনা পরীক্ষামূলক সিডিএফ / পিডিএফ প্লটে বিভক্ত ছিল, এটা একটি সাধারণ বন্টনের মত দেখাচ্ছে না কারণ রেখাচিত্র পর্যন্ত সম্প্রসারিত নয় এবং ±

উত্তর:


16

কোনও বিতরণকে ছাঁটাই করা হ'ল এর মানগুলিকে একটি বিরতিতে সীমাবদ্ধ করা এবং ঘনত্বটিকে পুনরায় স্বাভাবিক করা যাতে সেই ব্যাপ্তির উপরের অবিচ্ছেদ্য 1 হয়।

সুতরাং, অগ্রভাগ ছাঁটিয়া করার একটি বিরতি বিতরণের ( একটি , ) একটি এলোপাতাড়ি ভেরিয়েবলের ঘনত্ব আছে যে এটি হবেN(μ,σ2)(a,b)

pa,b(x)=ϕμ,σ2(x)abϕμ,σ2(y)dyI{x(a,b)}

যেখানে হ'ল এন ( μ , σ 2 ) ঘনত্ব। আপনি এই ঘনত্ব থেকে বিভিন্ন উপায়ে নমুনা নিতে পারেন। এটি করার একটি উপায় (সহজ উপায় আমি এটি ভাবতে পারি) হ'ল এন ( μ , σ 2 ) মান উত্পন্ন করা এবং ( , ) এর বাইরে যেগুলি পড়ে সেগুলি নিক্ষেপ করা wouldϕμ,σ2(x)N(μ,σ2)N(μ,σ2)(একটি,)বিরতি, যেমন আপনি উল্লেখ করেছেন। সুতরাং, হ্যাঁ, আপনি তালিকাভুক্ত দুটি গুলি একই লক্ষ্য অর্জন করবে। এছাড়াও, আপনি সঠিক যে, এই বন্টন থেকে ভেরিয়েবল গবেষণামূলক ঘনত্ব (অথবা হিস্টোগ্রাম) প্রসারিত করবে না হয় । এটি অবশ্যই ( , ) এর মধ্যে সীমাবদ্ধ থাকবে ।±(a,b)


17

সাধারণ বিতরণ থেকে সিমুলেট করা ফলাফল অবধি বিরতি না হওয়া অবধি ( , ) ভাল থাকে যখন সম্ভাবনা ϱ = বি φ μ , σ 2 ( এক্স )N(μ,σ2)(a,b) যথেষ্ট বড়। যদি খুবই ছোট, এই পদ্ধতি খুবই ব্যয়বহুল যেহেতু গড় সংখ্যা স্বপক্ষে এক গ্রহণযোগ্যতা জন্য হয় 1 / ρ

ϱ=abφμ,σ2(x)dx
1/ϱ

মন্টি কার্লো স্ট্যাটিস্টিকাল পদ্ধতিতে (অধ্যায় 2, উদাহরণ 2.2) এবং সেইসাথে আমার আরএক্সিভ পেপারে বর্ণিত হিসাবে , এই কাটা সাধারণটির অনুকরণের আরও কার্যকর উপায় হ'ল এক্সোনেনশিয়াল বিতরণের উপর ভিত্তি করে একটি গ্রহণযোগ্য-প্রত্যাখ্যান পদ্ধতি ব্যবহার করা ।E(α)

সাধারণতার ক্ষতি ছাড়াই বিবেচনা করুন, কেস μ=0 এবং । যখন = + + , একটি সম্ভাব্য যান্ত্রিক বন্টন অনূদিত সূচকীয় বণ্টনের হয় ( α , একটি ) , ঘনত্ব গ্রাম α ( z- র ) = α - α ( z- র - একটি )σ=1b=+E(α,a) অনুপাত পি , ( জেড ) / জি α ( জেড ) - α ( জেড - )- জেড

gα(z)=αeα(za)Iza.
তারপর দ্বারা বেষ্টিত Exp(α 2 /2-αএকটি) যদিα>একটিদ্বারাeXP(-একটি 2 /2) অন্যথায়। সংশ্লিষ্ট (উপরের) আবদ্ধ হয়
pa,(z)/gα(z)eα(za)ez2/2
exp(α2/2αa)α>aexp(a2/2) প্রথমপ্রকাশটি=1দ্বারা হ্রাস করা হয়
{1/αexp(α2/2αa)if α>a,1/αexp(a2/2)otherwise.
যেখানে ˜ α = একটি দ্বিতীয় গণ্ডিকে ছোট করে। Α এর সর্বোত্তম পছন্দটিতাই (1)।
α=12a+12a2+4,(1)
α~=aα

2
আমি কিছু মিস করছি, তবে কেবল ইউ - ইউনিফ ( Φ ( ) নেওয়ার ক্ষেত্রে কী দোষ রয়েছে ,UUnif(Φ(a),Φ(b))X=Φ1(U)

2
a0

1
সিয়ান ঠিক বলেছেন, @ বিনাউল। qnormআর লুপে চালানো কোনও ভাল ধারণা নয়।
স্টাফেন লরেন্ট

@ শিয়ান: এটি সত্য, তবে এই জাতীয় ফাংশনগুলি নির্বিচারে নির্ভুলতার জন্য ডিজাইন করতে পারে।
নীল জি

9

একটি সাধারণ বিতরণ থেকে নমুনা তবে সিমুলেশনের আগে নির্দিষ্ট রেঞ্জের বাইরে পড়া সমস্ত এলোমেলো মানগুলি উপেক্ষা করুন।

এই পদ্ধতিটি সঠিক, তবে @ জিয়ান তার উত্তরে যেমন উল্লেখ করেছেন, এটি দীর্ঘ সময় নিতে হবে যখন পরিসরটি ছোট হয় (আরও স্পষ্টভাবে, যখন এর পরিমাপটি সাধারণ বন্টনের অধীনে ছোট হয়)।

F1(U)FUUnif(0,1)FG(a,b)G1(U)UUnif(G(a),G(b))

G1G1GG1abG

গুরুত্বের নমুনা ব্যবহার করে একটি কাটা বিতরণ সিমুলেট করুন

N(0,1)GGG(q)=arctan(q)π+12G1(q)=tan(π(q12))

UUnif(G(a),G(b))G1(U)tan(U)UUnif(arctan(a),arctan(b))

a <- 1
b <- 5
nsims <- 10^5
sims <- tan(runif(nsims, atan(a), atan(b)))

xiϕ(x)/g(x)

w(x)=exp(x2/2)(1+x2),
log_w <- -sims^2/2 + log1p(sims^2)
w <- exp(log_w) # unnormalized weights
w <- w/sum(w)

(xi,w(xi))[u,v]

u <- 2; v<- 4
sum(w[sims>u & sims<v])
## [1] 0.1418

এটি লক্ষ্যমাত্রামূলক ক্রিয়াকলাপের একটি অনুমান সরবরাহ করে। আমরা দ্রুত spatsatপ্যাকেজটি দিয়ে এটি প্লট করতে পারি :

F <- spatstat::ewcdf(sims,w)
# estimated F:
curve(F(x), from=a-0.1, to=b+0.1)
# true F:
curve((pnorm(x)-pnorm(a))/(pnorm(b)-pnorm(a)), add=TRUE, col="red")

ewcdf

# approximate probability of u<x<v:
F(v)-F(u)
## [1] 0.1418

(xi)

msample <- rmultinom(1, nsims, w)[,1]
resims <- rep(sims, times=msample)
hist(resims) 

hist

mean(resims>u & resims<v)
## [1] 0.1446

অন্য একটি পদ্ধতি: দ্রুত বিপরীত রূপান্তর নমুনা

অলিভার এবং টাউনসেন্ড বিস্তৃত শ্রেণিবিন্যাসের বন্টনের জন্য একটি নমুনা পদ্ধতি তৈরি করেছিল। এটা তোলে বাস্তবায়িত হয় মতলব জন্য chebfun2 গ্রন্থাগার সেইসাথে জুলিয়া জন্য ApproxFun গ্রন্থাগার । আমি সম্প্রতি এই লাইব্রেরিটি আবিষ্কার করেছি এবং এটি খুব আশাব্যঞ্জক মনে হচ্ছে (কেবল এলোমেলো নমুনার জন্য নয়)। মূলত এটি বিপরীত পদ্ধতি তবে সিডিএফ এবং বিপরীত সিডিএফ এর শক্তিশালী অনুমান ব্যবহার করে। ইনপুট হ'ল সাধারনকরণ পর্যন্ত লক্ষ্য ঘনত্বের কার্য।

নমুনাটি কেবল নিম্নলিখিত কোড দ্বারা উত্পন্ন হয়:

using ApproxFun
f = Fun(x -> exp(-x.^2./2), [1,5]);
nsims = 10^5;
x = sample(f,nsims);

[2,4] পূর্বে গুরুত্বের নমুনা দ্বারা প্রাপ্তটির নিকটে:

sum((x.>2) & (x.<4))/nsims
## 0.14191
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.