পরিসংখ্যানমূলক সিমুলেশন ব্যাখ্যা

10

আমি কোনও পরিসংখ্যানবিদ নই। সুতরাং, দয়া করে আমার কোনও ভুল থাকলে তা সহ্য করুন।

সিমুলেশন কীভাবে হয় তা আপনি একটি সহজ পদ্ধতিতে ব্যাখ্যা করতে পারেন? আমি জানি যে এটি একটি সাধারণ বিতরণ থেকে কিছু এলোমেলো নমুনা বেছে নেয় এবং অনুকরণের জন্য ব্যবহার করে। তবে, পরিষ্কার বুঝতে পারছি না।

simulation

— অদ্ভুত
সূত্র

11

কি সিমুলেট করে ?! :-)

— chl

ঠিক নিটপিকিং করা, তবে কখনও কখনও প্রশ্নগুলি প্রশ্নকারীকে নিরুৎসাহিত করে, এবং এটি এরকম একটি ঘটনা।

— amit

1

@ ফায়েদরাস কি এটি আমার অভিপ্রায় সম্পর্কে একটি মন্তব্য? যদি তা হয় তবে উপরের প্রশ্ন থেকে আপনি কী বুঝেছেন তা ব্যাখ্যা করতে পার?

— chl

এই সিভি প্রশ্নটিও আগ্রহী হতে পারে: স্নাতক স্তরে পরিসংখ্যান সংক্রান্ত ধারণাটি আরও ভালভাবে বুঝতে কম্পিউটার সিমুলেশনগুলি ব্যবহার করা ।

— গুং - মনিকা পুনরায়

27

পরিসংখ্যানগুলিতে, সিমুলেশনটি কোনও পদ্ধতির কার্যকারিতা মূল্যায়নের জন্য ব্যবহৃত হয়, সাধারণত যখন তাত্ত্বিক পটভূমির অভাব থাকে। সিমুলেশনগুলির সাথে, পরিসংখ্যানবিদ সত্যটি জানেন এবং নিয়ন্ত্রণ করেন ।

বিভিন্ন পরিস্থিতিতে সিমুলেশন সুবিধাজনকভাবে ব্যবহৃত হয়। এর মধ্যে রয়েছে নমুনা বিতরণগুলির অনুশীলনমূলক অনুমান প্রদান, পরিসংখ্যান পদ্ধতিতে অনুমানের ভুল ব্যাখ্যা করা অধ্যয়ন, অনুমানের পরীক্ষায় শক্তি নির্ধারণ ইত্যাদি includes

সিমুলেশন অধ্যয়ন অনেক কঠোরতার সাথে ডিজাইন করা উচিত। বার্টন এট আল। (2006) তাদের গবেষণাপত্রে ' মেডিকেল স্ট্যাটিস্টিকসে সিমুলেশন স্টাডির নকশা ' খুব সুন্দর একটি ওভারভিউ দিয়েছে । বিভিন্ন পরিস্থিতিতে পরিচালিত সিমুলেশন অধ্যয়নগুলি রেফারেন্সগুলিতে পাওয়া যেতে পারে।

সরল উদাহরণস্বরূপ উদাহরণ লিনিয়ার মডেলটি বিবেচনা করুন

y = μ + β * x + ϵ

$y = \mu + \beta * x + \epsilon$

যেখানে হ'ল বাইনারি কোভারিয়েট ( বা ), এবং । আর তে সিমুলেশন ব্যবহার করে আসুন এটি পরীক্ষা করে দেখি $x$ $x=0$ $x=1$ $\epsilon \sim \mathcal{N}(0, \sigma^2)$

E (\hat{β}) = β .

$E(\hat{\beta}) = \beta.$

> #------settings------
> n <- 100            #sample size                          
> mu <- 5             #this is unknown in practice                         
> beta <- 2.7         #this is unknown in practice
> sigma <- 0.15       #this is unknown in practice
> #--------------------
> 
> #------set the seed so that this example can be replicated------
> set.seed(937)
> #---------------------------------------------------------------
>
> #------generate 1000 data sets and store betaHat------
> betaHat <- numeric(1000)
> for(i in 1:1000)
+ {
+     #generate the binary covariate --> n Bernoulli trials
+   x <- sample(x=c(0, 1), size=n, replace=TRUE, prob=c(0.5, 0.5))
+     #generate the errors
+   epsilon <- rnorm(n=n, mean=0, sd=sigma)
+     #form the response variable      
+   y <- mu + beta * x + epsilon 
+     #the ith generated data set
+   data_i <- data.frame(y=y, x=x)
+     #fit the model
+   mod <- lm(y~x, data=data_i)
+     #store the estimate of beta
+   betaHat[i] <- as.numeric(coef(mod)[2])     
+ }    
> #-----------------------------------------------------
> 
> #------E(betaHat) = beta?------
> mean(betaHat)
[1] 2.698609
> #------------------------------

দ্রষ্টব্য : উপরে উল্লিখিত কাগজের জন্য সম্পাদকের কাছে একটি চিঠি রয়েছে ।

— ocram
সূত্র

9

প্রথমত, পরিসংখ্যানগুলিতে অনেকগুলি, বিভিন্ন ধরণের সিমুলেশন রয়েছে এবং আশেপাশের ক্ষেত্রগুলিতে আরও অনেক কিছু। "সিমুলেশন" বলা কেবল "মডেল" বলার মতোই দরকারী - এটি বলতে খুব বেশি কিছু হয় না।

আপনার বাকি প্রশ্নের উপর ভিত্তি করে, আমি অনুমান করতে যাচ্ছি আপনি মন্টে কার্লো সিমুলেশন বলতে চাইছেন, তবে এটি কিছুটা অস্পষ্টও। মূলত, যা হয় তা আপনি বারবার কোনও বিতরণ থেকে নমুনা আঁকেন (এটি স্বাভাবিক হওয়ার দরকার নেই) যাতে পরিচিত, তবে এলোমেলো, বৈশিষ্ট্যযুক্ত একটি কৃত্রিম জনসংখ্যার উপর কিছু পরিসংখ্যান বিশ্লেষণ করার জন্য।

এর উদ্দেশ্য দুটি বিভাগে পড়ে যায়:

আমার পদ্ধতি এক্স পরিচালনা করতে পারবেন? : মূলত, আপনি একটি নতুন "সঠিক" উত্তর দিয়ে অনেক এলোমেলো জনসংখ্যার একটি সিরিজ অনুকরণ করছেন তা জানতে আপনার নতুন কৌশলটি আপনাকে সঠিক উত্তর দিয়েছে কিনা তা সঠিক উত্তর বলেছে। একটি মৌলিক উদাহরণ হিসাবে, যাক আপনি দুটি ভেরিয়েবল, এক্স এবং ওয়াইয়ের মধ্যে পারস্পরিক সম্পর্ককে পরিমাপ করার একটি নতুন পদ্ধতি বলে মনে করেন যা আপনি বিকাশ করেছেন তা নির্ধারণ করুন। আপনি দুটি ভেরিয়েবল অনুকরণ করতে পারবেন যেখানে Y এর মান X এর মানের উপর নির্ভরশীল কিছু এলোমেলো শব্দ। উদাহরণস্বরূপ, Y = 0.25x + গোলমাল। এরপরে আপনি এক্স এর কিছু এলোমেলো মানের সাথে একটি জনসংখ্যার তৈরি করতে চান, ওয়াই এর কিছু মান যা 0.25x + একটি এলোমেলো সংখ্যা, সম্ভবত অনেক হাজার হাজার বার, এবং তারপরে দেখান যে, গড়ে আপনার নতুন কৌশলটি একটি সংখ্যাকে আলাদা করে দেয় Y = 0.25x যথাযথভাবে দেখায়।

তাহলে কি হবে? বিদ্যমান অধ্যয়নের সংবেদনশীলতা বিশ্লেষণ হিসাবে সিমুলেশন করা যেতে পারে। উদাহরণস্বরূপ বলি যে আমি একটি সমীক্ষা গবেষণা চালিয়েছি, তবে আমি জানি আমার এক্সপোজারের পরিমাপ খুব ভাল নয়। এটি আমার প্রজেক্টের 30% হওয়া উচিত না হওয়ার সাথে সাথে ভুলভাবে শ্রেণিবদ্ধ করে এবং আমার বিষয়গুলির 10% অব্যবহৃত হিসাবে শ্রেণিবদ্ধ করে যখন তা না হওয়া উচিত। সমস্যাটি হ'ল আমার আরও ভাল পরীক্ষা নেই, তাই কোনটি কোনটি তা আমি জানি না।

আমি আমার জনসংখ্যা নেব এবং প্রতিটি উন্মুক্ত বিষয়কে অব্যক্ত অবস্থায় স্যুইচ করার 30% সুযোগ এবং প্রতিটি অনির্বাচিত বিষয়কে 10% এক্সপোজডে স্যুইচ করার সুযোগ দেব। আমি তখন হাজার হাজার নতুন জনসংখ্যা তৈরি করব, এলোমেলোভাবে কোন বিষয়গুলি স্যুইচ করবে তা নির্ধারণ করে আমার বিশ্লেষণটি আবার চালিত করব। এই ফলাফলগুলির পরিসীমাটি যদি আমি প্রত্যেককে সঠিকভাবে শ্রেণিবদ্ধ করতে পারি তবে আমার অধ্যয়নের ফলাফল কতটা পরিবর্তিত হতে পারে তার একটি ভাল অনুমান দেবে।

আপনি যতটা খনন করতে চান তার উপর নির্ভর করে অবশ্যই যথাক্রমে বৃহত্তর জটিলতা, উপকরণ এবং সিমুলেশনের ইউটিলিটি রয়েছে।

— Fomite
সূত্র

১. সুতরাং আপনি নিজের উত্তরে যা ব্যাখ্যা করেছেন তা মন্টে-কার্লো সিমুলেশন? ২) পরিসংখ্যানগুলিতে ব্যবহৃত অন্য ধরণের সিমুলেশন (মন্টে-কার্লো ব্যতীত) কি আছে?

— vasili111

5

তাত্ত্বিক অবস্থার অধীনে বাস্তব প্রক্রিয়াগুলি দেখার জন্যও সিমুলেশন ব্যবহার করা যেতে পারে, যেখানে এই প্রক্রিয়াগুলির ননলাইনার ইনপুট থাকে। উদাহরণস্বরূপ, একটি উত্পাদনকারী সংস্থা অতিরিক্ত উত্পাদন লাইন যুক্ত করা ব্যয়বহুল কিনা সে বিষয়ে আগ্রহী হতে পারে, কলারদের জন্য সময়-কাতারেখা এবং বাল্কিং হার কমানোর জন্য অপারেটরগুলির কাছাকাছি কলগুলি কীভাবে চালাবেন সে বিষয়ে একটি কল সেন্টার আগ্রহী হতে পারে, একটি জরুরি বিভাগও পারে কীভাবে সর্বোত্তম কর্মচারী এবং রোগীদের স্থানান্তর করা যায় সে বিষয়ে আগ্রহী হন বা কোনও শিপিং বন্দর তার ধারক অপারেশনগুলি বিন্যাসের সবচেয়ে দক্ষ উপায়ের বিষয়ে আগ্রহী হতে পারে। এই ইভেন্টগুলির মডেল করার জন্য আলাদা ইভেন্টের সিমুলেশন ব্যবহার করা যেতে পারে এবং "কী হলে" টাইপ করা প্রশ্নের উত্তর দেওয়ার জন্য প্যারামিটারগুলি সামঞ্জস্য করা যায়।

সিমুলেশনে আগ্রহের আরেকটি ক্ষেত্র হ'ল জটিল ব্যবস্থা। বিশেষত সামাজিক বিজ্ঞানে, এজেন্ট-ভিত্তিক সিমুলেশন একটি আকর্ষণীয় ধরণের সিমুলেশন যা আরও বেশি প্রবক্তাদের একত্রিত করতে শুরু করে। এজেন্ট-ভিত্তিক সিমুলেশনে এজেন্টদের (যেমন স্বতন্ত্র ব্যক্তি) ব্যক্তিত্বের মতো বৈশিষ্ট্য দেওয়া হয় এবং একে অপরের সাথে যোগাযোগ করা হয়, সুতরাং এটি বিশৃঙ্খলাবদ্ধ ব্যবস্থার মডেল। এজেন্ট-ভিত্তিক সিমুলেশন একে অপরের চারপাশের এজেন্টগুলির প্রভাব দেখায় এবং এফেক্ট-এ-এ-দুরত্বকে অন্তর্ভুক্ত করা যায়। যদিও আমি নিজে কোনও এজেন্ট-ভিত্তিক সিমুলেশনগুলি করি নি, আমি দেখেছি এটি সময়ের সাথে সাথে প্রাগৈতিহাসিক সম্প্রদায়ের জনসংখ্যার আকারের ভৌগলিক বিস্তার হিসাবে মডেল সিস্টেমগুলিতে ব্যবহৃত হয়েছিল।

— মিশেল
সূত্র

আপনি কিছু উদাহরণ প্রদান করতে পারেন?

— vasili111

আমি নিশ্চিত না যে আপনি কয়েকটি উদাহরণ দিয়ে কী বোঝাতে চাইছেন। আমি আমার প্রথম অনুচ্ছেদে কিছু উদাহরণ দিয়েছি।

— মিশেল

2

অনুকরণটি সিউডো-র্যান্ডম জেনারেটর (উদাহরণস্বরূপ, রনরমের মতো একটি সাধারণ জেনারেটর) ব্যবহার করে একটি পরিসংখ্যানগত নমুনা অন্তর্নিহিত এলোমেলোতা পুনরুত্পাদন করে এবং একটি পরিসংখ্যান পদ্ধতির বিতরণ সম্পর্কে অনুমান করার জন্য সিউডো-এলোমেলো প্রজন্মের পুনরুত্পাদনযোগ্যতা ব্যবহার করে মূল নমুনা প্রয়োগ। $x_1,\ldots,x_n$

সিমুলেশন-ভিত্তিক পরিসংখ্যানকৌশলটির একটি বিশেষ গুরুত্বপূর্ন উদাহরণটি এফ্রন (1979) দ্বারা প্রবর্তিত বুটস্ট্র্যাপের সাথে যুক্ত । একটি নমুনা দেওয়া , গবেষণামূলক সিডিএফ হয় একটি রূপান্তরকারী ( ) সত্য সিডিএফ, । সুতরাং, উপর নির্ভর করে যে কোনও পরিমাণ , উদাহরণস্বরূপ একটি প্রত্যাশা, , বা একটি পরিসংখ্যান এর বিতরণ, এর অধীনে সংশ্লিষ্ট পরিমাণের দ্বারা প্রায় অনুমান করা যায় $x_1,\ldots,x_n$

{\hat{F}}_{n} (x) = \frac{1}{n} \sum_{i = 1}^{n} I_{x_{i} \leq x}

$\hat F_n(x) = \frac{1}{n}\sum_{i=1}^n \mathbb{I}_{x_i\le x}$

n

$n$

F

$F$

F

$F$

E_{F} [h (X)]

$\mathbb{E}_F[h(X)]$

ψ (X_{1}, \dots, X_{n})

$\psi(X_1,\ldots,X_n)$

{\hat{F}}_{n}

$\hat F_n$ । যা কেবল বিশেষ ক্ষেত্রে বাদে সিমুলেশন দ্বারা মূল্যায়ন করা যেতে পারে। উদাহরণস্বরূপ, অনুমানকারী হিসাবে বুটস্ট্র্যাপ দ্বারা করা যেতে পারে: samples থেকে নমুনার প্রতিলিপি করুন এবং পার্থক্যটি গণনা করুন এটি পক্ষপাতদুটির একটি অনুকরণযুক্ত বুটস্ট্র্যাপ মূল্যায়ন উত্পন্ন করে।

{\hat{σ}}_{n}^{2} (x_{1}, \dots, x_{n}) = \frac{1}{n + 1} \sum_{i = 1}^{n} (x_{i} - \bar{x})^{2}

$\hat \sigma^2_n (x_1,\ldots,x_n) = \frac{1}{n+1} \sum_{i=1}^n (x_i-\bar x)^2$

σ^{2} = {var}_{F} (X)

$\sigma^2=\text{var}_F(X)$

n

$n$

x_{1}^{*}, \dots, x_{n}^{*}

$x^*_1,\ldots,x^*_n$

{\hat{F}}_{n}

$\hat F_n$

β = {\hat{σ}}_{n}^{2} (x_{1}^{*}, \dots, x_{n}^{*}) - {\hat{σ}}_{n}^{2} (x_{1}, \dots, x_{n})

$\beta= \hat \sigma^2_n (x^*_1,\ldots,x^*_n) - \hat \sigma^2_n (x_1,\ldots,x_n)$

— সিয়ান
সূত্র

3

আমি বিশ্বাস করি যে বুটস্ট্র্যাপিং পদ্ধতির পিছনে দুটি প্রয়োজনীয় ধারণা পৃথক করা দরকারী। বুটস্ট্র্যাপ নিজেই অন্য একটি (আশাবাদী আরও ভাল) অনুমানকারী উত্পাদন করার জন্য একটি অনুমানকারীকে পরিবর্তন করার উপায় হিসাবে ভাবা উচিত। এটি তাত্ত্বিকভাবে, সঠিকভাবে এবং (কখনও কখনও) বন্ধ আকারে গণনা করা যেতে পারে। সিমুলেশন বুটস্ট্র্যাপের সহজাত অংশ নয় ! যাইহোক, অনেক ক্ষেত্রে সিমুলেশন বুটস্ট্র্যাপ অনুমানের আনুমানিক একটি প্রাকৃতিক এবং সহজ উপায় । হল, বুটস্ট্র্যাপ এবং এজওয়ার্থ সম্প্রসারণের

— whuber

1

সম্পাদনা সম্পর্কিত: এটি বুটস্ট্র্যাপ পক্ষপাতের অনুমানটি ঠিক বদ্ধ আকারে গণনা করা যেতে পারে এমন একটি দুর্দান্ত উদাহরণ

E [β | sample] = - [2 / (n + 1)] {\hat{σ}}_{n}^{2} (x_{1}, \dots, x_{n}) .

$E[\beta\ |\ \text{sample}] = -[2/(n+1)] \hat \sigma^2_n (x_1,\ldots,x_n).$

— whuber