একটি মুদ্রা ন্যায্য কিনা তা পরীক্ষা করা হচ্ছে


9

আমাকে নীচের প্রশ্নটি একটি বন্ধু জিজ্ঞাসা করেছিলেন। আমি তাকে সাহায্য করতে পারিনি তবে আমি আশা করি কেউ আমাকে এটি ব্যাখ্যা করতে পারে। আমি এর মতো কোনও উদাহরণ খুঁজে পেলাম না any কোনও সহায়তা এবং ব্যাখ্যা দেওয়ার জন্য ধন্যবাদ।

প্রশ্ন: 100 কয়েন টস পরীক্ষার ফলাফল 0 = "লেজ" এবং 1 = "হেড" হিসাবে রেকর্ড করা হয়। আউটপুট এক্সটি 0 এর দৈর্ঘ্য এবং 100 দৈর্ঘ্যের 1 এর স্ট্রিং And 2 বার ঘটে) আপনি কি মনে করেন এটি একটি ন্যায্য মুদ্রা?


1
এই প্রশ্নটি হুবহু রিলাইফ সমস্যার মতো শোনাচ্ছে না। এই হোমওয়ার্ক হয়?
সেক্সটাস এম্পেরিকাস

1
আমি নিশ্চিত না. আমি ইঙ্গিত হিসাবে এটি একটি বন্ধু আমাকে জিজ্ঞাসা করা হয়েছিল। আমি তার বাইরে সাহায্য করতে পারে না, কিন্তু আমি এখনও সমাধান বা প্রশ্নে এই ধরনের উত্তর দিতে শিখতে চান @ MartijnWeterings।
জিমি সময়কাল

2
stats.stackexchange.com/questions/158490/… এ পরিস্থিতি সম্পর্কে মোটামুটি সম্পূর্ণ অ্যাকাউন্ট রয়েছে। আরো জানার জন্য, দেখুন stats.stackexchange.com/...
whuber

1
@ জিমিদুর প্রশ্নের ব্যাখ্যা বা অর্থ সম্পর্কে আপনার কোনও ধারণা নেই। এই ক্ষেত্রে. আপনি প্রশ্নটি বাক্য হিসাবে "আপনার কি মনে হয় এটি একটি ন্যায্য মুদ্রা?" এটি একটি কৌশল প্রশ্ন মত শোনাচ্ছে।
সেক্সটাস এম্পেরিকাস

1
... তবে নির্দিষ্ট দৃষ্টিকোণ থেকে এটি মোকাবেলার সঠিক উপায় নাও হতে পারে এবং কেউ একজন বয়েশিয়ান পদ্ধতির কামনা করতে পারে, উদাহরণস্বরূপ, যদি কেউ মুদ্রার ন্যায্যতার পূর্ববর্তী সম্ভাবনা বিতরণের মতো কিছু জানে। পটভূমি এবং পরিস্থিতি সম্পর্কে কোনও জ্ঞান ছাড়াই কোনও গণনা কেবল গণিত অনুশীলন হবে এবং আপনার স্পষ্ট প্রশ্নের উত্তর নয় "আপনি কি মনে করেন এটি এটিকে ন্যায্য মুদ্রা?"
সেক্সটাস এম্পেরিকাস

উত্তর:


14

সিমুলেশন দিয়ে সমস্যা সমাধান করা

আমার প্রথম চেষ্টাটি এটি একটি কম্পিউটারে সিমুলেট করার চেষ্টা করা হবে, যা অনেকগুলি ন্যায্য মুদ্রা খুব দ্রুত ফ্লিপ করতে পারে। নীচে একটি মিলিয়ন ট্রায়াল সহ একটি উদাহরণ দেওয়া আছে। ইভেন্ট 'বার যে সংখ্যাএক্স '1-0-0' প্যাটার্নটি ঘটে এন=100 মুদ্রা ফ্লিপগুলি 20 বা ততোধিক হয় 'প্রতি তিন হাজার ট্রায়ালে মোটামুটি একবার হয়, তাই আপনি যা লক্ষ্য করেছেন তা খুব সম্ভবত হয় না (একটি নমনীয় মুদ্রার জন্য)।

মনে রাখবেন যে হিস্ট্রগ্রামটি সিমুলেশনের জন্য এবং লাইনটি নীচে আরও ব্যাখ্যা করা হুবহু গণনা।

বারলেখ

set.seed(1)

# number of trials
n <- 10^6

# flip coins
q <- matrix(rbinom(100*n, 1, 0.5),n)

# function to compute number of 100 patterns
npattern <- function(x) {
  sum((1-x[-c(99,100)])*(1-x[-c(1,100)])*x[-c(1,2)])
}

# apply function on data 
counts <- sapply(1:n, function(x) npattern(q[x,]))
hist(counts, freq = 0) 

# estimated probability
sum(counts>=20)/10^6
10^6/sum(counts>=20)

সঠিক গণনা দিয়ে সমস্যা সমাধান করা

বিশ্লেষণাত্মক পদ্ধতির জন্য আপনি এই সত্যটি ব্যবহার করতে পারেন যে '100 মুদ্রা ফ্লিপগুলিতে 20 বা ততোধিক ক্রম' 1-0-0 'পর্যবেক্ষণ করার সম্ভাবনাটি 1 বিয়োগের সমান হয় তবে 20 অনুক্রম তৈরি করতে 100 টি বেশি ফ্লিপ লাগে' । এটি নিম্নলিখিত পদক্ষেপগুলিতে সমাধান করা হয়েছে:

'1-0-0' উল্টানোর সম্ভাবনার জন্য অপেক্ষা করার সময়

বণ্টন, fN,x=1(n), '1-0-0' অবধি ঠিক এক সিক্যুয়েন্স পাওয়ার সময় পর্যন্ত আপনার যতবার ফ্লিপ করা দরকার তার মধ্যে নিচের মত গণনা করা যেতে পারে:

আসুন একটি মার্কভ চেইন হিসাবে '1-0-0' এ যাওয়ার উপায়গুলি বিশ্লেষণ করা যাক। আমরা ফ্লিপের স্ট্রিংয়ের প্রত্যয় দ্বারা বর্ণিত রাজ্যগুলি অনুসরণ করি: '1', '1-0', বা '1-0-0'। উদাহরণস্বরূপ, যদি আপনার নিম্নলিখিত আটটি ফ্লিপগুলি 10101100 থাকে তবে আপনি ক্রমক্রমে নিম্নলিখিতটি আটটি লিখেছেন: '1', '1-0', '1', '1-0', '1', '1', '1-0', '1-0-0' এবং এটি '1-0-0 'এ পৌঁছাতে আটটি ফ্লিপ নিয়েছিল। মনে রাখবেন আপনি না না যে উল্টানো রাষ্ট্র '1-0-0' পৌঁছানোর সমান সম্ভাবনা আছে। সুতরাং আপনি এটি দ্বিপদী বিতরণ হিসাবে মডেল করতে পারবেন না । পরিবর্তে আপনার সম্ভাবনার একটি গাছ অনুসরণ করা উচিত। রাজ্য '1' '1' এবং '1-0' এ যেতে পারে, রাজ্য '1-0' '1' এবং '1-0-0' এ যেতে পারে, এবং রাষ্ট্র '1-0-0' একটি শোষণকারী রাষ্ট্র। আপনি এটি লিখতে পারেন:

           number of flips
           1   2   3   4   5   6   7   8   9   ....   n

'1'        1   1   2   3   5   8  13  21  34   ....   F_n
'1-0'      0   1   1   2   3   5   8  13  21          F_{n-1}
'1-0-0'    0   0   1   2   4   7   12 20  33          sum_{x=1}^{n-2} F_{x}

এবং প্রথম '1' ঘূর্ণায়মান হওয়ার পরে, '1-0-0' তে প্যাটার্নে পৌঁছানোর সম্ভাবনা (আপনি এখনও '0' রাষ্ট্রের সাথে শুরু করেন, মাথা ফ্লিপ না করে) এর মধ্যে এন ফ্লিপগুলির মধ্যে '1-0' এর মধ্যে থাকা সম্ভাবনার চেয়ে আধ গুণ এন-1 ফ্লিপ:

এন,এক্স=1(এন)=এফএন-22এন-1

কোথায় এফআমি হয় আমি-ফিবোন্নাচি নাম্বার। শর্তহীন সম্ভাবনার যোগফল

fN,x=1(n)=k=1n20.5kfNc,x=1(1+(nk))=0.5nk=1n2Fk

উল্টানোর সম্ভাবনার জন্য অপেক্ষা করার সময় বার '1-0-0'

এটি আপনি একটি সমঝোতার মাধ্যমে গণনা করতে পারেন।

fN,x=k(n)=l=1nfN,x=1(l)fN,x=1(nl)

আপনি 20 বা ততোধিক '1-0-0' নিদর্শনগুলি পর্যবেক্ষণ করার সম্ভাবনা হিসাবে পাবেন (মুদ্রাটি ন্যায্য বলে অনুমানের ভিত্তিতে)

> # exact computation
> 1-Fx[20]
[1] 0.0003247105
> # estimated from simulation
> sum(counts>=20)/10^6
[1] 0.000337

এটি গণনা করার জন্য এখানে আর-কোড রয়েছে:

# fibonacci numbers
fn <- c(1,1)
for (i in 3:99) {
  fn <- c(fn,fn[i-1]+fn[i-2])
}

# matrix to contain the probabilities
ps <- matrix(rep(0,101*33),33)

# waiting time probabilities to flip one pattern
ps[1,] <- c(0,0,cumsum(fn))/2^(c(1:101))

#convoluting to get the others
for (i in 2:33) {
  for (n in 3:101) {
     for (l in c(1:(n-2))) {
       ps[i,n] = ps[i,n] + ps[1,l]*ps[i-1,n-l]
     }  
  }
}

# cumulative probabilities to get x patterns in n flips
Fx <- 1-rowSums(ps[,1:100])

# probabilities to get x patterns in n flips
fx <- Fx[-1]-Fx[-33]

#plot in the previous histogram
lines(c(1:32)-0.5,fx)

অন্যায্য কয়েনের জন্য গণনা করা হচ্ছে

আমরা সম্ভাব্যতার উপরের গণনাটি পর্যবেক্ষণ করতে পারি x নিদর্শন n উল্টে যায়, যখন '1 = হেড' এর সম্ভাবনা থাকে p এবং ফ্লিপগুলি স্বাধীন।

আমরা এখন ফিবোনাচি সংখ্যাগুলির একটি সাধারণীকরণ ব্যবহার করি:

Fn(x)={1if n=1xif n=2x(Fn1+Fn2)if n>2

সম্ভাবনাগুলি এখন যেমন:

fNc,x=1,p(n)=(1p)n1Fn2((1p)11)

এবং

fN,x=1,p(n)=k=1n2p(1p)k1fNc,x=1,p(1+nk)=p(1p)n1k=1n2Fk((1p)11)

যখন আমরা এটি পরিকল্পনা করি আপনি পাবেন:

বিভিন্ন পি

সুতরাং পি-মানটি 0.0003247 ন্যায্য মুদ্রার জন্য ছোট হলেও আমাদের অবশ্যই লক্ষ্য রাখতে হবে যে এটি অন্যায্য অন্যায়িত মুদ্রার জন্য আরও ভাল (কেবলমাত্র একক আদেশ) নয়। নাল অনুমানটি যখন সম্ভাবনা অনুপাত, বা বয়েস ফ্যাক্টর 11 এর কাছাকাছি হয় (p=0.5) বিকল্প অনুমানের সাথে তুলনা করা হয় p=0.33। এর অর্থ এই যে অবর মতভেদ অনুপাত পূর্বে মতভেদ অনুপাত তুলনায় মাত্র দশ গুণ বেশি হয়।

সুতরাং আপনি যদি পরীক্ষার আগে এটি ভেবেছিলেন যে মুদ্রাটি অসম্পূর্ণ ছিল না, তবে এখনই আপনার এই মুদ্রাটি সম্ভবত অন্যায় নয় বলে মনে করা উচিত।


একটি মুদ্রা সঙ্গে pheads=ptails তবে '1-0-0' উপলক্ষ্যে অন্যায়

মাথা এবং লেজগুলির সংখ্যা গণনা করে ন্যায্য মুদ্রার সম্ভাবনাটি পরীক্ষা করা যায় এবং পর্যবেক্ষণটি বিশেষ হয় কি না তা পরীক্ষা করে দ্বিপদী বিতরণ ব্যবহার করতে পারেন।

তবে এটি এমনও হতে পারে যে মুদ্রাটি উল্টছে, গড়ে, সমান সংখ্যক মাথা এবং লেজ তবে নির্দিষ্ট নিদর্শনগুলির ক্ষেত্রে ন্যায্য নয়। উদাহরণস্বরূপ, মুদ্রাটির উত্তরোত্তর সফল হওয়ার জন্য মুদ্রার কিছুটা সম্পর্ক থাকতে পারে (আমি কল্পনা করি যে মুদ্রার ধাতুর অভ্যন্তরের গহ্বরগুলির সাথে কিছুটা প্রক্রিয়া কল্পনা করা যায় যা বালি ভরাট হয় যা পূর্ববর্তী মুদ্রার উল্টোদিকে একটি ঘড়ির কাচের মতো প্রবাহিত হবে যা মুদ্রাটি লোড করছে পূর্ববর্তী দিকের মতো একই দিকে আরও বেশি পড়ে যাওয়া)।

প্রথম মুদ্রা ফ্লিপ সমান সম্ভাবনা মাথা এবং লেজ হতে দিন এবং উত্তরোত্তর ফ্লিপ সম্ভাবনা সঙ্গে হয় pআগে উল্টানো হিসাবে একই দিক। তারপরে এই পোস্টের শুরুতে অনুরূপ সিমুলেশন নীচে '1-0-0' প্যাটার্ন 20 ছাড়িয়ে যাওয়ার সংখ্যার জন্য নিম্নলিখিত সম্ভাব্যতা প্রদান করবে:

জড়িত মুদ্রা

আপনি দেখতে পাচ্ছেন যে '1-0-0' প্যাটার্নটি (আশেপাশে কোথাও পর্যবেক্ষণ করার জন্য) এটি আরও কম করা সম্ভব পি=0.45একটি মুদ্রার সাথে কিছু নেতিবাচক সম্পর্ক রয়েছে), তবে আরও নাটকীয়ভাবে এটি '1-0-0' প্যাটার্নটিকে আরও কম করতে পারে। কম জন্যপিআপনি মাথার পরে বহুবার লেজ পাবেন, '1-0-0' ধাঁচের প্রথম '1-0' অংশ, তবে আপনি প্রায় এক বারে দুটি লেজটি '0-0' অংশে পাবেন না প্যাটার্ন। বিপরীত উচ্চ জন্য সত্যপি মান।

# number of trials
set.seed(1)
n <- 10^6

p <- seq(0.3,0.6,0.02)
np <- length(p)
mcounts <- matrix(rep(0,33*np),33)

pb <- txtProgressBar(title = "progress bar", min = 0,
                     max = np, style=3)
for (i in 1:np) {
  # flip first coins
  qfirst <- matrix(rbinom(n, 1, 0.5),n)*2-1
  # flip the changes of the sign of the coin
  qrest <- matrix(rbinom(99*n, 1, p[i]),n)*2-1
  # determining the sign of the coins
  qprod <- t(sapply(1:n, function(x) qfirst[x]*cumprod(qrest[x,])))
  # representing in terms of 1s and 0s
  qcoins <- cbind(qfirst,qprod)*0.5+0.5
  counts <- sapply(1:n, function(x) npattern(qcoins[x,]))

  mcounts[,i] <- sapply(1:33, function(x) sum(counts==x))
  setTxtProgressBar(pb, i)
}
close(pb)

plot(p,colSums(mcounts[c(20:33),]),
     type="l", xlab="p same flip", ylab="counts/million trials", 
     main="observation of 20 or more times '1-0-0' pattern \n for coin with correlated flips")
points(p,colSums(mcounts[c(20:33),]))

পরিসংখ্যান গণিত ব্যবহার করে

উপরের সমস্ত ঠিক আছে তবে এটি প্রশ্নের সরাসরি উত্তর নয়

"আপনি কি মনে করেন এটি একটি ন্যায্য মুদ্রা?"

এই প্রশ্নের উত্তর দেওয়ার জন্য কেউ উপরের গণিতটি ব্যবহার করতে পারেন তবে পরিস্থিতি, লক্ষ্য, ন্যায্যতার সংজ্ঞা ইত্যাদি সম্পর্কে প্রথমে খুব ভালভাবে বর্ণনা করা উচিত, ব্যাকগ্রাউন্ড এবং পরিস্থিতি সম্পর্কে কোনও জ্ঞান ছাড়াই কোনও গণনা কেবল গণিতের অনুশীলন হবে এবং তার উত্তর নয় not স্পষ্ট প্রশ্ন।

একটি ওপেন প্রশ্ন হ'ল কেন এবং কীভাবে আমরা '1-0-0' প্যাটার্নটি খুঁজছি।

  • উদাহরণস্বরূপ, এই প্যাটার্নটি লক্ষ্য নয়, যা তদন্ত করার আগে সিদ্ধান্ত নেওয়া হয়েছিল । সম্ভবত এটি ডেটাতে 'দাঁড়িয়ে থাকা' এমন কিছু ছিল এবং এটি এমন কিছু যা পরীক্ষার পরে মনোযোগ পেয়েছিল । সেক্ষেত্রে আমাদের বিবেচনা করা উচিত যে একজন কার্যকরভাবে একাধিক তুলনা করছেন
  • আর একটি বিষয় হ'ল উপরের গণনা করা সম্ভাব্যতা হ'ল পি-মান। পি-মানটির অর্থটি সাবধানতার সাথে বিবেচনা করা দরকার। এটা হয় না সম্ভাব্যতা যে মুদ্রা ন্যায্য। এটি পরিবর্তে, মুদ্রা ন্যায্য হলে একটি নির্দিষ্ট ফলাফল পর্যালোচনা করার সম্ভাবনা । যদি কারও কাছে এমন পরিবেশ থাকে যেখানে মুদ্রার ন্যায্যতার কিছু বিতরণ জেনে থাকে বা কেউ যুক্তিসঙ্গত ধারণা গ্রহণ করতে পারে তবে কেউ এটিকে বিবেচনায় নিতে পারে এবং একটি বায়সিয়ান অভিব্যক্তি ব্যবহার করতে পারে ।
  • কী ন্যায্য, কোনটা অন্যায়। শেষ পর্যন্ত, যথেষ্ট পরীক্ষাগুলি দেওয়া হলে কিছুটা সামান্য কিছুটা অন্যায় হতে পারে। তবে এটি কি প্রাসঙ্গিক এবং এই জাতীয় অনুসন্ধান কি পক্ষপাতদুষ্ট নয়? যখন আমরা ঘন ঘন ঘনবাদী পদ্ধতির সাথে লেগে থাকি, তারপরে একটির সীমানার মতো কিছু বর্ণনা করা উচিত যা আমরা একটি মুদ্রা মেলা বিবেচনা করি (কিছু প্রাসঙ্গিক প্রভাবের আকার)। মুদ্রা ন্যায্য কিনা তা স্থির করতে ('' 1-0-0 '' প্যাটার্ন সম্পর্কিত) দু'পক্ষের টি-টেস্টের অনুরূপ কিছু ব্যবহার করতে পারে ।

1
কেন এমএলই এর মাধ্যমে বদ্ধ ফর্ম সমাধানের চেষ্টা করছেন না?
ডিজিও

আমি না, আমি কৌতূহলী। নাপি^এমএল=একটিRমিএকটিএক্সপি[পি(এক্স1,,এক্সএন|পি,এন)] সঙ্গে এক্স~বিআমিএনমিআমিএকটি(এন,পি) এবং একটি আস্থা অন্তর পি^এমএলএকটি বৈধ উত্তর দিন, কে?
ডিজিও

মার্তিজানের এই উত্তরের উত্তরের জন্য ধন্যবাদ, আমি সত্যিই দ্বিতীয় পদ্ধতির পছন্দ করি like আমার চিন্তাভাবনা আরও প্রত্যক্ষ সমাধানের ধারায় ছিল: অনুমানপিএকক দ্বিপদী বা একাধিক বার্নোল্লি বিতরণের প্যারামিটার হিসাবে। তারপরে যদি সম্ভাবনার আত্মবিশ্বাসের ব্যবধান থাকেপি.5 অন্তর্ভুক্ত করে না, তবে আমরা বলব যে মুদ্রা পক্ষপাতদুষ্ট।
ডিজিও

উদাহরণস্বরূপ, জন্য এক্স={0,0,1,0,0,1,1,1,0,1,0,0}, আমরা পেতে পি^=এক্সএন=512=0.42 একটি ত্রুটি মার্জিন সঙ্গে 1.96পি^(1-পি^)এন=0.28। এবং যেহেতু0.42+ +0.28<0.50, আমরা উপসংহারে পৌঁছাতে পারি যে মুদ্রা পক্ষপাতদুষ্ট নয় (5% তাত্পর্যপূর্ণ স্তরে)।
ডিজিও

3
@ ফ্র্যাঙ্কহারেল না সমস্যা সমাধানে এমন কোনও কিছুই নেই যা আমাদের মনে করে যে ফ্লিপগুলি অসংলগ্ন। সমস্যাটি সেটআপ তথ্য সহ তুলনামূলকভাবে দুর্বল। আমার উদাহরণ যা ফ্লিপের সাথে সম্পর্কিত হয় কেবল প্রশ্নের বিস্তৃতিকে coverাকতে cover আমি চিঠিতে নই যে এই হল উপায় এটি উত্তর দিতে। তবে বলুন যে কেউ (সম্ভবত ওপি) ডিএনএ সিকোয়েন্সগুলি বা অন্য কোনও সমস্যা সেটআপ নিয়ে গবেষণা করছে যেখানে পারস্পরিক সম্পর্কের সম্ভাবনা আরও তাত্পর্যপূর্ণ হয়, তবে কীভাবে এটি চালু হতে পারে তাদের একটি উদাহরণ রয়েছে।
সেক্সটাস এম্পেরিকাস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.