আসুন ডেটা প্লট করে শুরু করুন এবং এটি একবার দেখুন। এটি ডেটা অত্যন্ত সীমিত পরিমাণে, তাই এটি প্রচুর অনুমানের সাথে কিছুটা অ্যাডহক হতে চলেছে ।
rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08,
91.48,
74.23,
129.8,
169.22,
123.43,
104.93,
103.27,
169.01,
83.29,
157.57,
117.72,
128.63)
diam <- c(17.28,
6.57,
7.12,
16.52,
14.58,
6.99,
6.63,
6.75,
15.38,
7.45,
13.06,
6.61,
7.19)
plot(mass,diam,col=rotten,lwd=2)
title("Fruits")
সুতরাং এটি তথ্য, লাল বিন্দুগুলি পচা ফলের প্রতিনিধিত্ব করে:
আপনি ধরে নিচ্ছেন যে দু'ধরণের ফল রয়েছে বলে মনে হয় আপনি সঠিক। আমি যে অনুমানগুলি করি তা নিম্নলিখিত:
- ব্যাস ফল দুটি গ্রুপে বিভক্ত করে
- 10 এর চেয়ে বেশি ব্যাসযুক্ত ফলগুলি একটি গ্রুপে, অন্যরা ছোট গ্রুপে।
- বড় ফলের গ্রুপে একটি পচা ফল রয়েছে। আসুন ধরে নেওয়া যাক যে কোনও ফল যদি বড় গ্রুপে থাকে তবে পচা হওয়া ওজনকে প্রভাবিত করে না। এটি অপরিহার্য, যেহেতু সেই গোষ্ঠীতে আমাদের কেবল একটি ডেটা পয়েন্ট রয়েছে।
- ফলটি যদি একটি ছোট ফল হয় তবে পচা হওয়া ভরকে প্রভাবিত করে।
- আসুন ধরে নেওয়া যাক ভেরিয়েবলগুলি ডায়াম এবং ভর সাধারণত বিতরণ করা হয়।
কারণ এটি দেওয়া হয় যে ব্যাসের যোগফল .2৪.২ সেমি, তারপরে এটি সম্ভবত দুটি ফল বড় এবং চারটি ছোট। এখন ওজন জন্য 3 টি মামলা আছে। পচা 2, 3 বা 4 টি ছোট ফল রয়েছে (পঁচা একটি বৃহত ফল অনুমান দ্বারা ভরকে প্রভাবিত করে না )। সুতরাং এখন আপনি এই মানগুলি গণনা করে আপনার ভরতে সীমা পেতে পারেন।
আমরা ক্ষুদ্র ক্ষুদ্র ফলের সংখ্যার সম্ভাব্যতা অনুমিতভাবে অনুমান করতে পারি। পচা ফলের সংখ্যার উপর নির্ভর করে আমরা ভরগুলির আমাদের অনুমানকে ওজন করতে সম্ভাব্যতাগুলি ব্যবহার করি:
samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
numF <- 0 # Number of small rotten
numR <- 0 # Total number of rotten
# Pick 4 small fruits
for(j in 1:4){
if(runif(1) < (5/8)){ # Empirical proportion of small rotten
numF <- numF + 1
numR <- numR + 1
}
}
# Pick 2 large fruits
for(j in 1:2){
if(runif(1) < 1/5){# Empirical proportion of large rotten
numR <- numR + 1
}
}
stored_vals[i,] <- c(numF,numR)
}
# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)
table(fourRotten)
# Proportions
props <- table(fourRotten)/length(fourRotten)
massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])
weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)
Est_Mass <- sum(props*weights)
আমাদের চূড়ান্ত আনুমানিক 691.5183g দেওয়া । আমি মনে করি যে কোনও সিদ্ধান্তে পৌঁছানোর জন্য আমি যে অনুমান করেছিলাম সেগুলির বেশিরভাগ আপনাকেই করতে হবে, তবে আমি মনে করি এটি সম্ভবত একটি স্মার্ট পদ্ধতিতে করা সম্ভব হবে। এছাড়াও আমি পচা ছোট ফলের সংখ্যার সম্ভাব্যতা অর্জনের জন্য অনুমিতভাবে নমুনা দিচ্ছি, এটি কেবল অলসতা এবং "বিশ্লেষণাত্মকভাবে" করা যেতে পারে।