একটি ব্যাগের মধ্যে কেবলমাত্র মোট যোগফলের থেকে ফলের ভর পরিমাণ?


9

আমার বিশ্ববিদ্যালয়ের একজন প্রশিক্ষক এ জাতীয় প্রশ্ন করেছিলেন (ক্লাস শেষ হওয়ার কারণে হোমওয়ার্কের জন্য নয় এবং আমি এতে ছিলাম না)। আমি কীভাবে এটি ব্যবহার করতে পারি তা বুঝতে পারি না।

প্রশ্নটি বিভিন্ন ধরণের ফলের ভাণ্ডার সমেত 2 টি ব্যাগ নিয়ে উদ্বেগ প্রকাশ করে:

প্রথম ব্যাগে নিম্নলিখিত এলোমেলোভাবে নির্বাচিত ফল রয়েছে:

+ + ------------- + + -------- + + --------- + +
| ব্যাস সেমি ভর জি | পচা? |
+ + ------------- + + -------- + + --------- + +
| 17.28 | 139.08 | 0 |
| 6.57 | 91.48 | 1 |
| 7.12 | 74.23 | 1 |
| 16.52 | 129.8 | 0 |
| 14.58 | 169.22 | 0 |
| 6.99 | 123.43 | 0 |
| 6.63 | 104.93 | 1 |
| 6.75 | 103.27 | 1 |
| 15.38 | 169.01 | 1 |
| 7.45 | 83.29 | 1 |
| 13.06 | 157.57 | 0 |
| 6.61 | 117.72 | 0 |
| 7.19 | 128.63 | 0 |
+ + ------------- + + -------- + + --------- + +

দ্বিতীয় ব্যাগে প্রথম ব্যাগ হিসাবে একই স্টোর থেকে এলোমেলোভাবে নির্বাচিত ফল রয়েছে। তাদের ব্যাসকের যোগফল .2৪.২ সেমি এবং ৪ টি পচা।

দ্বিতীয় ব্যাগের ভরগুলির জন্য একটি অনুমান দিন।

আমি দেখতে পাচ্ছি যে সাধারণত বিতরণ করা ব্যাস এবং জনসাধারণের সাথে দুটি ভিন্ন ধরণের ফল পাওয়া যায় তবে কীভাবে এগিয়ে যেতে হয় সে সম্পর্কে আমি হারিয়ে গিয়েছি।


6
আকর্ষণীয় প্রশ্ন - তবে অদ্ভুত তথ্য: নির্দিষ্ট মাধ্যাকর্ষণটি 0.78 থেকে 0.05 পর্যন্ত রয়েছে। হতে পারে কেউ সত্যিকারের ফলের জন্য স্টাইলফোম সজ্জা ভুল করেছে? :-)
whuber

ফলটি কী তৈরি হয়েছিল তা প্রশ্নে আসে না। আমি অনুমান করি যে আপনি ধরে নিতে পারেন যে আসল ব্যাগগুলি সেগুলিও ওজনহীন। আমি কীভাবে সমস্যার সমাধান করব?
রুটিলাস্ক

3
আমার মন্তব্যের জোর ছিল হ'ল এত অল্প পরিমাণে অগোছালো তথ্য বিশ্লেষণ করার সময়, আমরা ডেটার অর্থ কী তা বোঝার উপর নির্ভর করি। যেহেতু এই সংখ্যাগুলি স্পষ্টতই কোনও পরিচিত ধরণের "ফল" বর্ণনা করে না, তাই আমরা এই জাতীয় ডোমেন জ্ঞানের আবেদন করতে পারি না। (উদাহরণস্বরূপ, এই ডেটাগুলির কোনও অংশকে "সাধারণভাবে বিতরণ করা উচিত" বলে মনে করার মতো আমাদের কোনও ভিত্তি নেই) এটি যুক্তিযুক্ত উত্তরগুলি বিকাশকে কঠিন বা অসম্ভব করে তোলে এবং বিতর্ক সৃষ্টি করতে পারে, কারণ এটি সেই পথে সীমাবদ্ধ করে যা যে কোনও পদ্ধতির কার্যকারিতা মূল্যায়ন করা যায়।
whuber

তবে স্টায়ারফোম ফলটি পচতে পারে না। সম্ভবত ফলটি দীর্ঘ অক্ষের সাথে পরিমাপ করা "ব্যাস" সহ প্রলেট স্পেরয়েড। কমপক্ষে দুই ধরণের ফল রয়েছে বলে মনে হয়: সুতরাং নির্দিষ্ট মাধ্যাকর্ষণটিকে একের কাছাকাছি ধরে ধরে, ছোটটি একটি লেবুর আকার এবং আকার সম্পর্কে হবে; প্রায় আধা ফিট লম্বা এবং 2 ইঞ্চি নীচে। এই ধারণার সাথে অসুবিধাটি হ'ল সংক্ষিপ্ত অক্ষটিকে "ব্যাস" হিসাবে বর্ণনা করা আরও স্বাভাবিক বলে মনে হয়।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

উত্তর:


1

আসুন ডেটা প্লট করে শুরু করুন এবং এটি একবার দেখুন। এটি ডেটা অত্যন্ত সীমিত পরিমাণে, তাই এটি প্রচুর অনুমানের সাথে কিছুটা অ্যাডহক হতে চলেছে ।

rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08, 
        91.48,
        74.23,
        129.8,
        169.22,
        123.43,
        104.93,
        103.27,
        169.01,
        83.29,
        157.57,
        117.72,
        128.63)
diam <- c(17.28,
        6.57,
        7.12,
        16.52,
        14.58,
        6.99,
        6.63,
        6.75,
        15.38,
        7.45,
        13.06,
        6.61,
        7.19)

plot(mass,diam,col=rotten,lwd=2)
title("Fruits")

সুতরাং এটি তথ্য, লাল বিন্দুগুলি পচা ফলের প্রতিনিধিত্ব করে:

ফল চক্রান্ত

আপনি ধরে নিচ্ছেন যে দু'ধরণের ফল রয়েছে বলে মনে হয় আপনি সঠিক। আমি যে অনুমানগুলি করি তা নিম্নলিখিত:

  • ব্যাস ফল দুটি গ্রুপে বিভক্ত করে
  • 10 এর চেয়ে বেশি ব্যাসযুক্ত ফলগুলি একটি গ্রুপে, অন্যরা ছোট গ্রুপে।
  • বড় ফলের গ্রুপে একটি পচা ফল রয়েছে। আসুন ধরে নেওয়া যাক যে কোনও ফল যদি বড় গ্রুপে থাকে তবে পচা হওয়া ওজনকে প্রভাবিত করে না। এটি অপরিহার্য, যেহেতু সেই গোষ্ঠীতে আমাদের কেবল একটি ডেটা পয়েন্ট রয়েছে।
  • ফলটি যদি একটি ছোট ফল হয় তবে পচা হওয়া ভরকে প্রভাবিত করে।
  • আসুন ধরে নেওয়া যাক ভেরিয়েবলগুলি ডায়াম এবং ভর সাধারণত বিতরণ করা হয়।

কারণ এটি দেওয়া হয় যে ব্যাসের যোগফল .2৪.২ সেমি, তারপরে এটি সম্ভবত দুটি ফল বড় এবং চারটি ছোট। এখন ওজন জন্য 3 টি মামলা আছে। পচা 2, 3 বা 4 টি ছোট ফল রয়েছে (পঁচা একটি বৃহত ফল অনুমান দ্বারা ভরকে প্রভাবিত করে না )। সুতরাং এখন আপনি এই মানগুলি গণনা করে আপনার ভরতে সীমা পেতে পারেন।

আমরা ক্ষুদ্র ক্ষুদ্র ফলের সংখ্যার সম্ভাব্যতা অনুমিতভাবে অনুমান করতে পারি। পচা ফলের সংখ্যার উপর নির্ভর করে আমরা ভরগুলির আমাদের অনুমানকে ওজন করতে সম্ভাব্যতাগুলি ব্যবহার করি:

samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
  numF <- 0 # Number of small rotten
  numR <- 0 # Total number of rotten
  # Pick 4 small fruits
  for(j in 1:4){
    if(runif(1) < (5/8)){ # Empirical proportion of small rotten
      numF <- numF + 1
      numR <- numR + 1
    } 
  }
  # Pick 2 large fruits
  for(j in 1:2){
    if(runif(1) < 1/5){# Empirical proportion of large rotten
      numR <- numR + 1
    }
  }
  stored_vals[i,] <- c(numF,numR)
}

# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)

table(fourRotten)

# Proportions 
props <- table(fourRotten)/length(fourRotten)

massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])

weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)

Est_Mass <- sum(props*weights) 

আমাদের চূড়ান্ত আনুমানিক 691.5183g দেওয়া । আমি মনে করি যে কোনও সিদ্ধান্তে পৌঁছানোর জন্য আমি যে অনুমান করেছিলাম সেগুলির বেশিরভাগ আপনাকেই করতে হবে, তবে আমি মনে করি এটি সম্ভবত একটি স্মার্ট পদ্ধতিতে করা সম্ভব হবে। এছাড়াও আমি পচা ছোট ফলের সংখ্যার সম্ভাব্যতা অর্জনের জন্য অনুমিতভাবে নমুনা দিচ্ছি, এটি কেবল অলসতা এবং "বিশ্লেষণাত্মকভাবে" করা যেতে পারে।


আপনার অবদানের জন্য ধন্যবাদ. আমার কাছে মনে হয় যে আপনি "অনুমান" বলেছেন এমন বেশিরভাগ দাবীগুলি আপনার অনুসন্ধানী বিশ্লেষণের ভিত্তিতে সত্যই উপসংহার । আপনার ফলাফলগুলি কীভাবে এই সিদ্ধান্তের যথার্থতার উপর নির্ভর করে তা বিশ্লেষণ করা মূল্যবান হবে। নির্বিশেষে, এটি পরিষ্কার যে এই জাতীয় একটি ছোট ডেটাসেট সম্ভবত সাতটি উল্লেখযোগ্য পরিসংখ্যান সহ কোনও ফলাফলকে সমর্থন করতে পারে না! এটির সম্ভাব্য ত্রুটির কিছু মূল্যায়ন সরবরাহ করা বিশেষত কার্যকর হবে। এটি তুলনামূলকভাবে বড় হবে, যা জানা গুরুত্বপূর্ণ হবে।
whuber

@ মন্তব্যটির জন্য ধন্যবাদ, আমি সন্ধ্যার পরে তারতম্যটি অনুমান করার জন্য আরও কিছু যুক্ত করতে পারি। সবচেয়ে সহজ কাজটি হ'ল আমি চূড়ান্ত গণনার জন্য যে তিনটি গ্রুপ ব্যবহার করি তার ভরের জন্য ত্রুটি অনুমান করা এবং তার ভিত্তিতে পূর্বাভাস অন্তরগুলি গণনা করা। তবে আমি দেখতে পাচ্ছি যে ওপি এক বছরের জন্য নিষ্ক্রিয় ছিল, তাই আমি এই উত্তরটি গৃহীত হবে বলে আশা করি না। আমি এখনও মনে করি যে এত অল্প ডেটা দিয়ে আপনি কীভাবে পেতে পারেন তা দেখার জন্য এই উদাহরণটি একটি দুর্দান্ত "খেলনা" সমস্যা।
গুমেও

আমি আপনাকে পরামর্শ দেওয়ার চেষ্টা করছি যে আপনি আসলে আপনার উত্তর দ্বারা প্রস্তাবিত তুলনায় অনেক কম তথ্য পেয়েছেন, কারণ এটি অনেকগুলি ডেটা প্রাপ্ত সিদ্ধান্তে নির্ভর করে যে তারা নিজেরাই অত্যন্ত অনিশ্চিত।
whuber

@ হু হ্যাঁ পুরোপুরি সঠিক। তবে আমি যে সমস্ত অনুমান / উপসংহারটি করি তা দ্বারা প্রচারিত ত্রুটিটি অনুমান করার চেষ্টা করা খুব সহজ নয়। দ্বিতীয় ব্যাগের ফলের ব্যাসকের যোগফলের পরিমাণটি 64৪.২ সেমি এবং ওপি উল্লেখ করেছে যে এখানে দুটি গ্রুপের ফল থাকতে পারে I
গুমেও

1
@ শুভ আমি এই সম্পর্কে চিন্তা করব এবং এটিকে একটি চ্যালেঞ্জ হিসাবে গ্রহণ করব। আমি এই প্রশ্নটি পরে আবার ঘুরে দেখব!
গুমেও

0

আমি নিম্নলিখিত পদ্ধতির প্রস্তাব করব:

  1. 4 টি পচে শর্ত পূরণ করে এমন 6 টি টিউপস তৈরি করুন। তারা হয়(64)(72)
  2. ব্যাসের শর্তটি পূরণকারী কেবলমাত্র উত্পন্ন টিপলগুলি থেকে নির্বাচন করুন।
  3. নির্বাচিত টিউপসগুলির গড় ওজন গণনা করুন (স্বাভাবিক গাণিতিক গড়)।

এটি একটি সাধারণ স্ক্রিপ্ট দ্বারা পরিচালনাযোগ্য।


5
কেন এই পদ্ধতির কাজ করা উচিত? এটি কী অনুমান করে? আপনি এটি চেষ্টা করে দেখেছেন যে এটি এমনকি কোনও উত্তর তৈরি করতে পারে কিনা?
হোবার

0

একাধিক পদ্ধতির অন্তর্ভুক্ত, সাধারণ থেকে জটিল পর্যন্ত,

  1. ((গড় ভর)
  2. 6 (গড় ভলিউম) (গড় ঘনত্ব)
  3. 4 (গড় পচা ভর) + 2 (মানে পচা ভর নয়)
  4. 4 ((পচা আয়তনের অর্থ) + 2 (মানে নন পচা ভলিউম)) (ঘনত্বের অর্থ)
  5. ৪ (গড় পচা ভলিউম) (পচা ঘনত্বের অর্থ) + ২ (মানে পচা নন)

। । ।

সংযুক্তি পদ্ধতি

পদ্ধতির গণনা সরলতার জন্য সাজানো হয়েছে, কোনও পদ্ধতির চেয়ে ভাল বা কোনও ভাল হওয়ার জন্য নয়। কোন পদ্ধতির ব্যবহার করবেন তা নির্বাচন জনসংখ্যার কী বৈশিষ্ট্যগুলি পরিচিত বা ধরে নেওয়া যায় তার উপর নির্ভর করে। উদাহরণস্বরূপ, যদি স্টোরের জনসংখ্যায় ফলের ভরগুলি সাধারণত বিতরণ করা হয় এবং ব্যাসক এবং পচা অবস্থা থেকে পৃথক হয় তবে কেউ আরও জটিল পদ্ধতির ব্যবহারের কোনও সুবিধা ছাড়াই (বা একাধিক ভেরিয়েবলের নমুনা ত্রুটির অসুবিধাগুলি) ছাড়াই প্রথম, সহজ পদ্ধতির ব্যবহার করতে পারে one । যদি স্বতন্ত্ররূপে এলোমেলোভাবে ভেরিয়েবলগুলি বিতরণ করা না হয় তবে জনসংখ্যা সম্পর্কে পরিচিত বা ধরে নেওয়া তথ্যের উপর নির্ভর করে আরও জটিল পছন্দ আরও ভাল হতে পারে।


3
এগুলির কোনওটি কেন ভাল? তারা কী অনুমান করে? কীভাবে একজন অপরটিকে বেছে নেবে? (তারা কিছু অর্থে ধার্মিকতা আরোহী ক্রমানুসারে এছাড়াও রয়েছেন?)
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.