কত দিতে হবে? একটি ব্যবহারিক সমস্যা


66

এটি কোনও বাড়ির কাজের প্রশ্ন নয় তবে আমাদের সংস্থার মুখোমুখি আসল সমস্যা।

খুব সম্প্রতি (২ দিন আগে) আমরা একজন ডিলারের কাছে 10000 প্রোডাক্ট লেবেল তৈরির আদেশ দিয়েছি। ডিলার স্বতন্ত্র ব্যক্তি। তিনি বাইরে থেকে প্রস্তুতকৃত লেবেলগুলি সরবরাহ করেন এবং সংস্থাটি ডিলারের কাছে অর্থ প্রদান করে। প্রতিটি লেবেল ঠিক কোম্পানির জন্য 1 ডলার খরচ করে।

গতকাল, ডিলার লেবেল নিয়ে এসেছিল তবে প্রতিটি লেবেল 100 টি লেবেলের প্যাকেটে বান্ডিল করা হয়েছিল। এইভাবে মোট 100 প্যাকেট ছিল এবং প্রতিটি প্যাকেটে 100 টি লেবেল ছিল, সুতরাং মোট 10000 লেবেল ছিল। 00 10000 এর ডিলারের কাছে অর্থ প্রদানের আগে, প্রতিটি প্যাকেটে ঠিক 100 টি লেবেল রয়েছে তা নিশ্চিত করার জন্য আমরা কয়েকটি প্যাকেট গণনা করার সিদ্ধান্ত নিয়েছি। আমরা যখন লেবেলগুলি গণনা করি তখন আমরা প্যাকেটটি 100 টি লেবেলের সংক্ষিপ্ত দেখতে পেয়েছি (আমরা 97 টি লেবেল পেয়েছি)। এটি সুযোগটি না হয়ে ইচ্ছাকৃতভাবে করা হয়েছে তা নিশ্চিত করার জন্য আমরা আরও পাঁচটি প্যাকেট গণনা করেছি এবং প্রতিটি প্যাকেটে নিম্নলিখিত সংখ্যক লেবেল পেয়েছি (প্রথম প্যাকেট সহ):

Packet Number    Number of labels
1                97 
2                98  
3                96
4                100
5                95 
6                97  

প্রতিটি প্যাকেট গণনা করা সম্ভব ছিল না, তাই আমরা গড় ভিত্তিতে অর্থ প্রদানের সিদ্ধান্ত নিয়েছি। সুতরাং, ছয় প্যাকেটে লেবেলের গড় সংখ্যা 97.166, সুতরাং মোট প্রদানের সিদ্ধান্ত নেওয়া হয়েছে $ 9716।

আমি কেবল জানতে চাই যে পরিসংখ্যানবিদদের অবশ্যই এই জাতীয় সমস্যার মোকাবেলা করতে হবে
আরও আমি জানতে চাই যে ৯৫% আশ্বাস পাওয়ার জন্য আমাদের সম্পূর্ণ লেবেলের প্রকৃত সংখ্যার চেয়ে বেশি অর্থ প্রদান করা হয়নি তার জন্য আমাদের কতটা অর্থ প্রদান করতে হবে।

অতিরিক্ত তথ্য:

পি (যে কোনও প্যাকেটে 100 টিরও বেশি লেবেল রয়েছে) = 0
পি (যে কোনও প্যাকেটে 90 এর চেয়ে কম লেবেল রয়েছে) = 0 pac প্যাকেটগুলি গণনার সময় 90 টিরও কম লেবেল সহজেই সনাক্ত করা যায় কারণ প্যাকেটটি কম ওজনের হবে}


সম্পাদনা: ডিলার কেবল এই ধরনের অপব্যবহারের বিষয়টি অস্বীকার করেন। আমরা দেখতে পেয়েছি যে এই ডিলার একটি নির্দিষ্ট কমিশনে কাজ করে যা তারা প্রস্তুতকারকের কাছ থেকে কোম্পানির অর্থ প্রদানের বিষয়ে পায় on আমরা যখন সরাসরি নির্মাতার সাথে যোগাযোগ করি, আমরা দেখতে পেলাম যে এটি নির্মাতা বা ডিলারের ত্রুটিও নয়। নির্মাতারা বলেছিলেন, "লেবেলগুলি সংক্ষিপ্ত হয়ে যায় কারণ শিটগুলি আকারে মানসম্মত হয় না এবং একক শীট থেকে যতই নম্বর কাটা হয় তারা সেগুলি প্যাকেটে একসাথে বান্ডিল পান"।

আরও, আমরা অতিরিক্ত তথ্যে প্রদত্ত আমাদের প্রথম দাবিটিকে বৈধতা দিয়েছি , কারণ নির্মাতারা স্বীকার করেছেন যে শীটের আকারের প্রান্তিক বৃদ্ধি থেকে অতিরিক্ত লেবেল কাটা সম্ভব নয়, শীটের আকারের প্রান্তিক হ্রাস থেকে এটি কাটা সম্ভব নয় ঠিক একই আকারের 100 টি লেবেল।


7
+1 (1) "অতিরিক্ত তথ্য" বিভাগে প্রথম উক্তিটিকে আপনি কীভাবে ন্যায়সঙ্গত করতে পারেন? (২) প্যাকেটগুলি আপনি কতটা সঠিকভাবে ওজন করতে পারেন?
হুবুহু

15
ইংল্যান্ড এবং আইজ্যাক নিউটন 300 বছর আগে একই সমস্যার মুখোমুখি হয়েছিল। (দাগ কিছুটা বড় ছিল, কারণ প্রশ্নে থাকা "লেবেলগুলি" মুদ্রিত মুদ্রা ছিল।) সুতরাং আপনি স্টিফেন স্টিলারের অ্যাকাউন্ট অফ পাইক্সের ট্রায়াল সম্পর্কিত স্ট্যাটাসউইস.ইডু / সাইটস / ডিফল্ট / ফাইলস / টিআর 442_0.pdf পড়তে উপভোগ করতে পারেন ।
হোবার

7
@ নীরাজ যদি সমস্ত আইটেমের ওজন সামঞ্জস্যপূর্ণ হয় তবে কেবল পুরো সরবরাহের ওজন কেন নয়?
সাইকোরাক্স

9
অফার $ 9000 দিতে এবং অপেক্ষা করুন তাদের বলার জন্য "কিন্তু আমরা শুধুমাত্র আপনি 600 1000 না shorted"
ডিন MacGregor

5
দুর্দান্ত পরিসংখ্যানের প্রশ্নটি বাদ দিয়ে, +1, আমি মুদ্রণ ব্যবসায় বছরের পর বছর থেকে পরামর্শের আরও সরাসরি অংশটি ভাগ করে নিতে চেয়েছিলাম: সমস্ত সঠিক, পেশাদার প্রিন্টারের এ জাতীয় ওভাররন / আন্ডারআন পলিসি থাকে কারণ বেশিরভাগ মুদ্রকগুলি সঠিক গণনা দেয় না on "সংখ্যায়ন" (স্বতন্ত্র ক্রমিক সংখ্যা) ব্যবহার করে না এমন কিছু। তবে তারা আপনাকে যা দিয়েছে তার একটি দুর্দান্ত গণনা থাকতে হবে এবং যদি ছোট থেকে বেশি (5%, বলুন) ছাড় দেয় তবে আপনাকে ছাড় দেওয়া হয়। জ্ঞাত আন্ডারআরনের জন্য পুরো মূল্য চার্জ করা মান নীতি নয়।
ব্রায়ানএইচ

উত্তর:


20

মডেলটির বিশেষ অংশটি আমাকে রাতে রাখছিল বলে আমি "প্রতিবিম্বের উপরে ..." শুরু করে অনুচ্ছেদে মতামত জানাতে আগ্রহী।

বায়েশিয়ান মডেল

সংশোধিত প্রশ্ন আমাকে ভাবায় যে আমরা সিমুলেশন ব্যবহার না করেই স্পষ্টভাবে মডেলটি বিকাশ করতে পারি। স্যাম্পলিংয়ের অন্তর্নিহিত এলোমেলোতার কারণে সিমুলেশন অতিরিক্ত পরিবর্তনশীলতার পরিচয় দেয়। সোফোলজিস্টদের উত্তরটি দুর্দান্ত।

অনুমান : খামে প্রতি লেবেলের ক্ষুদ্রতম সংখ্যা 90, এবং বৃহত্তম 100 টি।

অতএব, সামান্যতম সম্ভাব্য লেবেলের সংখ্যা 9000 + 7 + 8 + 6 + 10 + 5 + 7 = 9043 (ওপির ডেটা দ্বারা প্রদত্ত), আমাদের নিম্ন সীমাবদ্ধতার কারণে 9000 এবং পর্যবেক্ষণ করা ডেটা থেকে অতিরিক্ত লেবেল আসছে।

বোঝাতে একটা খাম লেবেল সংখ্যা । বোঝাতে 90 ওভার লেবেলের নম্বর, অর্থাত , তাই । দ্বিপদ বিন্যাস মডেল সফলতাগুলি মোট সংখ্যা (এখানে একটি সাফল্য একটা খাম মধ্যে একটি লেবেল উপস্থিতিতে হয়) বিচারের যখন বিচারের ধ্রুবক সাফল্য সম্ভাব্যতা সঙ্গে স্বাধীন তাই মান লাগেআমরা , যা 11 টি বিভিন্ন সম্ভাব্য ফলাফল দেয়। আমি ধরে নিই যে শীটের আকারগুলি অনিয়মিত, কিছু শীটে কেবল জন্য জায়গা রয়েছে আমি এক্স আমি এক্স = ওয়াই - 90 এক্স { 0 , 1 , 2 , , 10 }YiiXiX=Y90X{0,1,2,...,10}npX0,1,2,3,...,n.n=10X90 বেশী অতিরিক্ত লেবেল, এবং 90 অতিরিক্ত প্রতিটি লেবেলের জন্য এই "অতিরিক্ত স্থান" সম্ভাব্যতা সঙ্গে স্বাধীনভাবে যেটা । সুতরাংpXiBinomial(10,p).

(প্রতিবিম্বিত হওয়ার পরে, স্বাধীনতা অনুমান / দ্বিপদী মডেলটি সম্ভবত একটি অদ্ভুত ধারণা গ্রহণ করা হয়, যেহেতু এটি প্রিন্টারের শীটগুলির গঠনটি অবিমোচনীয়ভাবে কার্যকরভাবে সংশোধন করে এবং ডেটা কেবল মোডের অবস্থান পরিবর্তন করতে পারে তবে মডেলটি কখনই স্বীকার করবে না একটি মাল্টিমোডাল বিতরণ example উদাহরণস্বরূপ, একটি বিকল্প মডেলের অধীনে, এটি কেবল প্রিন্টারই সম্ভব97, 98, 96, 100 এবং 95 মাপের শীট রয়েছে: এটি সমস্ত বর্ণিত প্রতিবন্ধকতাগুলিকে সন্তুষ্ট করে এবং ডেটা এই সম্ভাবনাটি বাদ দেয় না। প্রতিটি শিটের আকারটিকে তার নিজস্ব বিভাগ হিসাবে বিবেচনা করা এবং তারপরে ডেটাতে একটি ডিরিচলেট-মাল্টিনোমিয়াল মডেল ফিট করা আরও উপযুক্ত হতে পারে। আমি এখানে এটি করি না কারণ ডেটাগুলি এতটাই দুর্লভ, সুতরাং 11 টি বিভাগের প্রত্যেকটিতে পরবর্তী সম্ভাবনাগুলি পূর্বের দ্বারা খুব দৃ strongly়ভাবে প্রভাবিত হবে। অন্যদিকে, সহজ মডেলটি ফিট করে আমরা একইভাবে আমরা যে ধরণের ইনফরমেশনগুলি তৈরি করতে পারি তা সংকুচিত করছি ))

প্রতিটি খাম একটি আইডি উপলব্ধি । একই সাফল্যের সম্ভাব্যতা , তাই(এটি একটি উপপাদ্য - যাচাই করতে, এমজিএফ স্বতন্ত্রতা উপপাদ্যটি ব্যবহার করুন))iXpiXiBinomial(60,p).

আমি বায়েশিয়ান মোডে এই সমস্যাগুলি সম্পর্কে ভাবতে পছন্দ করি কারণ আপনি উত্তরের পরিমাণের আগ্রহের বিষয়ে সরাসরি সম্ভাবনা বিবৃতি দিতে পারেন। অজানা সহ দ্বিপদী ট্রায়ালগুলির একটি সাধারণ পূর্ববর্তীটি হ'ল বিটা বিতরণ , যা খুব নমনীয় (0 এবং 1 এর মধ্যে পরিবর্তিত হয়) উভয় দিকের, ইউনিফর্ম বা দুটি ডায়রাকের মধ্যে একটির মধ্যে প্রতিসম বা অ্যাসিম্যাট্রিক হতে পারে, একটি অ্যান্টিমোড বা মোড থাকতে পারে .. এটি একটি আশ্চর্যজনক সরঞ্জাম!)। ডেটার অভাবে, চেয়ে অভিন্ন সম্ভাবনা ধরে নেওয়া যুক্তিসঙ্গত বলে মনে হয় । যে এক একটি চাদর 90 লেবেল মিটমাট হিসাবে প্রায়ই 91 হিসেবে দেখতে আশা করতে পারে, যেমন প্রায়ই 92 যেমন, ... যতবার 100 সুতরাং আমাদের পূর্বে হয়,pppBeta(1,1).যদি আপনি এই বিটা পূর্বটিকে যুক্তিসঙ্গত বলে মনে করেন না, তবে ইউনিফর্ম পূর্বেরটিকে অন্য একটি বিটা পূর্বের সাথে প্রতিস্থাপন করা যেতে পারে, এবং গণিতে এমনকি অসুবিধা বাড়বে না!

উপর অবর বন্টন হয় এই মডেলের conjugacy বৈশিষ্ট্য দ্বারা। এটি কেবলমাত্র একটি মধ্যবর্তী পদক্ষেপ, কারণ আমরা মোট লেবেলের সংখ্যার জন্য যতটা যত্ন নিই সেভাবে সম্পর্কে তেমন যত্ন নিই না । ভাগ্যক্রমে, সংযোগের বৈশিষ্ট্যগুলিও বোঝায় যে শীটের উত্তরীয় ভবিষ্যদ্বাণীমূলক বিতরণটি বিটা- বাইনোমিয়াল, বিটার উত্তরোত্তর পরামিতিগুলির সাথে। আছে reamining "বিচারের" অর্থাৎ লেবেল, যার জন্য বিতরণ তাদের উপস্থিতি অনিশ্চিত, তাই অবশিষ্ট লেবেলে আমাদের অবর মডেল হয়ppBeta(1+43,1+17)p940ZZBB(44,18,940).

এখানে চিত্র বর্ণনা লিখুন

যেহেতু আমাদের কাছে বিতরণ এবং প্রতি লেবেল মান রয়েছে (বিক্রেতা প্রতি লেবেল এক ডলারের সাথে সম্মত হয়েছে), আমরা লটের মানের চেয়েও সম্ভাবনা বন্টন অনুমান করতে পারি। লটের মোট ডলারের মান বোঝান । আমরা জানি যে , কারণ কেবলমাত্র সেই লেবেলের মডেল করে যা আমরা অনিশ্চিত। সুতরাং মূল্য ওভার বিতরণ দ্বারা দেওয়া হয় ।ZDD=9043+ZZD

প্রচুর মূল্য নির্ধারণের উপযুক্ত উপায় কী?

আমরা দেখতে পাচ্ছি যে 0.05 এবং 0.975 (একটি 95% ব্যবধান) এর কোয়ান্টাইলগুলি যথাক্রমে 553 এবং 769। সুতরাং ডি তে 95% ব্যবধান । আপনার পেমেন্ট সেই ব্যবধানে পড়ে। ( তে বিতরণ হুবহু প্রতিসাম্য নয়, সুতরাং এটি কেন্দ্রীয় 95% অন্তর নয় - তবে, অসমত্বটি নগণ্য Any যাইহোক, আমি নীচে বিশদভাবে বর্ণনা করেছি, আমি নিশ্চিত নই যে কেন্দ্রীয় 95% অন্তর এমনকি সঠিক কিনা এক বিবেচনা করুন!)[9596,9812]D

আমি আর-তে বিটা বাইনোমিয়াল বিতরণের জন্য কোয়ান্টাইল ফাংশন সম্পর্কে অবগত নই, তাই আমি আর এর মূল-অনুসন্ধানটি ব্যবহার করে নিজের লেখা wrote

qbetabinom.ab <- function(p, size, shape1, shape2){
    tmpFn <- function(x) pbetabinom.ab(x, size=size, shape1=shape1, shape2=shape2)-p
    q <- uniroot(f=tmpFn, interval=c(0,size))
    return(q$root)
}

এটি সম্পর্কে চিন্তা করার অন্য উপায়টি কেবল প্রত্যাশা সম্পর্কে চিন্তা করা। আপনি যদি এই প্রক্রিয়াটি বহুবার পুনরাবৃত্তি করেন তবে আপনি গড় মূল্য দিতে হবে? আমরা সরাসরি এর প্রত্যাশা গণনা করতে পারি । বিটা দ্বিপদী মডেলটির প্রত্যাশা রয়েছে , সুতরাং প্রায় ঠিক কী দিয়েছেন। চুক্তিতে আপনার প্রত্যাশিত ক্ষতিটি ছিল মাত্র 6 ডলার! সবাই বলেছে, ভাল হয়েছে!DE(D)=E(9043+Z)=E(Z)+9043.E(Z)=nαα+β=667.0968E(D)=9710.097,

তবে আমি নিশ্চিত নই যে এই পরিসংখ্যানগুলির মধ্যে কোনওটিই সবচেয়ে প্রাসঙ্গিক। সর্বোপরি, এই বিক্রেতা আপনাকে ঠকানোর চেষ্টা করছে! যদি আমি এই চুক্তিটি করছিলাম তবে আমি লটটির ন্যায্যমূল্যের দাম ভাঙার বিষয়ে চিন্তাভাবনা করা বন্ধ করে দিয়েছিলাম এবং যে পরিমাণ সম্ভাবনা বেশি ছিল তা নিয়ে কাজ শুরু করব! বিক্রেতা স্পষ্টতই আমাকে প্রতারণা করার চেষ্টা করছে, তাই আমার ক্ষয়ক্ষতি হ্রাস করতে এবং ব্রেক-ইওন পয়েন্টটি নিয়ে নিজেকে উদ্বেগ না করার জন্য আমি পুরোপুরি আমার অধিকারের মধ্যে আছি। এই সেটিং-এ, আমি যে সর্বোচ্চ দাম দেব তা হল 96৯১৫ ডলার, কারণ এটি উপরের 5% কোয়ান্টাইল , অর্থাত্ 95% সম্ভাবনা রয়েছে যা আমি ছাড়িয়ে যাচ্ছিD । বিক্রেতা আমার কাছে প্রমাণ করতে পারবেন না যে সমস্ত লেবেল রয়েছে, তাই আমি আমার বেট হেজ করতে চলেছি।

(অবশ্যই, বিক্রেতা যে চুক্তি স্বীকার করেছে তা আমাদের জানায় যে তার অবনতিহীন প্রকৃত ক্ষতি রয়েছে ... আপনি কী পরিমাণ প্রতারণা করেছেন তা আরও নিখুঁতভাবে নির্ধারণ করতে আমাদের সেই তথ্য ব্যবহারের উপায় খুঁজে বের করতে পারি নি, দ্রষ্টব্য ব্যতীত যেহেতু তিনি প্রস্তাবটি গ্রহণ করেছেন, আপনি এমনকি সেরা ব্রেকিং ছিলেন ))

বুটস্ট্র্যাপের সাথে তুলনা

আমাদের সাথে কাজ করার জন্য কেবল 6 টি পর্যবেক্ষণ রয়েছে। বুটস্ট্র্যাপের ন্যায়সঙ্গততা অ্যাসিম্পটোটিক, সুতরাং আসুন বিবেচনা করা যাক ফলাফলগুলি আমাদের ছোট নমুনায় কেমন লাগে। এই প্লটটি বুস্ট্র্যাপ সিমুলেশনের ঘনত্ব দেখায়। এখানে চিত্র বর্ণনা লিখুন

"গন্ধযুক্ত" প্যাটার্নটি ছোট নমুনার আকারের একটি শিল্পকর্ম। যে কোনও একটি পয়েন্টকে অন্তর্ভুক্ত করা বা বাদ দেওয়া নাটকীয়ভাবে প্রভাব ফেলবে, এই "গুচ্ছ" উপস্থিতি তৈরি করবে। বায়েশিয়ান পদ্ধতির মাধ্যমে এই ঝোঁকগুলি মসৃণ করা যায় এবং আমার মতে এটি কী ঘটছে তার একটি আরও বিশ্বাসযোগ্য প্রতিকৃতি। উল্লম্ব লাইনগুলি 5% কোয়ান্টাইলস।


এটি একটি দুর্দান্ত উত্তর। আপনি ঝুঁকির জন্য দণ্ডিত করে নতুন অন্তর্দৃষ্টি দিয়েছেন। ধন্যবাদ
নীরজ

1
আপনার প্রত্যাশিত ক্ষয়টি মাত্র $ 6 ছিল তা জানতে পেরে আমি খুশি হয়েছি। :-) একটি দুর্দান্ত প্রশ্নের জন্য আবার ধন্যবাদ।
সাইকোরাক্স

1
দ্বি-দ্বি বিতরণ যখন ট্রায়ালগুলিতে ধ্রুব সাফল্যের সম্ভাবনা সহ স্বতন্ত্র হয় তখন সাফল্যের সংখ্যাটিকে মডেল করে তাই মান লাগেআমরা , যা 11 টি বিভিন্ন সম্ভাব্য ফলাফল দেয়। আমি ধরে নিই যে শীটের আকারগুলি অনিয়মিত, কিছু শিটের মধ্যে 90 টির বেশি লেবেল থাকার জায়গা রয়েছে এবং প্রতিটি লেবেলের জন্য এই "অতিরিক্ত স্থান" সম্ভাবনা সাথে ঘটে । np0,1,2,3,....,n.n=10Xp
সাইকোরাক্স

1
পোইসন মডেল নিতে পারে । সুতরাং এটি প্যাকেট প্রতি লেবেল থাকার জন্য ইতিবাচক সম্ভাবনা নির্ধারণ করে । এখন, এই ডেটাতে কোনও যুক্তিসঙ্গত পোইসন মডেলের অধীনে আইটেমের সামান্য সম্ভাবনা রয়েছে , তবে কেউ পয়সন মডেল ব্যবহার করেননি কারণ এটি সীমাবদ্ধতার সম্মান করে না । 101 , 102 , 103 , , 10 6 10 6 0 এক্স 100,1,2,3,...101,102,103,...,1061060X10
সাইকোরাক্স


20

সম্পাদনা: ট্র্যাজেডি! আমার প্রাথমিক অনুমানগুলি ভুল ছিল! (বা সন্দেহের সাথে, কমপক্ষে - বিক্রয়কারী আপনাকে যা বলেছে তা আপনি কি বিশ্বাস করেন? তবুও, মর্টেনের কাছেও টুপি দেওয়া টিপ।) আমার ধারণা যে পরিসংখ্যানগুলির আরও একটি ভাল ভূমিকা, তবে আংশিক শীট পদ্ধতির এখন নীচে যুক্ত করা হয়েছে ( যেহেতু লোকেরা পুরো পত্রকটি পছন্দ করেছে এবং সম্ভবত এখনও কেউ এটির কাজে লাগবে)।

প্রথমত, দুর্দান্ত সমস্যা। তবে আমি এটিকে আরও জটিল করে তুলতে চাই।

তার কারণ হিসাবে, আমি করার আগে, আমাকে এটি একটু সহজ করে তুলুন এবং বলুন - আপনি এখন যে পদ্ধতিটি ব্যবহার করছেন তা পুরোপুরি যুক্তিযুক্ত । এটি সস্তা এটি বোধগম্য। সুতরাং এটির সাথে যদি আপনাকে আটকে থাকতে হয় তবে আপনার খারাপ লাগা উচিত নয়। কেবল নিশ্চিত হয়ে নিন যে আপনি নিজের বান্ডেলগুলি এলোমেলোভাবে চয়ন করেছেন। এবং, যদি আপনি কেবল নির্ভরযোগ্যভাবে সমস্ত কিছু ওজন করতে পারেন (হুবহু এবং ব্যবহারকারী 777 এর টুপি), তবে আপনার এটি করা উচিত।

যদিও আমি এটিকে আরও জটিল করে তুলতে চাই তা হ'ল আপনার ইতিমধ্যে - আপনি কেবল আমাদের পুরো জটিলতা সম্পর্কে বলেননি, এটি হ'ল - গণনাতে সময় লাগে, এবং সময়ও অর্থ হয় । তবে কত ? সম্ভবত এটি সমস্ত কিছু গণনা করা সস্তা!

সুতরাং আপনি কী করছেন তা আপনার গণ্যমান সময়গুলির ভারসাম্য বজায় রাখা এবং আপনি যে পরিমাণ অর্থ সঞ্চয় করছেন তা দিয়ে ncing (যদি অবশ্যই, আপনি কেবল একবার এই গেমটি খেলেন N পরবর্তী সময় আপনি যখন বিক্রেতার সাথে এটি ঘটবে, তারা হয়ত তাদের ধরে ফেলবে এবং একটি নতুন কৌশল চেষ্টা করেছিল game গেমের তত্ত্বে, এটি একক শট গেমসের মধ্যে পার্থক্য te গেমস। তবে আপাতত, আসুন ভান করা যাক বিক্রেতা সর্বদা একই কাজ করবে))

যদিও আমি অনুমান করতে পারার আগে আরও একটি জিনিস। (এবং, দুঃখিত যে এত কিছু লিখেছেন এবং এখনও উত্তরটি পেয়েছেন না, তবে এটি একটি খুব ভাল উত্তর যা কোনও পরিসংখ্যানবিদ কী করবে? তারা সমস্যার প্রতিটি ক্ষুদ্র অংশ বুঝতে পেরেছিল তা নিশ্চিত করার জন্য তারা প্রচুর সময় ব্যয় করবে) তারা এ সম্পর্কে কিছু বলতে স্বাচ্ছন্দ্যবোধ করার আগে)) এবং সেই জিনিসটি নীচের উপর ভিত্তি করে অন্তর্দৃষ্টি is

(সম্পাদনা করুন: যদি তারা সত্যই প্রতারণা করে ...) আপনার বিক্রেতা লেবেলগুলি সরিয়ে অর্থ সঞ্চয় করে না - তারা শীট প্রিন্ট না করে অর্থ সাশ্রয় করে। তারা আপনার লেবেল অন্য কারও কাছে বিক্রি করতে পারবে না (আমি ধরে নিই)। এবং সম্ভবত, আমি জানি না এবং আমি জানি না আপনি কি করেন, তারা আপনার জিনিসগুলির অর্ধেক শীট, এবং অন্য কারোর অর্ধেক শীট প্রিন্ট করতে পারে না। অন্য কথায়, আপনি এমনকি গণনা শুরু করার আগে, আপনি ধরে নিতে পারেন মোট লেবেলগুলির একটিও হয় 9000, 9100, ... 9900, or 10,000। আমি এখনই এটির কাছে যাব।

পুরো শীট পদ্ধতি

যখন এই সমস্যাটির মতো সমস্যাটি কিছুটা জটিল (বিযুক্ত এবং আবদ্ধ) হয়, তখন প্রচুর পরিসংখ্যানবিদরা যা ঘটতে পারে তা অনুকরণ করে। আমি যা অনুকরণ করেছি তা এখানে:

# The number of sheets they used
sheets <- sample(90:100, 1)
# The base counts for the stacks
stacks <- rep(90, 100)
# The remaining labels are distributed randomly over the stacks
for(i in 1:((sheets-90)*100)){
    bucket <- sample(which(stacks!=100),1)
    stacks[bucket] <- stacks[bucket] + 1
}

তারা আপনাকে পুরো শীট ব্যবহার করছে বলে ধরে নিচ্ছে এবং আপনার অনুমানগুলি সঠিক, আপনার লেবেলের একটি সম্ভাব্য বিতরণ (প্রোগ্রামিং ভাষায় আর) This এটি আপনাকে দেয়।

তারপরে আমি এটি করেছি:

alpha = 0.05/2
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    print(round(quantile(s, probs=c(alpha, 1-alpha)), 3))
}

এটি "বুটস্ট্র্যাপ" পদ্ধতি ব্যবহার করে, 4, 5, ... 20 টি নমুনা ব্যবহার করে আত্মবিশ্বাসের ব্যবধানগুলি আবিষ্কার করে। অন্য কথায়, গড়ে যদি আপনি এন নমুনা ব্যবহার করেন তবে আপনার আত্মবিশ্বাসের ব্যবধানটি কতটা বড় হবে? আমি শীট সংখ্যা নির্ধারণের জন্য যথেষ্ট ছোট এমন একটি বিরতি খুঁজে পেতে এটি ব্যবহার করি এবং এটি আমার উত্তর।

"যথেষ্ট পরিমাণে", এর অর্থ আমার 95% আত্মবিশ্বাসের ব্যবধানটির মধ্যে কেবলমাত্র একটি সম্পূর্ণ সংখ্যা রয়েছে - যেমন আমার আত্মবিশ্বাসের ব্যবধান যদি [93.1, 94.7] থেকে থাকে তবে আমি শীটগুলির সঠিক সংখ্যা হিসাবে 94 বেছে নেব, কারণ আমরা জানি এটি একটি সম্পূর্ণ সংখ্যা।

যদিও অন্য কোনও অসুবিধা - আপনার আত্মবিশ্বাস সত্যের উপর নির্ভর করে । আপনার যদি 90 টি শিট থাকে এবং প্রতিটি স্তূপে 90 টি লেবেল থাকে তবে আপনি সত্যই দ্রুত রূপান্তর করতে পারেন। 100 শিট সঙ্গে একই। সুতরাং আমি 95 টি শিটের দিকে চেয়েছিলাম, যেখানে সবচেয়ে বড় অনিশ্চয়তা রয়েছে এবং আমি পেয়েছি যে 95% নিশ্চিততা পেতে আপনার গড়ে গড়ে প্রায় 15 টি নমুনা দরকার। সুতরাং আসুন সামগ্রিকভাবে বলা যাক, আপনি 15 টি নমুনা নিতে চান, কারণ বাস্তবে কী আছে তা আপনি কখনই জানেন না।

আপনার কতটি নমুনা প্রয়োজন তা জানার পরে, আপনি জানেন যে আপনার প্রত্যাশিত সঞ্চয়স্থানগুলি:

100Nmissing15c

c50015

আপনাকে এই সমস্ত কাজটি করার জন্য আপনার লোকটিকেও চার্জ করা উচিত!

(সম্পাদনা: সংযোজন!) আংশিক শীট পদ্ধতির

ঠিক আছে, সুতরাং ধরে নেওয়া যাক প্রস্তুতকারক যা বলছেন তা সত্য এবং এটি উদ্দেশ্যমূলক নয় - প্রতিটি শীটে কয়েকটি লেবেল সবেমাত্র হারিয়ে গেছে। আপনি এখনও জানতে চান, সামগ্রিকভাবে কতগুলি লেবেল রয়েছে?

এই সমস্যাটি আলাদা কারণ আপনার আর একটি দুর্দান্ত পরিষ্কার সিদ্ধান্ত নেই যা আপনি নিতে পারেন - পুরো শীট অনুমানের জন্য এটি ছিল একটি সুবিধা। এর আগে, কেবলমাত্র 11 টি উত্তর ছিল - এখন, 1100 টি রয়েছে এবং ঠিক কতটি লেবেল রয়েছে সে সম্পর্কে 95% আত্মবিশ্বাসের ব্যবধান পাওয়া আপনার ইচ্ছার চেয়ে অনেক বেশি নমুনা নিতে পারে। সুতরাং, আসুন আমরা এই সম্পর্কে আলাদাভাবে চিন্তা করতে পারি কিনা তা দেখুন।

এটি আপনার সিদ্ধান্ত নেওয়ার বিষয়ে সত্যই তাই আমরা এখনও কয়েকটি পরামিতি মিস করছি - একক চুক্তিতে আপনি কত টাকা হারাতে ইচ্ছুক, এবং একটি স্ট্যাক গণনা করতে কত টাকা ব্যয় করতে হবে। তবে এই সংখ্যাগুলির সাথে আপনি যা করতে পারেন তা আমাকে সেট আপ করুন।

আবার সিমুলেটিং (যদিও ব্যবহারকারী 777 এর কাছে প্রপসগুলি যদি আপনি এটি না করেই করতে পারেন!), বিভিন্ন সংখ্যক নমুনা ব্যবহার করার সময় অন্তরগুলির আকারটি অনুসন্ধান করা তথ্যগত। এটি এইভাবে করা যেতে পারে:

stacks <- 90 + round(10*runif(100))
q <- array(dim=c(17,2))
for(i in 4:20){
    s <- replicate(1000, mean(sample(stacks, i)))
    q[i-3,] <- quantile(s, probs=c(.025, .975))
}
plot(q[,1], ylim=c(90,100))
points(q[,2])

যা ধরে নিয়েছে (এবার) যে প্রতিটি স্ট্যাকের 90 থেকে 100 এর মধ্যে অভিন্ন র্যান্ডম সংখ্যার লেবেল থাকে এবং আপনাকে দেয়:

নমুনার সংখ্যা অনুসারে আত্মবিশ্বাসের বিরতিতে সীমাবদ্ধ

অবশ্যই, যদি জিনিসগুলি সত্যই সিমুলেটেড করার মতো হয়, তবে সত্যিকারের গড় স্ট্যাক প্রতি প্রায় 95 টি নমুনা হবে, যা সত্য বলে মনে হয় তার চেয়ে কম - এটি বেয়েশিয়ার পদ্ধতির পক্ষে সত্যই একটি যুক্তি। তবে, এটি আপনাকে একটি দরকারী ধারণা দেয় যে আপনি নিজের উত্তর সম্পর্কে আরও কতটা নির্দিষ্ট হয়ে উঠছেন, যেমন আপনি নমুনা অবিরত রেখেছেন - এবং আপনি এখন স্পষ্টভাবে স্যাম্পলিংয়ের ব্যয় নির্ধারণ করতে পারবেন যে কোনও মূল্যে আপনি যে চুক্তি করবেন।

যা আমি এতক্ষণে জানি, আমরা সকলেই শুনতে আগ্রহী।


6
+1 এই বিশ্লেষণটি প্রত্যক্ষ এবং সৃজনশীলভাবে প্রশ্নটির সমাধান করে: কীভাবে একজন (ভাল) পরিসংখ্যানবিদ সমস্যাটি ভাবেন? শীট গণনা উপর দৃষ্টি নিবদ্ধ করা একটি মূল্যবান অন্তর্দৃষ্টি।
হোয়াট

1
ব্যয়-বেনিফিট পদ্ধতির একটি দুর্দান্ত ধারণা। ইতিমধ্যে আমি বলতে চাই যে এই সমস্যাটির জন্য নিবেদিত সমবেত ব্যক্তি * ব্রেইন পাওয়ারের কয়েক ঘন্টা নীরজ ব্যবহৃত ন = 6 নমুনা থেকে 284 ডলার সাফল্য অতিক্রম করেছে। :)
রবার্টএফ

1
চমৎকার উত্তর. আপনি বর্তমানে এটি কোড করে গেছেন, মুদ্রকটি যখন একটি পুরো স্ট্যাক তুলে নিয়েছে তখন সে কেবল অতিরিক্ত লেবেলটি মাটিতে ফেলে দেয় যা সম্ভবত যুক্তিযুক্ত। তবে আপনি যদি 9000,9100...10000শেষে মোট লেবেল রাখতে চান তবে আপনার যদি যুক্তিটি যুক্ত করে প্রতিস্থাপন করতে পারেন bucket <- sample(which(stacks!=100),1)এবং তারপরে সর্বদা স্ট্যাকটি বৃদ্ধি করুন।
অ্যাডাম সি

1
আহ, খালি খেয়াল করলাম নিজেই! ধরার জন্য ধন্যবাদ অবশ্যই ভুল।
এক_বীক্ষণ

1
আত্মবিশ্বাসের ব্যবধানগুলি কীভাবে গণনা করছেন? বুটস্ট্র্যাপ ব্যবহার করছেন?
রবার্টএফ

3

এটি একটি মোটামুটি সীমাবদ্ধ নমুনা। (কোড স্নিপেটগুলি আর মধ্যে রয়েছে)

> sample <- c(97,98,96,100,95,97)

মোট জনসংখ্যার প্রত্যাশিত সংখ্যায় প্রাথমিক অনুমানের জন্য এবং মূল্যের জন্য একটি 95% আত্মবিশ্বাস মান আমরা গড় এবং 5% কোয়ান্টাইল দিয়ে শুরু করতে পারি

> 100*mean(sample)
[1] 9716.667
> 100*quantile(sample,0.05)
  5% 
9525 

আরও যেতে, আমাদের একটি তাত্ত্বিক মডেল তৈরি করতে হবে এবং অতিরিক্ত অনুমান করতে হবে। খেলতে অনিশ্চয়তার বেশ কয়েকটি উত্স রয়েছে - (১) প্যাকেট ভরাটের মডেলটির কার্যকরী ফর্মের জন্য অনিশ্চয়তা, (২) মডেলটির জন্য প্যারামিটারগুলি অনুমান করার ক্ষেত্রে অনিশ্চয়তা এবং (৩) নমুনা ত্রুটি।

pn=100p

> n <- 100
> (p<-1-mean(sample)/100)
[1] 0.02833333

n100np10

> (lambda <- n*p)
[1] 2.833333

λ=lambda

> var(sample)
[1] 2.966667

λr=100*lambda

> 100*100-100*lambda
[1] 9716.667
> 100*100-qpois(0.95,100*lambda)
[1] 9689

ppαβαβα=1β=0

α=1+583β=0+17

αβαβ

এখন প্রতিটি প্যাকেটটি স্বতন্ত্রভাবে পূর্ণ হয়ে গেছে বলে ধরে নেওয়া, আমরা প্যাকেটগুলির পুরো বাক্সটি 100 টি সুবেভেন্টের 100 ইভেন্টের পরিবর্তে 10000 স্বাধীন ইভেন্ট হিসাবে দেখতে পারি can গড়টি হ'ল 9717.138 স্ট্যান্ডার্ড বিচ্যুতি 69.57153 সহ। বিতরণ ফাংশনটি ব্যবহার করে আপনি 9593 এর কাছাকাছি হওয়া 95% আত্মবিশ্বাসের সংখ্যা গণনা করতে পারেন I've এটি করার জন্য আমি আর প্যাকেজটি VGAMএর *betabinom.abকার্যকারিতার জন্য ব্যবহার করেছি ।

সুতরাং, আনুমানিক প্যারামিটারের অনিশ্চয়তা 95% আত্মবিশ্বাসের দামকে প্রায় 100 দ্বারা হ্রাস করে এবং আমরা আমাদের প্রাথমিক সাধারণ আনুমানিকতার প্রায় কাছাকাছি পৌঁছে যাই।

মতামত বা মডেল যাই হউক না কেন, অতিরিক্ত ডেটা মডেলটি যাচাই করতে ব্যবহার করা যেতে পারে, তা হল তাত্ত্বিক মডেলের অধীনে অতিরিক্ত ডেটা যুক্তিসঙ্গত রয়েছে বা অ্যাডজাস্টমেন্ট বা কোনও নতুন মডেল বাছাই হয়েছে কিনা তা দেখতে। মডেলিং প্রক্রিয়া বৈজ্ঞানিক পদ্ধতির অনুরূপ।


2

একটি চিম্টিতে, আমার প্রথম প্রবণতাটি আপনার নমুনার জন্য একটি 95% আত্মবিশ্বাসের ব্যবধান গণনা করা হবে 90 এবং 100 লেবেলের নীচের এবং উপরের সীমানার মধ্যবর্তী একটি কাটা সাধারণ বিতরণকে বোঝানো ।

আর প্যাকেজ truncnormআপনাকে একটি নির্দিষ্ট নমুনা গড়, নমুনা স্ট্যান্ডার্ড বিচ্যুতি, নিম্ন সীমাবদ্ধ এবং উপরের সীমা দ্বারা প্রদত্ত কাটা সাধারণ বিতরণের জন্য আত্মবিশ্বাসের ব্যবধানগুলি সন্ধান করতে দেয়।

যেহেতু আপনি অপেক্ষাকৃত কম জনসংখ্যার (এন = 100) থেকে এন = 5 এর নমুনা নিচ্ছেন, সুতরাং আপনি আপনার সীমাবদ্ধ মান বিচ্যুতিটিকে একটি সীমাবদ্ধ জনসংখ্যার ফ্যাক্টর = [(এনএন) / (এন -1)] দ্বারা গুণতে চাইতে পারেন ^ ^ 5 = 0.98।


5
আমি বিস্মিত হয়েছি যে সংক্ষিপ্ততর সাধারণকে ধরে নেওয়া অতিরিক্ত জটিলতাগুলি উপযুক্ত - বা এমনকি বৈধ - এই বিবেচনা করে যে গণনাগুলি পৃথক এবং কেবলমাত্র কয়েকটি সংখ্যক সম্ভাব্য মানই গ্রহণ করতে পারে।
হোয়বার

@ হুইবার - সত্য, তবে আত্মবিশ্বাসের ব্যবধানটি নমুনা বন্টনের চেয়ে বেশি, যা একটি ধারাবাহিক পরিমাণ। বদলে 95% আস্থা ব্যবধান ব্যবহার করেন, সম্ভবত একটি ভাল পছন্দ বিযুক্ত পরিমাণে মধ্যে বন্টন অধীনে এলাকায় এটি হতে পারে, 93 এবং 99. বলতে হবে
RobertF

যদিও, নমুনাটির সাথে কাজ করার জন্য আপনাকে ছাঁটাই করা সাধারণের প্রয়োজন হবে না। এটি একটি অপ্রয়োজনীয় জটিলতার মতো দেখায়।
হোবল

1
সিএলটি দৃ as়তা দেয় না যে কোনও কিছু কাটা সাধারণ বিতরণ অনুসরণ করবে। বুটস্ট্র্যাপিং সমস্যাযুক্ত হতে পারে কারণ এটি এর বৈধতার জন্য অ্যাসিম্পটোটিক ফলাফলের উপর নির্ভর করে।
হোবল

1
যেহেতু গড়ের মানক বিচ্যুতিটি পরিসরের তুলনায় দ্রুত অনেক ছোট হয়ে যায়, তাই কাটাটি কার্যত অপ্রাসঙ্গিক। আমরা এমন একটি ব্যবহারিক সমাধানের বিষয়ে কথা বলছি যা অপ্রয়োজনীয় এবং সম্ভবত বিভ্রান্তিকর বিশদ দ্বারা আবদ্ধ নয়।
whuber

2

একটি দ্রুত এবং সহজ পদ্ধতির হ'ল আকারের সমস্ত সম্ভাব্য প্রতিকারগুলি বিবেচনা করা There এখানে কেবল 15,625 ক্রমান্বন রয়েছে। এগুলি দেখে এবং প্রতিটি ক্ষেত্রে গড় নেওয়া, এবং তারপরে গড়গুলি বাছাই করা এবং 5% কোয়ান্টাইল বের করা, আমরা 96 এর মান পাই।

সুতরাং আপনাকে যে আনুমানিক পরিমাণ অর্থ দিতে ইচ্ছুক হতে হবে তা প্রায় 9600। এটি আরও কয়েকটি পরিশীলিত পদ্ধতির সাথে ভাল চুক্তিতে।

এখানে উন্নতি হ'ল বিশাল আকারের 6 টি নমুনার সিমুলেট করা এবং স্যাম্পলটির 5 তম পার্সেন্টাইল সন্ধানের জন্য একই পদ্ধতিটি ব্যবহার করা। এক মিলিয়নের চেয়ে কিছু বেশি রেসামাল ব্যবহার করে আমি পঞ্চম পার্সেন্টাইলটি 96.1667 হিসাবে পেয়েছি, সুতরাং নিকটতম ডলারের পেমেন্ট হবে 9617 ডলার, যা ইউজার 777 এর's৯১15 এর ফলাফলের চেয়ে মাত্র ২ ডলার পার্থক্য।


1
আপনি কী ব্যাখ্যা করতে পারেন যে এটি কেন একটি উপযুক্ত উত্তর কেন কত মূল্য দেওয়া উচিত? উদাহরণস্বরূপ, কেন নমুনাটির মাধ্যমটি ব্যবহার করবেন না?
শুক্র

আপনি যদি নমুনাটি ব্যবহার করতে চান তবে আপনি যদি এমন কোনও পেমেন্ট রাখতে চান যা আপনার মনে হয় কতগুলি লেবেল রয়েছে। তবে প্রশ্নকর্তা 95% আশ্বাস চেয়েছিলেন যে তিনি যত বেশি লেবেল তৈরি করেছিলেন তার চেয়ে বেশি অর্থ প্রদান করবেন না। সুতরাং আমরা 6 মাপের নমুনার জন্য নমুনা বন্টনের ধারণা পেয়েছি এবং 5 তম পার্সেন্টাইল ব্যবহার করি।
soakley

1
আপনার উত্তরে সেই ব্যাখ্যাটি অন্তর্ভুক্ত করা ভাল হবে। আপনি কেন এই পুনর্নির্মাণ প্রক্রিয়াটি আসলে একটি বৈধ বা নির্ভরযোগ্য আত্মবিশ্বাসের সীমা তৈরি করে বলে আপনি ব্যাখ্যা করার বিষয়ে বিবেচনা করতে পারেন। যদিও এটি অনেক বড় ডেটাসেটের সাথে এটি করতে পারে তবে এটিকে একটি ছোট্ট ডেটাসেটের সাথে একইভাবে ব্যবহার করা যায় কিনা তা বিবেচনা করা উচিত।
হোয়বার

0

দেখে মনে হচ্ছে আপনি ইতিমধ্যে ত্রুটিটি ইচ্ছাকৃতভাবে সম্পন্ন করেছেন বলে সিদ্ধান্ত নিয়েছেন, তবে একজন পরিসংখ্যানবিদ এই সিদ্ধান্তে ঝাঁপিয়ে পড়বেন না (যদিও প্রমাণগুলি এটিকে সমর্থন করে বলে মনে হচ্ছে)।

এটি একটি অনুমান পরীক্ষা হিসাবে সেট আপ করতে পারে:

এইচ 0: ডিলার সৎ তবে বেশ আস্তে আস্তে

এইচ 1: ডিলার প্রতারণামূলক, এবং ঘাটতি ইচ্ছাকৃত।

আসুন এইচ 0 ধরে নেওয়া যাক, তবে প্রতিটি বিচ্যুতিটি গড় = 0 এবং ধনাত্মক বা নেতিবাচক হওয়ার সমান সম্ভাবনা সহ একটি এলোমেলো ঘটনা। আসুন আরও ধরে নেওয়া যাক যে বিচ্যুতিগুলি সাধারণত বিতরণ করা হয়। 6 ডেটা পয়েন্টের বিচরণের উপর ভিত্তি করে সাধারণ বিতরণের মানক বিচ্যুতি sd = 1.722

যদি পরিসংখ্যানবিদ তার তত্ত্বটি খুব ভালভাবে মনে না রাখেন তবে কাছাকাছি আর থাকলে (কোনও সম্ভাবনা নেই) তখন H0 হলে কোনও ধনাত্মক বিচ্যুতি (100 এর বেশি প্যাকেজ নেই) পাওয়ার সম্ভাবনা যাচাই করার জন্য তিনি নিম্নলিখিত কোডটি লিখতে পারতেন সত্য।

numpackages=c(97,98,96,100,95,97)
error<-100-numpackages
errorStdev<-sd(error)
numSimulations<-1000000
max100orLes<-0
for(p in 1:numSimulations)
{
  simulatedError<-rnorm(6,mean=0,sd=errorStdev)

  packageDeviations<-round(simulatedError)

  maxValue<-max(packageDeviations)
  if(maxValue<=0)
  {
    max100orLes<-max100orLes+1
  }   
}
probH0<-100*max100orLes/numSimulations
cat("The probability the H0 is correct is:",probH0,"%")

সিমুলেশন ফলাফল:

The probability the H0 is correct is: 5.3471 %

ডিলারের সৎ হওয়ার সম্ভাবনা কেবল 5.35% এবং এটি সম্ভবত সম্ভবত জালিয়াতির শিকার হয়েছেন।

যেহেতু আপনি বলছেন যে এটি কোনও হোমওয়ার্কের প্রশ্ন নয়, তবে আপনার সংস্থার জন্য একটি আসল পরিস্থিতি, তখন এটি সঠিক প্রত্যাশিত নম্বর লেবেল গণনার ক্ষেত্রে অনুশীলন হওয়া বন্ধ করে দিয়েছে, তবে পরিবর্তে এটি কীভাবে একটি অসাধু সরবরাহকারীকে পরিচালনা করতে হবে তার জটিল বিষয়।

আপনি এখান থেকে যা করেন, কেবলমাত্র পরিসংখ্যান দ্বারা উত্তর দেওয়া যায় না। এটি আপনার লিভারেজ এবং ডিলারের সাথে সম্পর্কের উপর খুব নির্ভর করে।

শুভকামনা করছি !

মর্টেন বুনেস গুস্তাভসেন


1
17/61.72/60.7017/6/0.704.01000.00003

ব্যর্থতা সর্বদা একটি বিকল্প, তাই আমি একটি ভুল হতে পারে ... আমার গণনা যাইহোক আমি সরবরাহ করা আর কোডে নথিভুক্ত করা হয়েছে, তাই আমি কীভাবে আমার ফলাফল পেয়েছি তা অবাক করার কোনও কারণ নেই। হ্যাঁ আমার ক্ষেত্রে এইচ 0 হাইপোথিসিসটি হ'ল ডিলারটি সৎ এবং তারপরে বিচ্যুতিগুলি 100 এর সাথে গড় হিসাবে এলোমেলো ওঠানামা করে my 0, -5, -3) যা প্রতিটি প্যাকেজের 100 থেকে বিচ্যুতি।
মর্টেন বুনেস গুস্তাভসেন 21'7

আমি সত্যিই কেবলমাত্র এই সাধারণ বিচ্যুতিটি ব্যবহার করি এবং samples টি নমুনা আঁকুন এবং সেগুলির কোনওটিই ০. এর চেয়ে বড় নয় কিনা তা পরীক্ষা করে দেখি ,000 ক্ষেত্রে 5.35% হতে দেখা যাচ্ছে। আমি এই কোণটি বেছে নেওয়ার কারণটি ছিল যে প্রশ্নটি স্পষ্টভাবে বলেছিল যে এটি আসল পরিস্থিতি (অর্থাত্ একাডেমিক অনুশীলন নয়), এবং তিনি জানতে চান যে এই ক্ষেত্রে কোনও পরিসংখ্যানবিদ কী করবেন।
মর্টেন বুনেস গুস্তাভসেন

3
প্রশ্নটিতে আরও বলা হয়েছে যে কোনও প্যাকেটে 100 টিরও বেশি লেবেল গণনার কোনও সম্ভাবনা নেই। নির্বিশেষে, আপনি যা করেছেন তা সংখ্যার একটি বিস্তৃত সিমুলেশন যা তথ্যের মতো দেখতে - তবে কি, যদি কিছু হয় তবে এটির ("আমাদের কতটা প্রদান করা উচিত") এই প্রশ্নটির সাথে কি সম্পর্ক অস্পষ্ট।
হোয়াইট

-2

মাল্টিনোমিয়াল মডেলের মতো কীভাবে।

প্রতিটি ফলাফলের প্রোব অনুমান করা হয় 1/6, 1/6, .... (6 টি পর্যবেক্ষণের ভিত্তিতে) এবং তাই E (x) = 97.16 এবং ভার (x) = সমষ্টি (95 ^ 2 * 1/6 +) ...) - ই (x) ^ 2 = 2.47 সুতরাং 95% সিআই হবে [94, 100]


3
এটি মোটামুটি বহিরাগত বলে মনে হয় না: আপনার সিআই বৈকল্পিকতার জন্য অরক্ষিত সূত্র ব্যবহার করে একটি সাধারণ-তত্ত্ব ব্যবধান বলে মনে হচ্ছে। তা ছাড়া, কীভাবে এটি প্রদান করতে হবে সেই প্রশ্নের উত্তর দেয়?
whuber

বহু-জাতীয় ফলাফলের উপর প্রয়োগ হয়, অর্থাৎ 95, 96, 97 ... 100 এবং হ্যাঁ সিআই সাধারণ-তত্ত্ব কারণ xe (x) / sd ~ N. কত মূল্য দিতে হবে তা প্রত্যাশা মতোই তাই এটি 97.16 * 100
জিং

4
আপনি কি খেয়াল করেছেন যে আপনি বহুমাত্রিক অনুমানটি মোটেই ব্যবহার করেন না? আপনার সিআই খুব ছোট, যেমনটি ডাব্লুএস গোসেট ১৯০৮ সালে পর্যবেক্ষণ করেছেন But তবে আপনি যদি কেবলমাত্র নমুনাটির গড় ভিত্তিতে আপনার সুপারিশকে ভিত্তি করে চলেছেন তবে কেন একটি সিআই গণনা করবেন?
হুড়হুড়ি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.