গড় অনুমানের জন্য প্রয়োজনীয় নমুনার সংখ্যার গতিশীল গণনা


9

আমি স্যাম্পলিংয়ের মাধ্যমে কম-বেশি গাউসীয় বিতরণের গড় অনুমান করার চেষ্টা করছি। এর গড় বা তারতম্য সম্পর্কে আমার কোনও পূর্ব জ্ঞান নেই। প্রতিটি নমুনা পেতে ব্যয়বহুল। একটি নির্দিষ্ট স্তরের আস্থা / নির্ভুলতা পেতে আমার কতগুলি নমুনা প্রয়োজন তা আমি গতিশীলভাবে কীভাবে স্থির করব? বিকল্পভাবে, আমি কীভাবে জানব যখন আমি নমুনা নেওয়া বন্ধ করতে পারি?

এই জাতীয় প্রশ্নের উত্তর যা আমি খুঁজে পেতে পারি তা দেখতে কিছুটা ভিন্নতার জ্ঞান বলে মনে হচ্ছে, তবে আমার পাশাপাশি এটিও আবিষ্কার করা দরকার। অন্যরা ভোট গ্রহণের দিকে মনোযোগী, এবং এটি আমার কাছে স্পষ্ট নয় (আমি যে প্রারম্ভিক) তা কীভাবে জেনারালাইজ করে - আমার গড়টি ডাব্লু / ইন [0,1], ইত্যাদি নয়।

আমি মনে করি এটি সম্ভবত একটি সুপরিচিত উত্তর সহ একটি সহজ প্রশ্ন তবে আমার গুগল-ফু আমাকে ব্যর্থ করছে। এমনকি আমাকে কী অনুসন্ধান করতে হবে তা বলাই সহায়ক হবে।


আপনি এটিকে সিডব্লিউ হিসাবে চিহ্নিত করার কোনও কারণ? একটি সঠিক উত্তরের জন্য প্রশ্নটি যথেষ্ট সুনির্দিষ্ট বলে মনে হচ্ছে এবং তাই CW হওয়া উচিত নয়।

1
@ জোশ ভাল আছে। আমি আপনার পছন্দ সম্পর্কে কৌতূহল ছিল।

1
গুগল "অভিযোজিত নমুনা" এবং "অনুক্রমের নমুনা"। যদি আপনি এখনও আটকে থাকেন তবে কীওয়ার্ড হিসাবে "ওয়াল্ড" অন্তর্ভুক্ত করুন এবং তারপরে historতিহাসিকভাবে এগিয়ে কাজ করুন (যেমন, ক্রমবর্ধমান নমুনা নিয়ে ওয়াল্ডের কাজকে উল্লিখিত কাগজপত্রগুলি দেখুন, তারপরে কাগজপত্রগুলি দেখুন যা তাদের উল্লেখ করে ইত্যাদি)।
whuber

1
@ রবি ম্যাককিলিয়াম: তবে আপনি কোন ডেটা ব্যবহার করেন? কোনও তথ্য সংগ্রহের আগে এই প্রশ্নটি ওঠে। আপনি যদি ডেটাসেটে প্রতিটি নতুন যুক্ত হওয়ার পরে যদি আপনি একবারে একটি মান সংগ্রহ করেন এবং সিআই গণনা করেন তবে আপনি যে সংযুক্ত তুলনামূলকভাবে তুলনা করছেন সেগুলি ব্যবধানের জন্য অন্তরগুলির জন্য মানক সূত্রগুলি ব্যবহার করতে পারবেন না। সুতরাং, আপনার একটি স্টপিং রুল দরকার যা আপনার অনুমানের পরিসংখ্যানগত ঝুঁকির যোগফল এবং প্রতিটি অতিরিক্ত নমুনা সংগ্রহের ব্যয়কে অনুকূল করে।
whuber

1
@ শুভ ধন্যবাদ! আমি এখনও উপাদান হজম করছি, কিন্তু আমি মনে করি এটি ঠিক আমি যা খুঁজছি। যদি এটির উত্তর ছিল, আমি এটি গ্রহণ করব ...
জোশ ব্লিচার স্নাইডার

উত্তর:


2

আপনাকে 'বায়েশিয়ান অভিযোজিত ডিজাইন' অনুসন্ধান করতে হবে। নিম্নরূপ মৌলিক ধারণা:

  1. আপনি আগ্রহের পরামিতিগুলির জন্য পূর্ববর্তীকরণ করুন

    কোনও ডেটা সংগ্রহের আগে আপনার প্রবীণরা ছড়িয়ে পড়তেন। অতিরিক্ত ডেটা আসার সাথে সাথে আপনি পূর্বেরটিকে পূর্ববর্তীটিকে পুনরায় সেট করুন যা 'সময়ের + পয়েন্ট অবধি' পূর্ববর্তী + ডেটার সাথে মিলে যায়।

  2. তথ্য সংগ্রহ.

  3. ডেটা + প্রিয়ারদের উপর ভিত্তি করে পোস্টেরিয়র গণনা করুন। আপনি যদি অতিরিক্ত অতিরিক্ত ডেটা সংগ্রহ করেন তবে পশ্চিমাটি পদক্ষেপ 1 এর পূর্ববর্তী হিসাবে ব্যবহৃত হয়।

  4. আপনার থামার মানদণ্ড পূরণ হয়েছে কিনা তা মূল্যায়ন করুন

    মানদণ্ড থামানো 95% বিশ্বাসযোগ্য ব্যবধানের মতো আগ্রহের পরামিতিগুলির জন্য ইউনিটের চেয়ে বড় হওয়া উচিত নয় something আপনার আগ্রহের পরামিতিগুলির সাথে যুক্ত আরও আনুষ্ঠানিক ক্ষতি ফাংশন থাকতে পারে এবং সুদের প্যারামিটারের উত্তরোত্তর বিতরণ সম্পর্কিত সম্মতিযুক্ত ক্ষতির গণনা করা যেতে পারে।±ϵ

তারপরে আপনি ধাপ ৪ থেকে আপনার থামার মানদণ্ড পূরণ না করা পর্যন্ত 1, 2 এবং 3 পদক্ষেপগুলি পুনরাবৃত্তি করবেন।


0

আপনি সাধারণত কেন্দ্রীয় সীমাবদ্ধ উপপাদনের জন্য কমপক্ষে 30 টি চাইবেন (যদিও এটি কিছুটা স্বেচ্ছাচারী)। পোন ইত্যাদির ক্ষেত্রে যেমন দ্বি-দ্বি বিতরণ ব্যবহার করে মডেল করা হয়, তার বিপরীতে আপনি কোনও নমুনার আকার আগেই নির্ধারণ করতে পারবেন না যা গাউসিয়ান প্রক্রিয়াটির সাথে এক স্তরের যথার্থতার গ্যারান্টি দেয় - এটি নির্ভর করে যে আপনি কী কী অবশিষ্টাংশ পাবেন যা স্ট্যান্ডার্ড ত্রুটি নির্ধারণ করে।

এটি লক্ষ করা উচিত যে আপনার কাছে যদি একটি দৃust় নমুনা কৌশল থাকে তবে আপনি দুর্বল কৌশল সহ আরও বড় আকারের নমুনার আকারের চেয়ে অনেক বেশি সঠিক ফলাফল পেতে পারেন।


3
জ্ঞাত (বা ধরে নেওয়া) গাউসিয়ান বিতরণ থেকে নমুনা দেওয়ার সময় কেন সিএলটি প্রার্থনা করার প্রয়োজন হবে? এমনকি একটির নমুনার গড়টি সাধারণত বিতরণ করা হবে!
হোবার

ভাল যুক্তি! আরটিকিউ সঠিকভাবে করেনি।
জেমস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.