বুটস্ট্র্যাপ নমুনার আকার


9

আমি নমুনা পরিসংখ্যানের বৈচিত্র্য অনুমান করার একটি উপায় হিসাবে বুটস্ট্র্যাপিং সম্পর্কে শিখছি। আমার একটা প্রাথমিক সন্দেহ আছে।

Http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf থেকে উদ্ধৃতি :

• আমাদের কতগুলি পর্যবেক্ষণ পুনরায় নমুনা করা উচিত? একটি ভাল পরামর্শ হ'ল আসল নমুনা আকার।

আসল নমুনার মতো আমরা কতগুলি পর্যবেক্ষণকে পুনরায় নমুনা দিতে পারি?
যদি আমার 100 টি নমুনা আকার থাকে এবং আমি গড়ের বৈচিত্রটি অনুমান করার চেষ্টা করছি। আমি কীভাবে 100 এর মোট নমুনা আকার থেকে 100 এর একাধিক বুটস্ট্র্যাপ নমুনা পেতে পারি ? এই ক্ষেত্রে কেবলমাত্র 1 টি বুটস্ট্র্যাপ নমুনা সম্ভব হবে যা মূল নমুনার সমতুল্য হবে?

আমি স্পষ্টতই খুব বেসিক কিছু ভুল বুঝছি। আমি বুঝি যে সংখ্যা এর আদর্শ বুটস্ট্র্যাপ নমুনা সবসময় অসীম, এবং মন আমার প্রয়োজনীয় স্পষ্টতা পালন আমার ডেটা আমি অভিসৃতি জন্য পরীক্ষার আছে চাই বুটস্ট্র্যাপ প্রয়োজনীয় নমুনা সংখ্যা নির্ধারণ।
তবে প্রতিটি স্বতন্ত্র বুটস্ট্র্যাপ নমুনার আকারটি কী হওয়া উচিত তা সম্পর্কে আমি সত্যিই বিভ্রান্ত ।


7
পি এর শীর্ষ। 3, এবং সেখানে চিত্রগুলি স্পষ্টভাবে এবং সুস্পষ্টভাবে শর্ত দেয় যে পুনর্নির্মাণটি প্রতিস্থাপনের সাথে রয়েছে।
whuber

তবে যদি আমার বুটস্ট্র্যাপের নমুনার আকারটি আমার কাছে থাকা মোট পর্যবেক্ষণের সংখ্যার সমান হয় তবে আমি কী দিয়ে প্রতিস্থাপন করব?
ব্যবহারকারী 1265125

সরলীকৃত উদাহরণ - সুতরাং আমার নমুনা সেট হিসাবে যদি আমার 4,1,3,7,5 থাকে। আমি কীভাবে আকারের একাধিক বুটস্ট্র্যাপ নমুনা তৈরি করতে পারি? একমাত্র আকারের 5 টি বুটস্ট্র্যাপ নমুনা হবে 4,1,3,7,5 অর্থাত্ আসল নমুনা সেট।
ব্যবহারকারী 1265125

1
ওহ অপেক্ষা করুন আমি বুঝতে পেরেছি - "s একটি নমুনা বিতরণ অনুকরণ করার জন্য, আমরা কেবলমাত্র" জনসংখ্যার "নমুনার অনেকগুলি অনুলিপি দ্বারা তৈরি বারবার এলোমেলো নমুনা নিতে পারি"
ব্যবহারকারী 1265125

উত্তর:


16

বুটস্ট্র্যাপ প্রতিস্থাপনের সাথে নমুনা দিয়ে পরিচালিত হয় । দেখে মনে হচ্ছে "প্রতিস্থাপন সহ" শব্দটি আপনার পক্ষে অস্পষ্ট। হুবহু দ্বারা উল্লিখিত হিসাবে , প্রতিস্থাপনের সাথে স্যাম্পলিংয়ের চিত্র পি। আপনি যে কাগজটি উল্লেখ করেছেন তার মধ্যে 3 টি (নীচে পুনরুত্পাদন)

প্রতিস্থাপনের সাথে নমুনার উদাহরণ

(উত্স: http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf )

প্রতিস্থাপনের সাথে নমুনা নেওয়ার সাধারণ ধারণাটি হ'ল যে কোনও ক্ষেত্রে একাধিকবার নমুনা দেওয়া যায় (উপরের প্রথম চিত্রের উপর সবুজ মার্বেল; শেষ ছবিতে নীল এবং বেগুনি মার্বেল)। আপনি যদি এই প্রক্রিয়াটি নিজেকে কল্পনা করতে চান তবে রঙিন মার্বেলে ভরা বাটিটি ভাবেন। বলুন যে আপনি এই বাটি থেকে কয়েকটি মার্বেল আঁকতে চান। আপনি যদি প্রতিস্থাপন ছাড়াই নমুনা তৈরি করেন , তবে আপনি কেবল মার্বেলগুলি বাটি থেকে বের করে নিয়েছেন এবং নমুনাগুলি একপাশে রেখে যাচ্ছেন। যদি আপনি প্রতিস্থাপনের সাথে নমুনা তৈরি করেন , তবে আপনি বাটি থেকে একক মার্বেল বের করে, আপনার নোটবুকের রঙে সাইন ইন করে এবং তারপরে ফিরে এসে একের পর এক মার্বেলের নমুনা নিচ্ছেন wouldবাটি। সুতরাং প্রতিস্থাপনের সাথে নমুনা দেওয়ার সময় একই মার্বেলটিকে একাধিকবার নমুনা দেওয়া যায়।

সুতরাং প্রতিস্থাপন ছাড়া নমুনা যখন , আপনি কেবল নমুনা করতে পারেনএন থাকা বাটি থেকে মার্বেল বের হয় এনমার্বেল, প্রতিস্থাপনের সাথে স্যাম্পলিংয়ের ক্ষেত্রে আপনি যে কোনও সংখ্যক মার্বেলের নমুনা করতে পারেন (তারপরেও আরও বড় greaterএনসীমাবদ্ধ জনসংখ্যা থেকে। যদি আপনি নমুনাএন এর বাইরে এনপ্রতিস্থাপন ছাড়াই মার্বেলগুলি আপনি ঠিক একই নমুনা দিয়ে শেষ করতে পারবেন তবে শ্যাফলেড ক্রমে। যদি আপনি নমুনাএন এর বাইরে এনপ্রতিস্থাপনের সাথে মার্বেলগুলি , প্রতিটি সময় আপনি মার্বেলের একটি আলাদা সংমিশ্রণটি সম্ভবত নমুনা করতে পারেন।

নেই স্যাম্পলিং পথ ছাড়া প্রতিস্থাপন আকারের জনসংখ্যার মধ্যে মামলা এবং স্যাম্পলিং পথ সঙ্গে প্রতিস্থাপন। আপনি যদি এর পিছনে গণিত সম্পর্কে আরও পড়তে চান তবে আপনি ২.১ পরীক্ষা করতে পারেন হোসেইন পিস্রো-নিকের সম্ভাব্যতা অনলাইন হ্যান্ডবুকের পরিচিতির সংমিশ্রণ অধ্যায় । ওল্ফ্রামম্যাথ ওয়ার্ল্ড পৃষ্ঠায় একটি সহজ চিটশিটও রয়েছে(এন)এন(এন+ +-1)


0

আমাদের কত পর্যবেক্ষণের পুনরায় নমুনা করা উচিত? একটি ভাল পরামর্শ হ'ল আসল নমুনা আকার।

যখন মূল নমুনার আকারটি খুব বড় হয় এবং আপনি পুরো ডেটাসেটে কোনও মডেলকে প্রশিক্ষণ দিতে / করতে চান না, তখন "ভাল পরামর্শ" তেমন ভাল হয় না।

পিএস: আমি এটিকে প্রশ্নের মন্তব্য হিসাবে যুক্ত করতে চেয়েছিলাম তবে আমার কোনও মন্তব্য যোগ করার অনুমতি নেই ...


1
আপনি এই পরামর্শটি যুক্ত করতে চান কেন? এটি যদি নিয়মিত গণনার প্রচেষ্টার জন্য ডেটাসেটগুলির কারণে খুব বেশি হয় তবে এটি একটি প্রাসঙ্গিক ব্যবহারিক সমস্যা, তবে এটি এখানে বুটস্ট্র্যাপিংয়ের তত্ত্বের ক্ষেত্রে প্রযোজ্য নয় যা এখানে প্রশ্ন করা হয়েছিল। তদুপরি, এটি ছিল 'একটি নমুনা পরিসংখ্যানের বৈচিত্রের অনুমান' সম্পর্কে। এটি কি সত্যই কোনও মডেল প্রশিক্ষণের সাথে সম্পর্কিত? (এনবি। অভদ্র হতে হবে না, আমি বুঝতে পেরেছি আপনি এখনও মন্তব্য পোস্ট করতে পারবেন না, তবে এটি পোস্ট করার সময় কোনও প্রাসঙ্গিক উত্তর সরবরাহ করতে আপনাকে বিরত করে না You আপনাকে আরও অনেক স্পষ্ট হতে হবে, বা নিজের প্রশ্ন পোস্ট করতে হবে)
আইডাব্লুএস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.