আমি জানি এটি একটি বরং উত্তপ্ত বিষয় যেখানে সত্যিকার অর্থে কেউ সহজ উত্তর দিতে পারে না। তবুও আমি ভাবছি যে নিম্নলিখিত পদ্ধতিটি কার্যকর না হতে পারে।
বুটস্ট্র্যাপ পদ্ধতি কেবল তখনই কার্যকর যখন আপনার নমুনা কম বেশি বা কম (সঠিকভাবে পড়ুন) মূল জনসংখ্যার মতো একই বন্টন অনুসরণ করে। নিশ্চিত হওয়ার জন্য এটি আপনার নমুনার আকারকে যথেষ্ট বড় করে তুলতে হবে। তবে কি যথেষ্ট বড়?
আমার অনুমান সঠিক হলে জনসংখ্যার গড় নির্ধারণের জন্য কেন্দ্রীয় সীমাবদ্ধ উপপাদ ব্যবহার করার সময় আপনার একই সমস্যা হয়। কেবলমাত্র যখন আপনার নমুনার আকার যথেষ্ট পরিমাণে বড় হয় তবে আপনি নিশ্চিত হতে পারবেন যে আপনার নমুনাটির জনসংখ্যা সাধারণত বিতরণ করা হয় (প্রায় জনসংখ্যার অর্থ প্রায়)। অন্য কথায়, আপনার নমুনাগুলিকে আপনার জনসংখ্যা (বিতরণ) যথেষ্ট পরিমাণে উপস্থাপন করতে হবে। কিন্তু আবার, যথেষ্ট বড় কি?
আমার ক্ষেত্রে (প্রশাসনিক প্রক্রিয়া: চাহিদার তুলনায় চাহিদা সমাপ্ত করার জন্য প্রয়োজনীয় সময়ের পরিমাণ) আমার একটি জনসংখ্যার একাধিক মডেল বিতরণ আছে (সমস্ত দাবি যা ২০১১ সালে শেষ হয়েছে) যার মধ্যে আমি ৯৯% নিশ্চিত যে এটি আরও কম জনসংখ্যার তুলনায় সাধারণত বিতরণ করা হয় (অতীতের বর্তমান সময়ের এবং এক দিনের মধ্যে যে সমস্ত দাবি শেষ হয়েছে, আদর্শভাবে এই টাইমস্প্যানটি যতটা সম্ভব ছোট) আমি গবেষণা করতে চাই।
আমার 2011 জনসংখ্যা যথেষ্ট ইউনিট থেকে বের বিদ্যমান করতে একটি নমুনা আকার নমুনা এন । আমি x এর মান বেছে নিয়েছি , ধরুন 10 ( )। একটি ভাল নমুনার আকার নির্ধারণ করতে এখন আমি পরীক্ষার এবং ত্রুটি ব্যবহার করি। আমি একটি নিয়েছি এবং আমার নমুনার অর্থ জনসংখ্যার সাধারণত কোলমোগোরভ-স্মারনভ ব্যবহার করে বিতরণ করা হয়েছে কিনা তা দেখুন। যদি তাই হয় তবে আমি একই ধাপগুলি আবার একটি নমুনা আকারের সাথে পুনরাবৃত্তি করি, যদি (ইত্যাদি) এর নমুনার আকারের সাথে পুনরাবৃত্তি না হয় ।
কিছুক্ষণ পরে আমি এই সিদ্ধান্তে পৌঁছলাম যে আমার ২০১১ সালের জনসংখ্যার কম বা কম ভাল উপস্থাপনা পাওয়ার জন্য হ'ল পরম নূন্যতম আকার sample যেহেতু আমি জানি আমার আগ্রহের জনসংখ্যা (বর্তমান সময়ের এবং এক দিনের মধ্যে শেষ হওয়া সমস্ত দাবিগুলির) কম বৈচিত্র রয়েছে আমি বুটস্ট্র্যাপ করতে নিরাপদে এর একটি নমুনা আকার ব্যবহার করতে পারি । (পরোক্ষভাবে, আমার টাইমস্পানের আকার নির্ধারণ করে: চাহিদা পূরণের জন্য সময় প্রয়োজন ))
সংক্ষেপে এটি আমার ধারণা idea তবে যেহেতু আমি কোনও পরিসংখ্যানবিদ নই তবে একজন প্রকৌশলী, যার পরিসংখ্যানের পাঠগুলি বছরের মাথায় ঘটেছিল আমি কেবলমাত্র প্রচুর আবর্জনা তৈরি করার সম্ভাবনাটি বাদ দিতে পারি না :-)। তোমরা কি ভাবো? যদি আমার অনুমানটি বোঝায়, আমার কি বা তার চেয়ে ছোট এর চেয়ে বড় একটি ? আপনার উত্তরগুলির উপর নির্ভর করে (আমার কি বিব্রত বোধ করা উচিত বা না? :-) আমি আরও কিছু আলোচনা ধারণা পোস্ট করব।
প্রথম উত্তরে প্রতিক্রিয়া জবাব দেওয়ার জন্য ধন্যবাদ, আপনার উত্তরটি আমার বিশেষত বইয়ের লিঙ্কগুলির জন্য খুব দরকারী।
তবে আমি আশঙ্কা করছি যে তথ্য দেওয়ার প্রয়াসে আমি আমার প্রশ্নটি পুরোপুরি মেঘলা করে ফেলেছি। আমি জানি যে বুটস্ট্র্যাপের নমুনাগুলি জনসংখ্যার নমুনার বিতরণ করে। আমি আপনাকে সম্পূর্ণ অনুসরণ করি কিন্তু ...
আপনার মূল জনসংখ্যার নমুনার পরিমাণ যথেষ্ট পরিমাণে হওয়া দরকার যে আপনার জনসংখ্যার নমুনার বন্টন জনসংখ্যার 'আসল' বিতরণের সাথে মিলে যায় (সমান)।
আপনার মূল নমুনার আকারটি কত বড় হওয়া দরকার তা নির্ধারণ করার জন্য এটি কেবলমাত্র একটি ধারণা যা নমুনা বিতরণ জনসংখ্যার বিতরণের সাথে সামঞ্জস্যপূর্ণ।
ধরুন আপনার কাছে দ্বিমুখী জনসংখ্যা বন্টন রয়েছে এবং একটি শীর্ষ অপরটির চেয়ে অনেক বড়। যদি আপনার নমুনার আকার 5 হয় তবে সম্ভাবনাটি বড় হয় যে সমস্ত 5 টি ইউনিটের একটি বৃহত্তর শীর্ষের খুব কাছাকাছি একটি মান থাকে (এলোমেলোভাবে একটি ইউনিট আঁকার সুযোগটি সবচেয়ে বড়)) এক্ষেত্রে আপনার নমুনা বিতরণ মনোমোডাল দেখায়।
একশো নমুনা আকারের সাথে আপনার নমুনা বিতরণও বিমোডাল হওয়ার সুযোগটি অনেক বড় !! বুটস্ট্র্যাপিংয়ের সমস্যাটি হ'ল আপনার কেবলমাত্র একটি নমুনা রয়েছে (এবং আপনি সেই নমুনায় আরও তৈরি করেন)। যদি নমুনা বিতরণ জনসংখ্যার বিতরণের সাথে সত্যই মিল না করে তবে আপনি সমস্যায় পড়েছেন। আপনার নমুনার আকার অপ্রত্যাশিতভাবে বড় না করে যতটা সম্ভব কম 'খারাপ নমুনা বিতরণ' করার সুযোগ তৈরি করার পক্ষে এটি একটি ধারণা।