বৃহত নমুনা তত্ত্ব দ্বারা অনুমান করা হয় তার চেয়ে বেশি নমুনা বিতরণের আরও দৃ rob় চিত্র পেতে বুটস্ট্র্যাপিং করা হয় । আপনি যখন বুটস্ট্র্যাপ করেন, তখন আপনার নেওয়া `বুটসাম্পলগুলির সংখ্যাটির কার্যকরভাবে কোনও সীমা থাকে না; প্রকৃতপক্ষে আপনি যত বেশি বুটসামাল গ্রহণ করবেন স্যাম্পলিং বিতরণে আরও ভাল সান্নিধ্য পাবেন। বুটসাম্পলগুলি ব্যবহার করা সাধারণ , যদিও এই সংখ্যাটি সম্পর্কে যাদুকর কিছুই নেই। তদতিরিক্ত, আপনি বুটসাম্পলগুলিতে কোনও পরীক্ষা চালান না; নমুনা বিতরণ সম্পর্কে আপনার কাছে একটি অনুমান রয়েছে - এটি সরাসরি ব্যবহার করুন। এখানে একটি অ্যালগরিদম রয়েছে:বি = 10 , 000
- প্রতিস্থাপনের সাথে বুট-পর্যবেক্ষণ নমুনা তৈরি করে সেট করা একটি ডেটার একটি বুটসাম্পল নিন । [নীচের মন্তব্যগুলির বিষয়ে, একটি প্রাসঙ্গিক প্রশ্ন হ'ল আপনার বুটস্যাম্পলটির জন্য ব্যবহারের জন্য কোনও বৈধ 'বুট-পর্যবেক্ষণ' গঠন কী। আসলে, এখানে বেশ কয়েকটি বৈধ পন্থা রয়েছে; আমি শক্তিশালী দুটি উল্লেখ করব এবং আপনাকে আপনার ডেটার কাঠামোটি মিরর করার অনুমতি দেব: আপনার যখন পর্যবেক্ষণমূলক ডেটা থাকে (যেমন, ডেটাটি সমস্ত মাত্রায় নমুনাযুক্ত হয়েছিল), তখন একটি বুট-পর্যবেক্ষণ আদেশযুক্ত এন-টুপল হতে পারে (যেমন, একটি সারি) আপনার ডেটা সেট থেকে) উদাহরণস্বরূপ, যদি আপনার কাছে একটি ভবিষ্যদ্বাণীকারী ভেরিয়েবল এবং একটি প্রতিক্রিয়া ভেরিয়েবল থাকে তবে আপনি এন 1 ( x , y ) নমুনা দেবেনএন1এন1 ( x , y))অর্ডার জোড়া। অন্যদিকে, পরীক্ষামূলক ডেটা নিয়ে কাজ করার সময়, ভবিষ্যদ্বাণীকারী ভেরিয়েবল মানগুলি নমুনাযুক্ত করা হয় নি, তবে পরীক্ষামূলক ইউনিটগুলিকে প্রতিটি পূর্বাভাসীর ভেরিয়েবলের উদ্দেশ্যে স্তরের জন্য বরাদ্দ করা হয়েছিল। এর মতো ক্ষেত্রে, আপনি আপনার পূর্বাভাসক ভেরিয়েবলের প্রতিটি জ স্তরের মধ্যে থেকে y মানগুলি নমুনা করতে পারেন , তারপরে সেই ওয়াই এসকে সেই পূর্বাভাসকারী স্তরের সাথে সম্পর্কিত মানের সাথে যুক্ত করুন। এই পদ্ধতিতে, আপনি এক্স এর চেয়ে বেশি নমুনা দেবেন না ]]এন1 জে YঞYএক্স
- আপনার রিগ্রেশন মডেল মাপসই করা হবে এবং ঢাল হিসাব দোকান (কল এটা বিটা 1 )β^1
- প্রতিস্থাপনের সাথে বুট-পর্যবেক্ষণ স্যাম্পল করে সেট করা অন্যান্য ডেটার একটি বুটসাম্পল নিনএন2
- অন্যান্য রিগ্রেশন মডেল মাপসই করা হবে এবং ঢাল হিসাব দোকান (কল এটা বিটা 2 )β^2
- দুই অনুমান থেকে একটি পরিসংখ্যাত ফর্ম (পরামর্শ: ঢাল পার্থক্য ব্যবহার β 1 - β 2 )β^1- β^2
- পরিসংখ্যান সংরক্ষণ করুন এবং অন্যান্য তথ্য ডাম্প যাতে মেমরি নষ্ট না হয়
- পদক্ষেপগুলি 1 - 6, বার পুনরাবৃত্তি করুনবি = 10 , 000
- opeাল পার্থক্যের বুটস্ট্র্যাপযুক্ত নমুনা বিতরণকে সাজান
- বিএসডি-র যে% কে ওভারল্যাপ করে তার% গুন করুন (যেটি ছোট, ডান লেজ% বা বাম লেজ%%)
- এই শতাংশকে 2 দ্বারা গুণান
পরিসংখ্যানগত পরীক্ষা হিসাবে এই অ্যালগরিদমের যুক্তিটি মূলত শাস্ত্রীয় পরীক্ষার (যেমন, টি-টেস্ট) অনুরূপ তবে আপনি ডেটা ধরে নিচ্ছেন না বা ফলস্বরূপ নমুনা বিতরণগুলির কোনও নির্দিষ্ট বন্টন রয়েছে। (উদাহরণস্বরূপ, আপনি স্বাভাবিকতা ধরে নিচ্ছেন না)) আপনি যে প্রাথমিক অনুমান করছেন তা হ'ল আপনার ডেটা এমন জনসংখ্যার প্রতিনিধি যা আপনি নমুনা করেছেন / যেখানে সাধারণ করতে চান। যে, নমুনা বিতরণ জনসংখ্যা বিতরণের অনুরূপ। মনে রাখবেন, আপনার ডেটা যদি আপনার আগ্রহী জনসংখ্যার সাথে সম্পর্কিত না হয় তবে আপনি ভাগ্য থেকে দূরে।
কিছু লোক ব্যবহারের বিষয়ে উদ্বিগ্ন, যেমন, normalাল নির্ধারণ করার জন্য একটি রিগ্রেশন মডেল আপনি যদি স্বাভাবিকতা নিতে চান না তবে। তবে এই উদ্বেগটি ভুল mist গাউস-মার্কভ উপপাদ্যটি আমাদের বলেছে যে অনুমানটি নিরপেক্ষ (যেমন, সত্যের মূল্যের উপর ভিত্তি করে), তাই এটি ঠিক আছে। স্বাভাবিকতার অভাবের সহজ অর্থ হ'ল সত্য নমুনা বিতরণ তাত্ত্বিকভাবে পোস্ট করা থেকে পৃথক হতে পারে এবং তাই পি-মানগুলি অবৈধ। বুটস্ট্র্যাপিং পদ্ধতি আপনাকে এই সমস্যাটি মোকাবেলার জন্য একটি উপায় দেয়।
বুটস্ট্র্যাপিং সম্পর্কিত আরও দুটি বিষয়: শাস্ত্রীয় অনুমানগুলি পূরণ করা হলে বুটস্ট্র্যাপিং প্যারামিমেট্রিক পরীক্ষার চেয়ে কম দক্ষ (অর্থাত্ শক্তি কম) is দ্বিতীয়ত, আপনি যখন কোনও বিতরণের কেন্দ্রে কাছাকাছি ঘুরে দেখছেন তখন বুটস্ট্র্যাপিং সবচেয়ে ভাল কাজ করে: মানে এবং মিডিয়ানরা ভাল, কোয়ার্টাইলগুলি খুব ভাল নয়, মিনিটের বুটস্ট্র্যাপিং বা সর্বোচ্চটি ব্যর্থ হয়। প্রথম বিষয়টির বিষয়ে, আপনার নিজের পরিস্থিতিতে বুটস্ট্র্যাপের প্রয়োজন হবে না; দ্বিতীয় বিষয়টি সম্পর্কে, opeালের বুটস্ট্র্যাপিং পুরোপুরি ঠিক আছে।