এটি সম্ভবত এমন কিছু প্রযুক্তিগত ব্যাখ্যা যাঁরা কিছু পরিসংখ্যান এবং গণিত (ক্যালকুলাস, কমপক্ষে) বোঝেন তাদের লক্ষ্য করে। জরিপ বুটস্ট্র্যাপগুলির একটি কোর্সের একটি স্লাইড যা আমি কিছুক্ষণ আগে শিখিয়েছি:
অবশ্যই কিছু ব্যাখ্যা প্রয়োজন। হ'ল বিদ্যমান তথ্য থেকে পরিসংখ্যান প্রাপ্ত করার পদ্ধতি (বা প্রযুক্তিগতভাবে সুনির্দিষ্টভাবে বলা যায়, বিতরণ ফাংশন থেকে আসল সংখ্যায় কার্যকর; উদাহরণস্বরূপ, গড়টি E [ X ] = ∫ x d F , যেখানে নমুনা বিতরণের জন্য F n ( ) ফাংশন , ডি এফ একটি নমুনা বিন্দুতে পয়েন্ট ভর হিসাবে বোঝা যায়)। জনসংখ্যায়, এফ ( ) দ্বারা চিহ্নিত , টি প্রয়োগ করে সুদের প্যারামিটার দেয় θটিই[ এক্স] = ∫এক্স ডি এফএফএন( )d এফএফ( )টিθ। এখন আমরা একটি নমুনা (শীর্ষ প্রথম তীর) গ্রহণ করেছি, এবং গবেষণামূলক বণ্টনের ফাংশনের আছে - আমরা প্রয়োগ টি এটি অনুমান প্রাপ্ত θ এন । Θ এর থেকে কত দূরে , আমরা অবাক হই? বন্টন র্যান্ডম পরিমাণ যে কি θ এন প্রায় থাকতে পারে θ ? ডায়াগ্রামের নীচের বামে এটিই প্রশ্ন চিহ্ন এবং বুটস্ট্র্যাপ উত্তর দেওয়ার চেষ্টা করে এমন প্রশ্ন। গুং এর বক্তব্য পুনরুদ্ধার করার জন্য, এটি জনসংখ্যা সম্পর্কে প্রশ্ন নয়, তবে একটি নির্দিষ্ট পরিসংখ্যান এবং এর বিতরণ সম্পর্কে প্রশ্ন।এফএন( )টিθ^এনθθ^এনθ
আমরা যদি আমাদের স্যাম্পলিং পদ্ধতিটি পুনরাবৃত্তি করতে পারি, আমরা সেই বিতরণটি পেতে পারি এবং আরও শিখতে পারি। ঠিক আছে, এটি সাধারণত আমাদের সামর্থ্যের বাইরে। তবে, যদি
- যথাযথঅর্থে F এর নিকটতম, এবংএফএনএফ
- ম্যাপিং , যথেষ্ট মসৃণ, অর্থাত্ যদি আমরা থেকে ছোট বিচ্যুতি নেওয়া এফ ( ) , ফলাফল পাসে নম্বরে ম্যাপ করা হবে θ ,টিএফ( )θ
আমরা আশা করতে পারি যে বুটস্ট্র্যাপ পদ্ধতিটি কার্যকর হবে। যেমন, আমরা দাবী করে যে, আমাদের ডিস্ট্রিবিউশন হয় বদলে এফ ( ) , এবং যে সঙ্গে আমরা সব সম্ভব নমুনার আতিথ্য করতে পারেন - এবং সেখানে থাকবে এন এন যেমন নমুনা, যার জন্য শুধুমাত্র বাস্তবসম্মতভাবে এন ≤ 5 । আমাকে আবার পুনরাবৃত্তি করা যাক: বুটস্ট্র্যাপ নমুনা বন্টন তৈরি করতে কাজ করে θ * এন প্রায় "সত্যিকারের" প্যারামিটারটি θ এন , এবং আমরা আশা করি যে দুই উপরে অবস্থার সঙ্গে, এই স্যাম্পলিং বিতরণের স্যাম্পলিং ডিস্ট্রিবিউশন সম্পর্কে তথ্যপূর্ণ θএফএন( )এফ( )এনএনn ≤ 5θ^*এনθ^এন প্রায় θ :θ^এনθ
θ^*এন প্রতি θ^এন মত θ এর^এন থেকে θ
এখন, পরিবর্তে শুধু তীর বরাবর এক উপায় যাচ্ছে, এবং এই তীর বরাবর কিছু তথ্য / সঠিকতা হারানোর, আমরা ফিরে যান এবং এর পরিবর্তনশীলতা সম্পর্কে কিছু বলতে পারেন θ * এন প্রায় θ এন ।θ^*এনθ^এন
উপরের শর্তগুলি হলের (১৯৯১) বইতে একেবারে প্রযুক্তিগতভাবে বানিয়েছে । ক্যালকুলাস বোঝার জন্য যা আমি বলেছিলাম যে এই স্লাইডটি দেখার জন্য পূর্বশর্ত হিসাবে প্রয়োজন হতে পারে মসৃণতা সম্পর্কিত দ্বিতীয় অনুমান: আরও আনুষ্ঠানিক ভাষায়, কার্যকরী অবশ্যই একটি দুর্বল ডেরাইভেটিভের অধিকারী হতে হবে। প্রথম শর্ত, অবশ্যই, একটি মধ্যে asymptotic বিবৃতি হল: বৃহত্তর আপনার নমুনা, কাছাকাছি এফ এন করার হওয়া উচিত এফ ; এবং থেকে দূরত্বের θ * এন করতে θ এন থেকে যারা হিসাবে মাত্রার একই আদেশ হওয়া উচিত θ এন করতে θটিএফএনএফθ^*এনθ^এনθ^এনθ। এই অবস্থায় ভঙ্গ করতে পারে, এবং তারা ভঙ্গ না অদ্ভুত যথেষ্ট পরিসংখ্যান এবং / অথবা স্যাম্পলিং স্কিম যে গবেষণামূলক ডিস্ট্রিবিউশন যে যথেষ্ট কাছাকাছি উত্পাদন পারেন না ব্যবহারিক পরিস্থিতিতে একটি সংখ্যা ।এফ
এনএনθ^এনθθ^( ∗ r )এনθ^*এনθ^এন