মিউরা প্রদত্ত উত্তর সম্পূর্ণ সঠিক নয় তাই আমি উত্তরসূরির জন্য এই পুরানো প্রশ্নের উত্তর দিচ্ছি:
(2)। এগুলি খুব আলাদা জিনিস। এমিরিকাল সিডিএফ সিডিএফ (বিতরণ) এর একটি অনুমান যা ডেটা উত্পন্ন করে। অবিকল, এটা বিযুক্ত সিডিএফ যা সম্ভাব্যতা নির্ধারণ হয় প্রতিটি পর্যবেক্ষিত ডাটা পয়েন্ট, এর ফল1 / এন, প্রতিটিএক্স এর জন্য। সত্য সিডিএফ এই মূল্নির্ধারক এগোয়: এফ (এক্স)→এফ(এক্স)=পি(এক্সআমিএফ^(x)=1n∑ni=1I(Xi≤x)x প্রত্যেকের জন্য প্রায় নিশ্চয় এক্স (আসলে অবিশেষে)।F^(x)→F(x)=P(Xi≤x)x
একটি পরিসংখ্যাত এর স্যাম্পলিং বন্টন পরিবর্তে পরিসংখ্যাত আপনি পুনরাবৃত্তি পরীক্ষা অধীনে দেখার আশা করতে বিতরণের হয়। তা হল, আপনি একবার আপনার পরীক্ষাটি সম্পাদন করুন এবং এক্স 1 , … , এক্স এন ডেটা সংগ্রহ করুন । টি আপনার ডেটা ফাংশন: টি = টি ( এক্স 1 , … , এক্স এন ) । এখন, ধরুন আপনি পরীক্ষার পুনরাবৃত্তি করেছেন এবং এক্স ′ 1 , … , এক্স ′ n ডেটা সংগ্রহ করেছেন । নতুন নমুনায় টি পুনরায় গণনা করে টি ′TX1,…,XnTT=T(X1,…,Xn)X′1,…,X′n । আমরা যদি 100 টি নমুনা সংগ্রহ করি তবে আমাদের টি-এর 100 অনুমান হবে। এই পর্যবেক্ষণের টি নমুনা বন্টন গঠন টি । এটি একটি সত্য বিতরণ। পরীক্ষাগুলির সংখ্যা অসীমের দিকে যাওয়ার সাথে সাথে এর গড় E ( টি ) এবং এর পরিবর্তনের সাথেরূপান্তরিতহয়T′=T(X′1,…,X′n)TTTE(T) ।Var(T)
সাধারণত আমরা এর মতো পরীক্ষাগুলির পুনরাবৃত্তি করি না, আমরা কেবল কখনও একটি উদাহরণ দেখি । আপনি যদি টি এর অন্তর্নিহিত সম্ভাব্যতা ফাংশনটি না জানেন তবে একক পর্যবেক্ষণ থেকে টি এর ভিন্নতা কী তা নির্ধারণ করা খুব কঠিনTTT জেনেন a বুটস্ট্র্যাপিং যে স্যাম্পলিং বন্টন অনুমান করার জন্য একটি উপায় কৃত্রিমভাবে "নতুন পরীক্ষা-নিরীক্ষা" যার উপর নতুন দৃষ্টান্ত নিরূপণ করা চালিয়ে টি । প্রতিটি নতুন নমুনা আসলে আসল তথ্য থেকে মাত্র একটি নমুনা। আসল তথ্যগুলির চেয়ে এটি আপনাকে আরও তথ্য সরবরাহ করে যা রহস্যজনক এবং সম্পূর্ণ দুর্দান্ত।TT
(1)। আপনি সঠিক - আপনি এটি করবেন না। লেখক প্যারামিমেট্রিক বুটস্ট্র্যাপটিকে "আপনি যদি বিতরণটি জানতেন তবে আপনি কি করতেন" তা বর্ণনা করে বন্টন কার্যকারনের একটি খুব ভাল অনুমানকারী - এমিরিকাল সিডিএফ হিসাবে প্রেরণার চেষ্টা করছেন।
উদাহরণস্বরূপ, ধরুন আপনি জানেন যে আপনার পরীক্ষার পরিসংখ্যান সাধারণত গড় শূন্য, ভিন্নতা দিয়ে বিতরণ করা হয়। আপনি কীভাবে টি এর নমুনা বিতরণ অনুমান করবেনTT ? ঠিক আছে, যেহেতু আপনি বিতরণটি জানেন, নমুনা বিতরণটি অনুমান করার একটি নির্লিপ্ত এবং অপ্রয়োজনীয় উপায় হ'ল 10,000 বা তত সাধারণ মানের এলোমেলো ভেরিয়েবল উত্পন্ন করতে আর ব্যবহার করা হয়, তারপরে তাদের নমুনার গড় এবং প্রকরণটি গ্রহণ করুন এবং এটিকে আমাদের গড়ের অনুমান হিসাবে এবং ব্যবহার করুন নমুনা বিতরণের বিভিন্নতা ।T
যদি আমরা টি এর প্যারামিটারগুলি কোনও অগ্রাহ্য জানি না , তবে আমরা জানি যে এটি সাধারণত বিতরণ করা হয়, পরিবর্তে আমরা যা করতে পারি তা অনুশীলনীয় সিডিএফ থেকে 10,000 বা তাই নমুনা উত্পন্ন করা যায়, সেগুলির প্রতিটিটির জন্য টি গণনা করুন, তারপরে নমুনাটির অর্থ গ্রহণ করুন এবং এইসব 10,000 ভ্যারিয়েন্স টি s, এবং প্রত্যাশিত মান এবং ভ্যারিয়েন্স আমাদের অনুমান হিসাবে তাদের ব্যবহার টি । যেহেতু এমিরিকাল সিডিএফ সত্য সিডিএফের একটি ভাল অনুমানকারী, তাই নমুনা পরামিতিগুলি সত্য পরামিতিগুলিতে রূপান্তর করতে হবে। এটি প্যারামেট্রিক বুটস্ট্র্যাপ: আপনি যে পরিসংখ্যানটি অনুমান করতে চান তার উপর আপনি একটি মডেল পোস্ট করেন pos মডেলটি একটি প্যারামিটার দ্বারা সূচিযুক্ত হয়, যেমন ( μ , σ )TTTT(μ,σ), যা আপনি ইডিডিএফ থেকে বারবার নমুনা অনুমান করে অনুমান করেন।
(3)। ননপ্যারমেট্রিক বুটস্ট্র্যাপ এমনকি আপনার এমন একটি প্রাইরিও জানতে হবে না যে সাধারণত বিতরণ করা হয়। পরিবর্তে, আপনি কেবল ইসিডিএফ থেকে বারবার নমুনা আঁকুন এবং প্রতিটিটির জন্য টি গণনা করুন। আপনি 10,000 বা তার বেশি নমুনাগুলি আঁকার পরে 10,000 টি এস গণনা করার পরে , আপনি আপনার অনুমানের একটি হিস্টোগ্রাম প্লট করতে পারেন। এটি টি এর নমুনা বিতরণের দৃশ্যায়নTTTT। ননপ্যারমেট্রিক বুটস্ট্র্যাপ আপনাকে বলবে না যে স্যাম্পলিং বিতরণটি স্বাভাবিক, বা গামা, বা আরও অনেক কিছু, তবে এটি আপনাকে নমুনা বিতরণ (সাধারণত) প্রয়োজন হিসাবে যথাযথভাবে অনুমান করতে দেয়। এটি কম অনুমান করে এবং প্যারামেট্রিক বুটস্ট্র্যাপের চেয়ে কম তথ্য সরবরাহ করে। প্যারামিমেট্রিক অনুমানটি সত্য হলেও এটি মিথ্যা হলে আরও নির্ভুল হয়। আপনার মুখোমুখি প্রতিটি পরিস্থিতিতে আপনি কোনটি ব্যবহার করেন তা সম্পূর্ণ প্রসঙ্গে নির্ভর করে। স্বীকার করা যায় যে আরও মানুষ ননপ্যারমেট্রিক বুটস্ট্র্যাপের সাথে পরিচিত তবে প্রায়শই একটি দুর্বল প্যারাম্যাট্রিক ধারণা অনুমানের জন্য পুরোপুরি জটিল একটি মডেলকে উপযুক্ত করে তোলে যা সুন্দর।