বুটস্ট্র্যাপ তাত্পর্যপূর্ণ দুটি পদ্ধতি


11

বুটস্ট্র্যাপ ব্যবহার করে আমি দুটি পদ্ধতি ব্যবহার করে তাত্পর্যের p এর মান গণনা করি:

  1. নাল অনুমানের অধীনে পুনঃনির্মাণ এবং ফলাফলগুলি আসল তথ্য থেকে প্রাপ্ত ফলাফল হিসাবে কমপক্ষে চূড়ান্ত গণনা করা
  2. বিকল্প অনুমানের অধীনে পুনঃনির্মাণ এবং নাল অনুমানের সাথে সম্পর্কিত মান হিসাবে মূল ফলাফল থেকে কমপক্ষে দূরত্বে ফলাফলগুলি গণনা করা

আমি বিশ্বাস করি যে এপি মানের সংজ্ঞাটি অনুসরণ করে 1 পদ্ধতিটি সম্পূর্ণরূপে সঠিক। আমি দ্বিতীয় সম্পর্কে কম নিশ্চিত, তবে এটি সাধারণত খুব অনুরূপ ফলাফল দেয় এবং আমাকে ওয়াল্ড পরীক্ষার স্মরণ করিয়ে দেয়।

আমি কি সঠিক? দুটি পদ্ধতিই কি সঠিক? তারা কি অভিন্ন (বড় নমুনার জন্য)?


দুটি পদ্ধতির উদাহরণ (ডিউইনের প্রশ্ন এবং এরিকের উত্তর পরে সম্পাদনা):
উদাহরণ 1. আসুন দুটি নমুনা টি পরীক্ষার মতো বুটস্ট্র্যাপ পরীক্ষাটি তৈরি করুন। পদ্ধতি 1 একটি নমুনা থেকে পুনরায় নমুনা করবে (মূল দুটি সারণী দ্বারা প্রাপ্ত)। পদ্ধতি 2 স্বতন্ত্রভাবে উভয় নমুনা থেকে পুনরায় নমুনা দেবে।

উদাহরণ 2. আসুন x₁… xₐ এবং y₁… yₐ এর মধ্যে পারস্পরিক সম্পর্কের বুটস্ট্র্যাপ পরীক্ষাটি তৈরি করুন ₐ পদ্ধতি 1 কোনও ইস্যুতে যেখানে x (xₑ, yₔ) জোড়গুলির জন্য কোনও পারস্পরিক সম্পর্ক এবং পুনরায় নমুনা গ্রহণ করবে না ə পদ্ধতি 2 মূল (x, y) জোড়াগুলির একটি বুটস্ট্র্যাপ নমুনা সংকলন করবে।

উদাহরণ ৩. আসুন একটি মুদ্রা ন্যায্য কিনা তা পরীক্ষা করতে একটি বুটস্ট্র্যাপ পরীক্ষাটি তৈরি করুন। পদ্ধতি 1 টি এলোমেলোভাবে নমুনা তৈরি করবে PR (হেড) = জন (লেজ) = setting ½ পদ্ধতি 2 পরীক্ষামূলক মাথা / লেজ মানগুলির নমুনার পুনরায় নমুনা করবে এবং অনুপাতটিকে compare এর সাথে তুলনা করবে ½


কোন "বিকল্প অনুমান"? Traditionalতিহ্যবাহী ফিশেরিয়ান নামকরণে কেবল একটি বিকল্প নয়, বিকল্পগুলির একটি অসীম পরিবার থাকবে। এবং কীভাবে আপনি এই বিষয়টির জন্য "একটি অনুমানের অধীনে নমুনা" করবেন? স্যাম্পলিং ডেটা উপর করা হয়। অনুমান একটি পরামিতি সম্পর্কে।
ডিউইন

@ ডবিন: ধন্যবাদ, দয়া করে আমার প্রশ্নের সাথে আমার উদাহরণ যুক্ত দেখুন।
উইনার্ড

উত্তর:


8

প্রথম পদ্ধতিটি শাস্ত্রীয় এবং বিশ্বাসযোগ্য তবে সর্বদা ব্যবহার করা যায় না। নাল হাইপোথিসিস ধরে ধরে বুটস্ট্র্যাপের নমুনা পাওয়ার জন্য আপনাকে অবশ্যই কোনও তাত্ত্বিক বিতরণ ধরে রাখতে ইচ্ছুক হতে হবে ( এটি আপনার প্রথম বিকল্প ) অথবা নাল হাইপোথিসিসে স্থানান্তরিত হওয়ার সময় আপনার আগ্রহের পরিসংখ্যান একইরূপে বিতরণযোগ্য আকার ধারণ করবে ( আপনার দ্বিতীয় বিকল্প) )। উদাহরণস্বরূপ, সাধারণ অনুমানের অধীনে টি-ডিস্ট্রিবিউশনের একই আকার থাকে যখন অন্য কোনও দিকে স্থানান্তরিত হয়। যাইহোক, যখন দ্বিপদী বিতরণের 0.5 নাল ফ্রিকোয়েন্সিটি 0.025 এ পরিবর্তন করা হয় তখন আকৃতিও পরিবর্তন হবে।

আমার অভিজ্ঞতায়, অন্যথায় আপনি যদি এই অনুমানগুলি করতে রাজি হন তবে আপনার কাছে অন্যান্য বিকল্পও থাকে। আপনার উদাহরণ 1) যেখানে আপনি ধরেই নিয়েছেন যে উভয় নমুনা একই বেস জনসংখ্যা থেকে আসতে পারে আমার ক্রমশক্তি পরীক্ষা আরও ভাল হতে পারে।

আর একটি বিকল্প আছে (যা আপনি নিজের দ্বিতীয় পছন্দ বলে মনে করেন) যা বুটস্ট্র্যাপের আত্মবিশ্বাসের অন্তরগুলির উপর ভিত্তি করে। মূলত, এটি ধরে নেওয়া হয় যে যদি আপনার বর্ণিত কভারেজটি একটি স্তরে সেই তাত্পর্য ধারণ করে তবে এটি -বিশ্বাসের অন্তর অন্তর্ভুক্ত না করে নাল অনুমানের সমতুল্য । উদাহরণস্বরূপ দেখুন, এই প্রশ্ন: আত্মবিশ্বাসের অন্তর এবং অনুমানের পরীক্ষার মধ্যে পার্থক্য কী?α(1α)

এটি একটি খুব নমনীয় পদ্ধতি এবং অনেক পরীক্ষার জন্য প্রযোজ্য। তবে, ভাল বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবধানগুলি তৈরি করা এবং ওয়াল্ড-আনুমানিকতা বা পার্সেন্টাইল পদ্ধতিটি ব্যবহার না করেই এটি অত্যন্ত সমালোচিত। কিছু তথ্য এখানে: বুটস্ট্র্যাপ ভিত্তিক আত্মবিশ্বাসের ব্যবধান


1
চমৎকার উত্তর. সুতরাং দ্বিতীয় বিকল্পটি খুব সামঞ্জস্যতা প্রয়োজন? ধরুন আপনার আত্মবিশ্বাসের ব্যবধানের গড় গড় 0 এর চেয়ে বড় এবং আপনি এইচটিকে 0 বলে মনে করছেন না তবে তারপরে 0 কোথায় আপনার আত্মবিশ্বাসের ব্যবধানে রয়েছে তা দেখার চেয়ে এইচ মানকে কতটা চূড়ান্ত বলে ধরে নেওয়া হয় না (তার চেয়ে বেশি গড় কী?) এগুলি দুটি পৃথক দিকে রয়েছে, যদি আপনি ধরে নেন আপনি আত্মবিশ্বাসের ব্যবধানটি পরিবর্তন করছেন)।
মিশাল

@ এরিক সবেমাত্র অনুরূপ প্রশ্নের উপর একটি অনুগ্রহ শুরু করেছিলেন - যা মূলত উপরের মন্তব্যের দীর্ঘতর বাতাসের সংস্করণ - 2 বিকল্পটি কখন ব্যবহার করা যেতে পারে এবং কোন পরিস্থিতিতে? stats.stackexchange.com/questions/175659/…
জাভিয়ের
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.