অ-প্যারামেট্রিক বুটস্ট্র্যাপ পি-মানগুলি বনাম আত্মবিশ্বাসের ব্যবধানগুলি


11

প্রসঙ্গ

এটি এই প্রশ্নের সাথে কিছুটা মিল , তবে আমি মনে করি এটি একেবারে সদৃশ নয়।

আপনি কীভাবে বুটস্ট্র্যাপ হাইপোথিসিস পরীক্ষাটি পরিচালনা করবেন সে সম্পর্কে নির্দেশাবলীটি যখন সন্ধান করেন, তখন সাধারণত বলা হয় যে আত্মবিশ্বাসের ব্যবস্থাগুলির জন্য অনুশীলনমূলক বিতরণটি ব্যবহার করা ভাল তবে আপনাকে পি-পি পেতে নাল অনুমানের অধীনে বিতরণ থেকে সঠিকভাবে বুটস্ট্র্যাপ করা দরকার need মান। উদাহরণ হিসাবে, এই প্রশ্নের গৃহীত উত্তর দেখুন । ইন্টারনেটে একটি সাধারণ অনুসন্ধান বেশিরভাগ ক্ষেত্রে অনুরূপ উত্তরগুলি দেখা দেয় বলে মনে হয়।

অনুশীলনমূলক বিতরণের উপর ভিত্তি করে পি-মান ব্যবহার না করার কারণটি হ'ল বেশিরভাগ সময় আমাদের অনুবাদ অনুবাদ হয় না।

উদাহরণ

একটি সংক্ষিপ্ত উদাহরণ দিতে দিন। আমাদের একটি মুদ্রা আছে এবং আমরা মাথাগুলির ফ্রিকোয়েন্সি 0.5 এর চেয়ে বেশি কিনা তা দেখতে একতরফা পরীক্ষা করতে চাই

আমরা n=20 ট্রায়াল করি এবং k=14 হেড পাই । এই পরীক্ষাটি জন্য সত্য P-মান হতে হবে p=0.058

অন্যদিকে আমরা যদি 20 টির মধ্যে 14 টি মাথা বুটস্ট্র্যাপ করি তবে আমরা কার্যকরভাবে দ্বিপদী বিতরণ থেকে n=20 এবং p = 14 দিয়ে নমুনা করিp=1420=0.7। ০.২ বিয়োগ করে এই বিতরণটি স্থানান্তরিত করার মাধ্যমে প্রাপ্ত অভিজ্ঞতাগত বন্টনের বিপরীতে আমাদের পর্যবেক্ষণের মান ০. testing পরীক্ষা করার সময় আমরা সবেমাত্র উল্লেখযোগ্য ফল পাব result

এই ক্ষেত্রে তাত্পর্যটি খুব সামান্য, তবে আমরা যখন সাফল্যের হারের বিরুদ্ধে পরীক্ষার চেষ্টা করি তখন এটি 1 এর কাছাকাছি চলে আসে তখন এটি বড় হয়।

প্রশ্ন

এখন আমাকে আমার প্রশ্নের আসল পয়েন্টে আসা যাক: খুব একই ত্রুটি আত্মবিশ্বাসের অন্তরগুলির জন্যও ধারণ করে। বস্তুত, যদি একটি আস্থা ব্যবধান বিবৃত আস্থা স্তর আছে α তারপর আস্থা নাল হাইপোথিসিস অধীনে পরামিতি ধারণকারী না বিরতি একটি তাত্পর্য পর্যায়ে নাল হাইপোথিসিস প্রত্যাখ্যান সমতূল্য 1α

এটা কেন যে অনুভূতিভিত্তিক বিতরণের উপর ভিত্তি করে আস্থা অন্তরগুলি ব্যাপকভাবে গৃহীত হয় এবং পি-মান হয় না?

এর আরও গভীর কারণ আছে বা লোকেরা কি আত্মবিশ্বাসের ব্যবধানের সাথে কেবল রক্ষণশীল নয়?

এই উত্তরে পিটার ডালগার্ড এমন একটি উত্তর দেয় যা আমার যুক্তির সাথে একমত বলে মনে হয়। তিনি বলেন:

এই যুক্তির রেখাটি সম্পর্কে বিশেষত কোনও ভুল নেই, বা সিআই এর গণনার চেয়ে কমপক্ষে (খুব বেশি) খারাপ নয়।

(অনেক) কোথা থেকে আসছে? এটি সূচিত করে যে পি-মানগুলি সেভাবে উত্পন্ন করা কিছুটা খারাপ, তবে পয়েন্টটি বিস্তারিতভাবে বর্ণনা করে না।

সর্বশেষ ভাবনা

এছাড়াও বুটস্ট্র্যাপ পরিচিতি এফরন এবং Tibshirani দ্বারা তারা আস্থা অন্তর কিন্তু P-মান যদি না তারা একটি সঠিক নাল হাইপোথিসিস বন্টন অধীনে তৈরি হয় না স্থান অনেক উৎসর্গ, সাধারণ সমানতা প্রায় এক বিজ্ঞাপন লাইন বাদ দিয়ে অনুমানের পরীক্ষা-নিরীক্ষা সম্পর্কে অধ্যায়ের মধ্যে আস্থা অন্তর এবং পি-মান।

আসুন আমি যুক্ত হওয়া প্রথম প্রশ্নটিতে ফিরে আসি । আমি মাইকেল চেরনিকের উত্তরের সাথে একমত, তবে আবার তিনি যুক্তিও দিয়েছেন যে বুদ্ধিদীপ্ত বুটস্ট্র্যাপ বিতরণের উপর ভিত্তি করে আত্মবিশ্বাসের অন্তর এবং পি-মান উভয়ই কিছু পরিস্থিতিতে দৃ in়ভাবে বিশ্বাসযোগ্য নয়। এটি আপনাকে ব্যাখ্যা করে না যে আপনি কেন অনেক লোক আপনাকে বলছেন যে অন্তরগুলি ঠিক আছে, কিন্তু পি-মানগুলি হয় না।


আমি এই প্রশ্নের উপর অনুগ্রহ শুরু করছি যেহেতু বুটস্ট্রাপ সিআই কোনও হাইপোথিসিস গ্রহণ / প্রত্যাখ্যান করার জন্য কীভাবে এবং কখন বুটস্ট্রাপ সিআই ব্যবহার করা যেতে পারে সে সম্পর্কে স্পষ্টতা অর্জনে আমি আগ্রহী। সম্ভবত আপনি নিজের প্রশ্নটিকে আরও সংক্ষিপ্ত এবং আবেদনময় করে তুলতে পুনরায় পুনঃনির্ধারণ / পুনরায় ফর্ম্যাট করতে পারেন? ধন্যবাদ!
জাভিয়ের বোউরেট সিকোতে

আমি মনে করি যে বেশিরভাগ লোক সম্মত হবেন যে যখন নিম্নলিখিত অনুমানগুলি প্রয়োগ করা হয় তখন অনুমানের পরীক্ষার জন্য সিআই ব্যবহার করা ঠিক আছে: পরীক্ষার পরিসংখ্যানের প্রতিসাম্যিক বিতরণ, মূল পরীক্ষার পরিসংখ্যান, সিএলটি প্রয়োগ, কোনও বা কিছু উপদ্রব প্যারামিটার ইত্যাদির ক্ষেত্রে ... তবে কী হবে যখন পরিসংখ্যান অদ্ভুত বা গুরুত্বপূর্ণ নয় প্রমাণিত। এখানে আমি কাজ করছি এমন একটি বাস্তব উদাহরণ: উদাহরণস্বরূপ পরিসংখ্যানের 75 তম পার্সেন্টাইল (দুটি অঙ্কের অনুপাত) এর মধ্যে দুটি নমুনা পার্থক্য
জাভেয়ের বুরেট সিকোট

নাল অনুমানের অধীনে কীভাবে নমুনা দেওয়া যায় তা সহজ উত্তরটি কী নয়, সুতরাং একটি বিকল্প পদ্ধতি আছে যা পরিষ্কারভাবে আরও ভাল? বুটস্ট্র্যাপের অধীনে স্যাম্পলিং সাধারণত অভিজ্ঞতা অভিজ্ঞতা প্রদানের অধীনে ঘটে তাই প্রকৃত ডেটা উত্পন্নকরণের ব্যবস্থা, যাতে নালীর নীচে স্যাম্পলিংয়ের পরিবর্তে পরিষ্কারভাবে ব্যবহার করা উচিত নয়। সত্য তথ্য উত্পন্নকরণ ব্যবস্থার অধীনে নমুনা বিতরণ উল্টানো থেকে বুটস্ট্র্যাপড সিআই পাওয়া যায়। এটি সত্য যে এই সিআই হয়ত ভাল কাজ করতে পারে না, তবে ডালগার্ড যেমন বলেছিল, কীভাবে এটি ঠিক করা যায় তা স্পষ্টভাবে জানা যায় না।
jsk

আমার স্পষ্ট করে বলা উচিত যে অনুপ্রেরণামূলক বিতরণটি সত্য উপাত্ত তৈরির প্রক্রিয়া মাত্র x সত্যের প্রতিনিধি না হওয়া পর্যন্ত এটি অজানা দিকগুলিতে বুটস্ট্র্যাপড সিআইকে নেতিবাচকভাবে প্রভাব ফেলবে যার ফলে 95% এরও কম কভারেজ হয়।
jsk

1
শূন্যের নীচে নমুনা স্পষ্ট হয় যখন পরীক্ষা মানে একটি পার্থক্য, তবে অনেক ক্ষেত্রে নালটি কীভাবে পুনরুত্পাদন করা যায় তা স্পষ্ট নয় ... উদাহরণস্বরূপ নালটি দুটি অনুপাতের 75 তম পার্সেন্টাইল একই ... কীভাবে আমি কি প্রতিটি নমুনায় অনুপাতের সংখ্যার এবং ডোনমিনেটরগুলি স্থানান্তর করতে পারি? এছাড়াও, আমি কীভাবে নিশ্চিত হতে পারি যে অনুপাতের উপাদানগুলি বদল করা আসলে নালটি পুনরুত্পাদন করছে?
জাভেয়ের বউরেট সিকোতে

উত্তর:


3

যেমন @ মিশেল চের্নিক একটি লিঙ্কিত প্রশ্নের উত্তরে তার মন্তব্যের জবাবে বলেছিলেন :

আত্মবিশ্বাসের ব্যবধান এবং অনুমানের পরীক্ষার মধ্যে সাধারণভাবে 1-1 টি চিঠিপত্র রয়েছে। উদাহরণস্বরূপ, কোনও মডেল প্যারামিটারের জন্য 95% আত্মবিশ্বাসের ব্যবধানটি সেই প্যারামিটারটির মান সম্পর্কিত 5% স্তর অনুমানের পরীক্ষার জন্য অ-প্রত্যাখ্যান অঞ্চলকে প্রতিনিধিত্ব করে। জনসংখ্যা বিতরণের আকার সম্পর্কে কোনও প্রয়োজন নেই। স্পষ্টতই যদি এটি আত্মবিশ্বাসের অন্তরগুলিতে সাধারণভাবে প্রয়োগ হয় তবে এটি বুটস্ট্র্যাপের আত্মবিশ্বাসের অন্তরগুলির জন্য প্রযোজ্য।

সুতরাং এই উত্তরটি দুটি সম্পর্কিত সমস্যা সম্বোধন করবে: (১) প্রশ্নটিতে প্রস্তাবিত বুটস্ট্র্যাপ ফলাফলের উপস্থাপনা পি- মূল্যগুলির চেয়ে আত্মবিশ্বাসের ব্যবধান (সিআই) নির্দিষ্ট করার জন্য আরও ঘন ঘন কেন মনে হতে পারে এবং (২) কখন উভয় পি- মূল্যায়ন হতে পারে ? এবং বুটস্ট্র্যাপ দ্বারা নির্ধারিত সিআই অবিশ্বাস্য বলে সন্দেহ করা হয় যাতে বিকল্প পদ্ধতির প্রয়োজন হয়।

আমি এমন ডেটা জানি না যা বিশেষত প্রথম ইস্যুতে এই প্রশ্নের দাবিকে সমর্থন করে। সম্ভবত অনুশীলনে অনেকগুলি বুটস্ট্র্যাপ থেকে উদ্ভূত বিন্দু অনুমান করা হয় (বা কমপক্ষে মনে হয়) পরীক্ষার সিদ্ধান্তের সীমানা থেকে এতদূর যে সম্পর্কিত নাল অনুমানের পি- ভ্যালুতে খুব একটা আগ্রহ নেই , মূল বিন্দুটি নিজেই এবং প্রাথমিক আগ্রহের সাথে এর সম্ভাব্য পরিবর্তনশীলতার বিশালতার কিছু যুক্তিসঙ্গত পরিমাপ।

দ্বিতীয় ইস্যুতে শ্রদ্ধার সাথে, অনেক ব্যবহারিক অ্যাপ্লিকেশনগুলিতে "পরীক্ষার পরিসংখ্যানগুলির প্রতিসাম্য বিতরণ, মূল পরীক্ষার পরিসংখ্যান, সিএলটি প্রয়োগ, কোনও বা কিছু উপদ্রব পরামিতি ইত্যাদি" জড়িত না (উপরের @ জাভিবারব্রেটসাইকোটের মন্তব্যে) যার জন্য খুব কম অসুবিধা হয়। তারপরে প্রশ্ন ওঠে যে কীভাবে এই পরিস্থিতিগুলি থেকে সম্ভাব্য বিচ্যুতিগুলি সনাক্ত করা যায় এবং যখন তারা উত্থাপিত হয় তখন কীভাবে তাদের মোকাবেলা করতে হয়।

আদর্শ আচরণ থেকে এই সম্ভাব্য বিচ্যুতি কয়েক দশক ধরে প্রশংসিত হয়েছে, তাদের সাথে ডিল করার জন্য প্রাথমিকভাবে বেশ কয়েকটি বুটস্ট্র্যাপ সিআই পদ্ধতির বিকাশ ঘটেছে। স্ট্যান্ডিনেটেড বুটস্ট্র্যাপটি একটি মৌলিক পরিসংখ্যান সরবরাহ করতে সহায়তা করে এবং বিসিএ পদ্ধতি বুটস্ট্র্যাপগুলি থেকে আরও নির্ভরযোগ্য সিআই প্রাপ্তির ক্ষেত্রে পক্ষপাত এবং স্কিউনেস উভয়ই নিয়ে কাজ করে। বুটস্ট্র্যাপযুক্ত সিআই নির্ধারণের আগে ডেটাটির বৈচিত্র্য-স্থিতিশীল রূপান্তর , তারপরে মূল স্কেলে ব্যাক-ট্রান্সফর্মেশন সাহায্য করতে পারে।

ন্যায্য মুদ্রা থেকে 20 টি টসের মধ্যে 14 টি মাথা থেকে নমুনা দেওয়ার বিষয়ে এই প্রশ্নের উদাহরণটি বিসিএ পদ্ধতি থেকে সিআই ব্যবহার করে সুন্দরভাবে পরিচালনা করা হয়েছে; আর তে:

> dat14 <- c(rep(1,14),rep(0,6))
> datbf <- function(data,index){d <- data[index]; sum(d)}
> set.seed(1)
> dat14boot <- boot(dat14,datbf,R=999)
> boot.ci(dat14boot)
BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 999 bootstrap replicates

CALL : 
boot.ci(boot.out = dat14boot)

Intervals : 
Level      Normal              Basic         
95%     (9.82, 18.22 )   (10.00, 18.00 )  

Level     Percentile            BCa          
95%       (10, 18 )         ( 8, 17 )  
Calculations and Intervals on Original Scale

অন্যান্য সিআই অনুমানগুলি 20 টোসে প্রতি 10 জন প্রধানের জনসংখ্যার মানের খুব কাছাকাছি বা প্রান্তে অবস্থিত বলে উল্লেখ করা সমস্যাটিকে উত্থাপন করে। বিসিএ সিআই হ'ল সংকোচনের জন্য অ্যাকাউন্ট (যেমন দ্বিপক্ষীয় নমুনা এমনকি প্রতিকূলতার থেকে দূরে স্যাম্পলিং দ্বারা প্রবর্তিত), সুতরাং তারা সুন্দরভাবে জনসংখ্যার মান 10 এর অন্তর্ভুক্ত করে।

এই সমাধানগুলির সুবিধা নেওয়ার আগে আপনাকে আদর্শ আচরণ থেকে এই জাতীয় বিচ্যুতিগুলির সন্ধান করতে হবে। পরিসংখ্যান অনুশীলনের অনেক হিসাবে, আসলে একটি অ্যালগরিদমে প্লাগ ইন করার চেয়ে ডেটার দিকে তাকানো কী হতে পারে। উদাহরণস্বরূপ, পক্ষপাতদুষ্ট বুটস্ট্র্যাপ ফলাফলের জন্য সিআই সম্পর্কে এই প্রশ্নটি উপরের কোডটিতে প্রদর্শিত প্রথম 3 সিআইয়ের ফলাফল দেখায়, তবে বিসিএ সিআই বাদ দিয়েছে। আমি যখন বিসিএ সিআইকে অন্তর্ভুক্ত করার জন্য সেই প্রশ্নটিতে প্রদর্শিত বিশ্লেষণ পুনরুত্পাদন করার চেষ্টা করেছি, তখন আমি ফলাফল পেয়েছি:

> boot.ci(boot(xi,H.boot,R=1000))
Error in bca.ci(boot.out, conf, index[1L], L = L, t = t.o, t0 = t0.o,  : 
estimated adjustment 'w' is infinite

যেখানে 'ডাব্লু' পক্ষপাতিত্ব সংশোধনে জড়িত। পরিসংখ্যান যাচাই করা হচ্ছে তার একটি নির্দিষ্ট সর্বোচ্চ মান রয়েছে এবং বুটস্ট্র্যাপ করা প্লাগ-ইন অনুমানটিও সহজাতভাবে পক্ষপাতদুষ্ট ছিল। এর মতো ফল পাওয়া ইঙ্গিত দেয় যে বুটস্ট্র্যাপযুক্ত সিআইয়ের অন্তর্নিহিত স্বাভাবিক অনুমানগুলি লঙ্ঘিত হচ্ছে।

একটি মৌলিক পরিমাণ বিশ্লেষণ যেমন সমস্যা এড়ানো; যদিও এক অভিজ্ঞতামূলক বিতরণে কার্যকরভাবে নির্ভরযোগ্য পরিসংখ্যান থাকতে পারে না, যুক্তিসঙ্গত হিসাবে কাছাকাছি আসা একটি গুরুত্বপূর্ণ লক্ষ্য। এই উত্তরের শেষ কয়েকটি অনুচ্ছেদগুলি অন্যান্য পরিসংখ্যানগুলিতে লিঙ্ক সরবরাহ করে, যেমন কোনও স্ট্যাটিস্টিক (সম্ভবত কিছু ডেটা ট্রান্সফর্মেশনের পরে) মূলত নিকটবর্তী, এবং গণনামূলকভাবে ব্যয়বহুল তবে সম্ভাব্য সিদ্ধান্ত গ্রহণযোগ্য ডাবল বুটস্ট্র্যাপের সাহায্যে বুটস্ট্র্যাপের মাধ্যমে অনুমান করার জন্য পিভট প্লটগুলি।


ধন্যবাদ এডিএম! যদি সিআই এবং হাইপোথিসিস টেস্টের মধ্যে যদি 1-1 রেখাঙ্কন হয়- তবে বুটস্ট্র্যাপ টেস্টিং কেন সাধারণত নালটি পুনরুত্পাদন করার জন্য ডেটাসেটগুলি স্থানান্তরিত করে? এটি করে আমরা উদাহরণস্বরূপ পার্থক্যের বন্টনের সিআই গণনা করে কী পাব তার চেয়ে আলাদা ফলাফল পাচ্ছি না?
জাভিয়ের বোয়ারেট সিকোত্তে

@ জাভিয়ারবুরেটসিকোট আমি মনে করি এটি একেবারেই সঠিক নয় বলে মনে হয় যে "বুটস্ট্র্যাপ টেস্টিংয়ে সাধারণত নাল পুনরুত্পাদন করার জন্য ডেটাসেটগুলি স্থানান্তরিত করা জড়িত।" প্রতিটি বুটস্ট্র্যাপ নমুনা অন্তর্নিহিত জনসংখ্যার প্রতিনিধিত্ব করার জন্য হাতে থাকা নমুনাটি ব্যবহার করে মূল নমুনা / পরীক্ষার প্রতিরূপ করার চেষ্টা। তবে প্রশ্নের মধ্যে থাকা পরিসংখ্যান যদি গুরুত্বপূর্ণ নয় তবে বুটস্ট্র্যাপযুক্ত নমুনাগুলিতে বিকাশিত সিআই অন্তর্নিহিত জনসংখ্যার উপর বর্ধিত সিআই প্রতিনিধিত্ব করবেন না। তাই আপনি যদি সংশোধন করার প্রয়োজন পরিসংখ্যাত বিতরণের কি এটা নাল অধীনে হত BCA বা অন্যান্য পন্থা সঙ্গে, দিকে।
এডিএম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.