বুটস্ট্র্যাপ হাইপোথিসিস পরীক্ষায় নাল হাইপোথিসিসের অধীনে কেন ডেটা পুনরায় তৈরি করা উচিত?


11

হাইপোথিসিস টেস্টিং বুটস্ট্র্যাপ পদ্ধতির সহজবোধ্য আবেদন পরীক্ষার পরিসংখ্যান আস্থা ব্যবধান অনুমান হয় θ বারবার স্থানে বুট-স্ট্র্যাপ নমুনা তে এটি গণনা করে (পরিসংখ্যাত যাক θ বুটস্ট্র্যাপ থেকে নমুনা বলা যেতে ^ θ * )। আমরা প্রত্যাখ্যান এইচ 0 যদি ভাবা প্যারামিটার θ 0 আস্থা ব্যবধান বাইরে (যা সাধারণত 0 সমান) মিথ্যা ^ θ *θ^θ^θ*^H0θ0θ^

আমি পড়েছি, যে এই পদ্ধতিতে কিছু শক্তি নেই। দ্বারা নিবন্ধে হলের পি এবং উইলসন এসআর "বুটস্ট্র্যাপ প্রস্তাব টেস্টিং জন্য দুটি নির্দেশিকা" (1992) এটি প্রথম গাইডলাইন হিসাবে লেখা আছে, যে এক রীস্যাম্পেল উচিত না ^ θ * - θ 0 । এবং এই অংশটি আমি বুঝতে পারি না।θ^θ^θ^θ0

নাকি ব্যবস্থা শুধু মূল্নির্ধারক এর পক্ষপাত ^ θ * ? পক্ষপাতিত্বহীন estimators এই মত প্রকাশের আস্থা অন্তর সবসময় কম হওয়া দরকার চেয়ে ^ θ * - θ 0 , কিন্তু আমি দেখতে এটি পরীক্ষা কি আছে, কি ব্যর্থ θ = θ 0 ? আমি কোথাও দেখতে পাচ্ছি না যে আমরা θ 0 সম্পর্কে তথ্য রেখেছি ।θ^θ^θ^θ^θ0θ^=θ0θ0


আপনারা যারা, এই নিবন্ধটিতে অ্যাক্সেস নেই, তাদের জন্য এটি প্রাসঙ্গিক অনুচ্ছেদের একটি উদ্ধৃতি যা থিসিসের পরপরই আসে:

কেন এটা গুরুত্বপূর্ণ উপলব্ধি করার জন্য মান্য যে পরীক্ষা প্রত্যাখ্যান জড়িত হবে যদি | Θ - θ 0 | "খুব বড়।" তাহলে θ 0 প্রকৃত মান থেকে একটি দীর্ঘ পথ θ (অর্থাত, যদি এইচ 0 একেবারেই ভুল থাকে) তাহলে পার্থক্য | Θ - θ 0 | | এর ননপ্যারমেট্রিক বুটস্ট্র্যাপ বিতরণের তুলনায় কখনই খুব বেশি বড় দেখাবে না Θ - θ 0 | । আরও একটি অর্থবহ তুলনা হয় বিতরণের সাথেH0|θ^-θ0|θ0θএইচ0|θ^-θ0||θ^-θ0|। বস্তুত, যদি প্রকৃত মূল্যθহল θ 1 তারপর 1 বুটস্ট্র্যাপ পরীক্ষা বাড়ে শক্তি | θ 1 - θ 0 | বেড়ে যায়, প্রদত্ত পরীক্ষা রীস্যাম্পেলিং উপর ভিত্তি করে তৈরি | ^ Θ * - θ | কিন্তু ক্ষমতা সর্বাধিক কমে তাত্পর্য স্তর (যেমন | θ 1 - θ 0 | বৃদ্ধি) যদি পরীক্ষা রীস্যাম্পেলিং উপর ভিত্তি করে তৈরি | θ -|θ*^-θ^|θθ1|θ1-θ0||θ*^-θ^||θ1-θ0||θ^-θ0|

উত্তর:


7

এটি বুটস্ট্র্যাপ উপমা নীতি। (অজানা) অন্তর্নিহিত সত্য বন্টন হাতে একটি নমুনা উত্পাদিত এক্স 1 , ... , x এর এন সঙ্গে সিডিএফ এফ এন , যেটা ঘুরে ফিরে পরিসংখ্যাত উত্পাদিত θ = টি ( এফ এন ) কিছু ক্রিয়ামূলক জন্য টি ( ) । বুটস্ট্র্যাপ ব্যবহারের আপনার ধারণাটি একটি পরিচিত ডিস্ট্রিবিউশন - এফের উপর ভিত্তি করে নমুনা বিতরণ সম্পর্কে বিবৃতি দেওয়াএফএক্স1,...,এক্সএনএফএনθ^=টি(এফএন)টি()এফ~, যেখানে আপনি একটি অভিন্ন নমুনা প্রোটোকল ব্যবহার করার চেষ্টা করেন (যা কেবলমাত্র আইআইডি ডেটার জন্য হ'ল সম্ভব; নির্ভরশীল ডেটা সর্বদা স্যাম্পলিং প্রক্রিয়াটি কীভাবে সঠিকভাবে পুনরুত্পাদন করতে পারে তার সীমাবদ্ধতার দিকে নিয়ে যায়) এবং একই কার্যকরী প্রয়োগ করে । আমি এটি একটি পরিষ্কার ডায়াগ্রামের সাথে অন্য পোস্টে প্রদর্শন করেছি what সুতরাং (+ + নিয়মানুগ স্যাম্পলিং) বিচ্যুতি বুটস্ট্র্যাপ অ্যানালগ θ - θ 0 , আপনার কেন্দ্রীয় সুদের পরিমাণ, বুটস্ট্র্যাপ প্রতিলিপি এর কুটিলতা রয়েছে θ * কি পরিচিত থেকে বিতরণের জন্য সত্য হতে পারে ~ এফ , স্যাম্পলিং প্রক্রিয়া আপনি প্রয়োগ করেছেন, এবং কার্যকরটি()θ^-θ0θ^*এফ~ , অর্থাৎ আপনার কেন্দ্রীয় প্রবণতার পরিমাপ টি ( ˜ ) । আপনি আসল ডেটা, আপনার থেকে প্রতিস্থাপন সহ স্ট্যান্ডার্ড nonparametric বুটস্ট্র্যাপ ব্যবহার করে থাকেন ~ এফ = এফ এন , তাই কেন্দ্রীয় প্রবণতা আপনার পরিমাপ হতে হয়েছে টি ( এফ এন ) θ মূল ডেটা উপর ভিত্তি করে।টি()টি(এফ~)এফ~=এফএনটি(এফএন)θ^

অনুবাদ ছাড়াও, বুটস্ট্র্যাপ পরীক্ষাগুলি নিয়ে সূক্ষ্ম বিষয়গুলি চলছে যা কখনও কখনও অতিক্রম করা কঠিন। শূন্যের অধীনে পরীক্ষার পরিসংখ্যানের বিতরণ বিকল্পের অধীনে পরীক্ষার পরিসংখ্যান বিতরণ থেকে খুব আলাদা হতে পারে (উদাহরণস্বরূপ, বুটস্ট্র্যাপের সাথে ব্যর্থ হওয়া প্যারামিটার স্পেসের সীমানায় পরীক্ষাগুলিতে )। সহজ পরীক্ষার তোমার মত স্নাতক শ্রেণীর জানতে -test শিফট অধীনে পরিবর্তিত হয়, কিন্তু চিন্তা, "হেক, আমি শুধু সবকিছু শিফট" ব্যর্থ একবার আপনি ধারণাগত জটিলতা পরবর্তী স্তরে, asymptotic সরানো আছে χ 2 পরীক্ষার। এটি সম্পর্কে চিন্তা করুন: আপনি এটি পরীক্ষা করছেন যে μ = 0 , এবং আপনার পর্যবেক্ষণ করা ˉ x =টিχ2μ=0 । তারপর যখন আপনি একটি গঠন করা χ 2 পরীক্ষা ( ˉ এক্স - μ ) 2 / ( গুলি 2 / এন ) ˉ এক্স 2 / ( গুলি 2 / এন ) সঙ্গে বুটস্ট্র্যাপ অ্যানালগ ˉ এক্স 2 * / ( গুলি 2 * / এন ) , তারপরে এই পরীক্ষার n ˉ x 2 / s 2 এর একটি অন্তর্নিহিত অ-কেন্দ্রীয়তা রয়েছে hasএক্স¯=0.78χ2(এক্স¯-μ)2/(গুলি2/এন)এক্স¯2/(গুলি2/এন)এক্স¯*2/(গুলি*2/এন)এনএক্স¯2/গুলি2শুরু থেকেই, কেন্দ্রীয় পরীক্ষা হওয়ার পরিবর্তে আমরা যেমনটি এটি প্রত্যাশা করতাম। বুটস্ট্র্যাপ পরীক্ষাটি কেন্দ্রীয় করতে, আপনাকে সত্যিকারের মূল অনুমানটি বিয়োগ করতে হবে।

পরীক্ষার বহুচলকীয় প্রেক্ষিতে অনিবার্য হয়, ছোটো থেকে পিয়ারসন χ 2 থেকে অন্যসাপেক্ষ টেবিলের জন্য Bollen-Stine বুটস্ট্র্যাপ কাঠামোগত সমীকরণ মডেল পরীক্ষার পরিসংখ্যান করুন। এই পরিস্থিতিতে বিতরণ স্থানান্তর করার ধারণাটি অত্যন্ত সংজ্ঞাযুক্ত ... যদিও মাল্টিভারিয়েট কোভারিয়েন্স ম্যাট্রিক্সের পরীক্ষাগুলির ক্ষেত্রে এটি উপযুক্ত ঘোরার দ্বারা কার্যকরযোগ্য ।χ2χ2


ধন্যবাদ. এমন একটি আছে যা আমি এখনও বুঝতে পারি না: বুটস্ট্র্যাপে আমরা কোথায় তথ্য রাখি ? যেখানে এইচ 0 টি মিথ্যা, সেখানে θ 0 সত্য বিতরণ থেকে যথেষ্ট দূরে থাকতে পারে। θ0এইচ0θ0
অ্যাডাম রাইজকোভস্কি

আপনি শূন্যের নীচে পি-মানটি গুণান, সুতরাং যখন শূন্যের সাথে মানানসই হয় তখন আপনার কেসটি বিবেচনা করা উচিত । বিকল্প বিবেচনা করা অবশ্যই বিকল্পের অধীনে করা মূল্যবান তবে এটি ... বাহ ... এটি বুটস্ট্র্যাপ টেস্টিং পদ্ধতির একটি উন্নত ব্যবহার be θ0
StasK

3

ঠিক আছে, আমি পেয়েছি আপনাকে ধন্যবাদ, স্টাসকে, এত ভালো উত্তরের জন্য। আমি এটি অন্যদের শেখার জন্য গ্রহণযোগ্য রাখব, তবে আমার বিশেষ ক্ষেত্রে আমি খুব সাধারণ সত্যটি অনুপস্থিত ছিল:

সাধারণ ও নমুনাযুক্ত গড় পরীক্ষার জন্য হল ও উইলসন নির্দেশিকা অনুসারে বুটস্ট্র্যাপের পদ্ধতিটি হ'ল (আর-অনুপ্রেরিত সিউডো কোডে):

1function(data, θθ 00 ^ θ *θ0 ) {
2 θ^ t.test(data, mu = θ0 )$statistic
3 count 0
4for(i in 1:1000){
5 bdata sample(data)
6 θ*^ t.test(bdata, mu = ^ θ * θθ^ )$statistic
7 if ( θ*^θ^ ) count++
8 }
9 count/1000
10 }

অংশ আমি মিস ছিল "ব্যবহার" করা হয়েছিল লাইনে (যেখানে আমরা রেফারেন্স নির্ধারণ θ )।θ02θ^

এটি লক্ষণীয় আকর্ষণীয়, যে লাইনে 2এবং 6আমরা সহজেই এর p.valueপরিবর্তে সহজেই ব্যবহার করতে পারি statistic। যে ক্ষেত্রে আমরা পরিবর্তন করা উচিত মধ্যে লাইনে ।7


আমি আগে উন্নীত করেছি, কিন্তু তখন বুঝতে পারি যে এটি আসলে ভুল incor হলের & উইলসন অনুযায়ী (অনুচ্ছেদ 2, PG। একজন মূল্নির্ধারক হয় θ না পরীক্ষার পরিসংখ্যান আপনাকে হৃদয়ঙ্গম করান করেছি। উপায় যে θ 0 খেলার মধ্যে আসে যে আমরা একটি resampled বন্টন গঠন করে ( θ * -θ^θθ0, তারপর দেখি( θ -θ0)দেখায় "চরম" resampled বন্টন তুলনায়। (θ^*-θ^)(θ^-θ0)
অর্ধ-পাস

1
সম্ভবত সহায়ক: মাইকেল চেরনিক এখানে আমার সম্পর্কিত প্রশ্নের উত্তরে একটি সংক্ষিপ্ত জ্ঞান সরবরাহ করেছিল। stats.stackexchange.com/questions/289236/… )
-অর্ধ-পাস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.