আগ্রহের পরিমাণ, সাধারণত কোনও বিতরণের কার্যক্ষম, যদি যুক্তিসঙ্গতভাবে মসৃণ হয় এবং আপনার ডেটা আইড হয়, আপনি সাধারণত বেশ নিরাপদ অঞ্চলে থাকেন। অবশ্যই, অন্যান্য পরিস্থিতি রয়েছে যখন বুটস্ট্র্যাপ পাশাপাশি কাজ করবে।
বুটস্ট্র্যাপের "ব্যর্থ" হওয়ার অর্থ কী
বিস্তৃতভাবে বলতে গেলে, বুটস্ট্র্যাপের উদ্দেশ্য হ'ল স্বার্থের পরিসংখ্যানের জন্য একটি স্যাম্পলিং বিতরণ আনুমানিক। এটি প্যারামিটারের প্রকৃত অনুমান সম্পর্কে নয়। সুতরাং, যদি আগ্রহের পরিসংখ্যান (কিছুটা উদ্ধার ও কেন্দ্রিকের অধীনে) যদি এবং আমরা আমাদের বুটস্ট্র্যাপ বিতরণ করতে চাই বিতরণে রূপান্তর করুন । আমাদের যদি এটি না থাকে, তবে আমরা তৈরি ইনফারেন্সগুলিতে বিশ্বাস করতে পারি না।X^nX^n→X∞X∞
চূড়ান্ত অর্ডার পরিসংখ্যানের নমুনা বিতরণ আনুমানিক করার চেষ্টা করার সময় আইআইডি কাঠামোর মধ্যেও বুটস্ট্র্যাপটি ব্যর্থ হতে পারে তার ক্যানোনিকাল উদাহরণ। নীচে একটি সংক্ষিপ্ত আলোচনা করা হয়।
একটি বিতরণ থেকে এলোমেলো নমুনার সর্বাধিক অর্ডার পরিসংখ্যানU[0,θ]
যাক উপর IID অভিন্ন র্যান্ডম ভেরিয়েবল একটা ক্রম হতে । যাক । বিতরণের হয়
(দ্রষ্টব্য যে খুব সাধারণ যুক্তি দিয়ে, এটি প্রকৃতপক্ষে সম্ভাব্যতায় দেখায় এবং প্রায় অবশ্যই , যদি এলোমেলো ভেরিয়েবলগুলি একই জায়গাতে সংজ্ঞায়িত করা হয়।)X1,X2,…[0,θ]X(n)=max1≤k≤nXkX(n)
P(X(n)≤x)=(x/θ)n.
X(n)→θ
একটি প্রাথমিক গণনা
বা অন্য কথায়, ডিস্ট্রিবিউশনে রূপান্তরিত করে একটি ঘনঘন র্যান্ডম ভেরিয়েবলকে গড়- ।
P(n(θ−X(n))≤x)=1−(1−xθn)n→1−e−x/θ,
n(θ−X(n))θ
এখন আমরা একটি (সাদাসিধা) গঠন বুটস্ট্র্যাপ বিতরণের হিসাব রীস্যাম্পেলিং দ্বারা প্রতিস্থাপন সঙ্গে পেতে ও বন্টন ব্যবহার এর উপর শর্তাধীন ।n(θ−X(n))X1,…,XnX⋆1,…,X⋆nn(X(n)−X⋆(n))X1,…,Xn
তবে, লক্ষ্য করুন যে সম্ভাব্যতা সাথে , এবং তাই বুটস্ট্র্যাপ বিতরণ শূন্যে একটি পয়েন্ট ভর রয়েছে এমনকি অ্যাসিপোটোটিকভাবে সত্ত্বেও প্রকৃত সীমাবদ্ধ বিতরণ অবিচ্ছিন্ন যে সত্য।X⋆(n)=X(n)1−(1−1/n)n→1−e−1
আরো স্পষ্টভাবে, যদিও সত্য সীমিত বন্টন গড় সঙ্গে সূচকীয় হয় , সীমিত বুটস্ট্র্যাপ বন্টন একটি স্থান বিন্দু ভর আকার শূন্য এ প্রকৃত মূল্যের স্বাধীন । গ্রহণ করে ভালোই বড়, আমরা বন্টন কোনো নির্দিষ্ট বিরতি জন্য নির্বিচারে ছোট সীমিত সত্য সম্ভাবনা করতে পারেন , এখনো বুটস্ট্র্যাপ পাবেন ( এখনও !) রিপোর্ট আছে যে এই ব্যবধান অন্তত 0,632 সম্ভাব্যতা! এ থেকে এটি স্পষ্ট হওয়া উচিত যে বুটস্ট্র্যাপ এই সেটিংটিতে নির্বিচারে খারাপ আচরণ করতে পারে ।θ1−e−1≈0.632 θθ[0,ε)
সংক্ষেপে, এই ক্ষেত্রে বুটস্ট্র্যাপ ব্যর্থ (দুর্ভাগ্যজনকভাবে)। প্যারামিটার স্পেসের প্রান্তে প্যারামিটারগুলি নিয়ে কাজ করার সময় জিনিসগুলি ভুল হতে থাকে।
সাধারণ র্যান্ডম ভেরিয়েবলের নমুনা থেকে প্রাপ্ত একটি উদাহরণ
আশ্চর্যজনকভাবে সহজ পরিস্থিতিতে বুটস্ট্র্যাপের ব্যর্থতার অনুরূপ অন্যান্য উদাহরণ রয়েছে।
একটি নমুনা বিবেচনা থেকে যেখানে জন্য প্যারামিটার স্থান অবধি সীমিত থাকবে । এই ক্ষেত্রে এমএলই । আবার, আমরা বুটস্ট্র্যাপ অনুমান । আবার, এটি দেখানো যেতে পারে যে (পর্যবেক্ষণের নমুনায় শর্তসাপেক্ষ) এর বিতরণ হিসাবে একই সীমাবদ্ধ বিতরণে রূপান্তরিত করে না ।X1,X2,…N(μ,1)μ[0,∞)X^n=max(X¯,0)X^⋆n=max(X¯⋆,0)n−−√(X^⋆n−X^n)n−−√(X^n−μ)
বিনিময়যোগ্য অ্যারে
সম্ভবত সর্বাধিক নাটকীয় উদাহরণগুলির মধ্যে একটি হল এক্সচেঞ্জযোগ্য অ্যারে। যাক এলোমেলো ভেরিয়েবলের একটি অ্যারে হয়ে , প্রতিটি জোড় পেরুমিউশন ম্যাট্রিকেসের জন্য এবং , অ্যারে এবং joint এর একই যৌথ বন্টন রয়েছে। অর্থাৎ, এর সারি এবং কলামগুলি অনুমতি দেওয়া বিতরণটিকে অবিচ্ছিন্ন রাখে। (উদাহরণস্বরূপ প্রতি সেল প্রতি এক পর্যবেক্ষণ সহ আপনি দ্বিমুখী র্যান্ডম এফেক্টস মডেল সম্পর্কে ভাবতে পারেন, যদিও মডেলটি আরও সাধারণ।Y=(Yij)PQYPYQY
ধরা যাক আমরা (সমস্ত উপায়ের উপরে বর্ণিত বিনিময়যোগ্যতা অনুমানের কারণে একটি আস্থার ব্যবধান অনুমান করতে চাই কোষগুলি অবশ্যই একই হবে)।μ=E(Yij)=E(Y11)
ম্যাককুলাঘ (2000) এই জাতীয় অ্যারে বুটস্ট্র্যাপিংয়ের দুটি পৃথক প্রাকৃতিক (অর্থাত্ নিষ্পাপ) উপায় বিবেচনা করেছিল। তাদের কেউই নমুনাটির অর্থ হিসাবে সংক্ষিপ্ত বিবরণ লাভ করতে পারে না। তিনি একমুখী বিনিময়যোগ্য অ্যারে এবং লিনিয়ার রিগ্রেশন এর কয়েকটি উদাহরণ বিবেচনা করেন।
তথ্যসূত্র
দুর্ভাগ্যক্রমে, বিষয়টি অনানুষ্ঠানিক, সুতরাং এগুলির কোনওটিই বিশেষভাবে পড়া সহজ নয়।
পি। বিকেল এবং ডি ফ্রিডম্যান, বুটস্ট্র্যাপের জন্য কিছু অ্যাসিম্পটোটিক তত্ত্ব । অ্যান। তাত্ক্ষণিকবাজার। , খণ্ড। 9, না। 6 (1981), 1196–1217।
DWK অ্যাণ্ড্রুজ, বুটস্ট্র্যাপ যখন একটি প্যারামিটার প্যারামিটার স্থান সীমানা হয় অসঙ্গতিগুলি , Econometrica , ভোল। 68, না। 2 (2000), 399–405।
পি। ম্যাককুলাঘ, পুনরায় মডেলিং এবং এক্সচেঞ্জযোগ্য অ্যারে , বার্নোল্লি , খণ্ড। 6, না। 2 (2000), 285–301।
ই এল লেহম্যান এবং জেপি রোমানো, পরিসংখ্যানের হাইপোথেসিস পরীক্ষা করছেন , ৩ য়। এডি।, স্প্রিংগার (2005)। [১৫ তম অধ্যায়: সাধারণ বড় নমুনা পদ্ধতি]