কিছু সমস্যার যে আস্থা অন্তর সব nonparametric বুটস্ট্র্যাপিং অনুমান (ci), কিছু উভয় নিয়ে একটি সমস্যা আরো হয় সাধারণ আছে "গবেষণামূলক" (বলা "প্রাথমিক" এ boot.ci()
আর এর ফাংশন boot
প্যাকেজ এবং সূত্র। 1 ) এবং "পারসেন্টাইল" সিআই অনুমান (যেমন রেফ। ২ তে বর্ণিত হয়েছে ), এবং কিছু কিছু শতাংশ যে পারসেন্টাইল সিআই দ্বারা বর্ধিত হতে পারে।
টিএল; ডিআর : কিছু ক্ষেত্রে পারসেন্টাইল বুটস্ট্র্যাপ সিআই অনুমান পর্যাপ্ত পরিমাণে কাজ করতে পারে তবে কিছু অনুমান যদি ধরে না রাখে তবে পরেরটি সবচেয়ে বেশি অভিজ্ঞতামূলক / বুনিয়াদি বুটস্ট্র্যাপের সাথে পারসেন্টাইল সিআই সবচেয়ে খারাপ পছন্দ হতে পারে। অন্যান্য বুটস্ট্র্যাপ সিআই অনুমান আরও কভারেজ সহ আরও নির্ভরযোগ্য হতে পারে। সব সমস্যা হতে পারে। ডায়াগনস্টিক প্লটগুলি বরাবরের মতো সন্ধান করা কেবলমাত্র একটি সফ্টওয়্যার রুটিনের আউটপুট স্বীকার করে নেওয়া সম্ভাব্য ত্রুটিগুলি এড়াতে সহায়তা করে।
বুটস্ট্র্যাপ সেটআপ
সাধারণত রেফারির পরিভাষা এবং যুক্তি অনুসরণ করে । 1 , আমাদের কাছে ডেটা এর একটি নমুনা রয়েছে যা স্বতন্ত্র এবং অভিন্নভাবে বিতরণ করা এলোমেলো ভেরিয়েবল একটি বন্টন ক্রিয়াকলাপ ভাগ করে নিচ্ছে । গবেষণামূলক বিতরণের ফাংশনটি (EDF) ডেটা নমুনা থেকে নির্মাণ করা হয় । আমরা একটি চরিত্রগত আগ্রহী জনসংখ্যার একটি পরিসংখ্যাত দ্বারা আনুমানিক নমুনা যার মান । আমরা জানতে কতটা ভাল অনুমান করে উদাহরণস্বরূপ, বিতরণ ।ওয়াই আমি এফ এফ θ টি টি টি θ ( টি - θ )y1,...,ynYiFF^θTtTθ(T−θ)
Nonparametric বুটস্ট্র্যাপ EDF থেকে স্যাম্পলিং ব্যবহারসমূহ থেকে অনুকরণমূলক স্যাম্পলিং করার , গ্রহণ আকার প্রতিটি নমুনা থেকে প্রতিস্থাপন সঙ্গে । বুটস্ট্র্যাপ নমুনাগুলি থেকে গণনা করা মানগুলি "*" দিয়ে চিহ্নিত করা হয়। উদাহরণস্বরূপ, বুটস্ট্র্যাপ নমুনা জে গণনা করা স্ট্যাটিস্টিক একটি মান । এফআরএনওয়াইআমিটিটি * ঞF^FRnyiTT∗j
পার্সেন্টাইল বুটস্ট্র্যাপ সিআই গুলিতে এমিরিকাল / বেসিক বনাম
এমিরিকালিক / বেসিক বুটস্ট্র্যাপ দ্বারা বর্ণিত জনগোষ্ঠীর মধ্যে বন্টন অনুমান করার জন্য থেকে বুটস্ট্র্যাপ নমুনাগুলির মধ্যে বিতরণ ব্যবহার করে। এর সিআই অনুমানগুলি এইভাবে বিতরণের উপর ভিত্তি করে তৈরি করা হয় , যেখানে মূল নমুনায় স্ট্যাটিস্টিকের মান।আর এফ ( টি - θ ) এফ ( টি * - টি ) টি(T∗−t)RF^(T−θ)F(T∗−t)t
এই পদ্ধতির বুটস্ট্র্যাপিংয়ের মূল নীতির উপর ভিত্তি করে ( রেফারি 3 ):
নমুনাটি বুটস্ট্র্যাপের নমুনাগুলির হিসাবে জনসংখ্যার নমুনায়।
পারসেন্টাইল বুটস্ট্র্যাপ পরিবর্তে সিআই নির্ধারণ করতে মানগুলির কোয়ান্টাইলগুলি ব্যবহার করে। বিতরণে স্কিউ বা পক্ষপাত থাকলে এই অনুমানগুলি বেশ আলাদা হতে পারে । ( টি - θ )T∗j(T−θ)
বলুন একটি পর্যবেক্ষিত পক্ষপাত নেই যেমন যে:
ˉ টি ∗ = টি + বি ,B
T¯∗=t+B,
যেখানে এর গড় । সংক্ষিপ্ততার জন্য, বলুন যে এর 5 ম এবং 95 তম পার্সেন্টাইলগুলি এবং হিসাবে প্রকাশ করা হয় , যেখানে বুটস্ট্র্যাপের নমুনাগুলির চেয়ে বেশি এবং স্কু করার অনুমতি দেওয়ার জন্য প্রতিটি ইতিবাচক এবং সম্ভাব্য ভিন্ন। ৫ ম এবং 95 তম সিআই পারসেন্টাইল-ভিত্তিক অনুমানগুলি যথাক্রমে যথাক্রমে দেওয়া হবে:টি ∗ জে টি ∗ জে ˉ টি ∗-δ1 ˉ টি ∗+δ2 ˉ টি ∗δ1,δ2T¯∗T∗jT∗jT¯∗−δ1T¯∗+δ2T¯∗δ1,δ2
T¯∗−δ1=t+B−δ1;T¯∗+δ2=t+B+δ2.
অভিজ্ঞতা / বেসিক বুটস্ট্র্যাপ পদ্ধতি অনুসারে 5 ম এবং 95 তম পার্সেন্টাইল সিআই অনুমান যথাক্রমে হবে ( রেফার্ট। 1 , একা। 5.6, পৃষ্ঠা 194):
2t−(T¯∗+δ2) =t−B−δ2; 2 টি−(T¯∗−δ1) = টি - বি+δ1।
সুতরাং পারসেন্টাইল ভিত্তিক সিআই উভয় পক্ষপাতদুষ্ট ভুল পেয়ে যায় এবং দ্বিগুণ পক্ষপাতযুক্ত কেন্দ্রের আশেপাশের আত্মবিশ্বাসের সীমাবদ্ধতার সম্ভাব্য অসামান্য অবস্থানের দিকগুলি সরিয়ে দেয় । এই ক্ষেত্রে বুটস্ট্র্যাপিং থেকে পারসেন্টাইল সিআইগুলি বিতরণের প্রতিনিধিত্ব করে না ।(T−θ)
এই আচরণটি এই পৃষ্ঠায় খুব সুন্দরভাবে চিত্রিত করা হয়েছে , এমন কোনও নেতিবাচক পক্ষপাতদুষ্ট কোনও বুটস্ট্র্যাপিংয়ের জন্য যে মূল নমুনা অনুমানটি অনুভূমিক / বেসিক পদ্ধতির ভিত্তিতে 95% সিআই এর নীচে থাকে (যার মধ্যে সরাসরি উপযুক্ত পক্ষপাত সংশোধন অন্তর্ভুক্ত থাকে)। দ্বিগুণ-নেতিবাচক পক্ষপাতদুষ্ট কেন্দ্রের চারপাশে সাজানো পারসেন্টাইল পদ্ধতির ভিত্তিতে 95% সিআই প্রকৃত নমুনা থেকে নেতিবাচক পক্ষপাতদুষ্ট বিন্দু অনুমানের উভয়ই নীচে !
শতকরা বুটস্ট্র্যাপ কখনও ব্যবহার করা উচিত নয়?
এটি আপনার দৃষ্টিকোণের উপর নির্ভর করে একটি বাড়াবাড়ি বা একটি স্বল্পমূল্য হতে পারে। আপনি যদি ন্যূনতম পক্ষপাতিত্ব এবং স্কিউ ডকুমেন্ট করতে পারেন, উদাহরণস্বরূপ হিস্টোগ্রাম বা ঘনত্বের প্লটগুলির সাথে বিতরণটি কল্পনা করে , পার্সেন্টাইল বুটস্ট্র্যাপটি অবশ্যই অভিজ্ঞতা / বেসিক সিআই হিসাবে একই সিআই সরবরাহ করতে হবে। এগুলি সম্ভবত সিআই-এর সাধারণ আনুমানিকতার চেয়ে উভয়ই ভাল।(T∗−t)
উভয়ই পন্থা কভারেজের যথার্থতা সরবরাহ করে না যা অন্যান্য বুটস্ট্র্যাপ পদ্ধতির দ্বারা সরবরাহ করা যেতে পারে। ইফ্রন শুরু থেকেই পারসেন্টাইল সিআইয়ের সম্ভাব্য সীমাবদ্ধতাগুলি স্বীকৃতি দিয়েছিল তবে বলেছিল: "বেশিরভাগ ক্ষেত্রে আমরা উদাহরণের সাফল্যের বিভিন্ন ডিগ্রি নিজেদের পক্ষে কথা বলতে দিতে সন্তুষ্ট থাকব।" ( রেফারি 2 , পৃষ্ঠা 3)
পরবর্তী কাজ, উদাহরণস্বরূপ ডিকিসিও এবং ইফ্রন (রেফারি 4 ) দ্বারা সংক্ষিপ্তসারিত পদ্ধতিগুলির দ্বারা উন্নত পদ্ধতিগুলি তৈরি করা হয়েছে যা " অনুমিতিক / মৌলিক বা পার্সেন্টাইল পদ্ধতির দ্বারা সরবরাহিত" স্ট্যান্ডার্ড ইন্টারভালের যথার্থতার উপর নির্ভর করে "উন্নতি করে"। সুতরাং আপনি যদি অন্তরগুলির যথার্থতার বিষয়ে চিন্তা করেন তবে অনুভূতিক / মৌলিক বা শতকরা পদ্ধতিগুলি ব্যবহার করা উচিত নয় এমন যুক্তি হতে পারে।
চরম ক্ষেত্রে, উদাহরণস্বরূপ কোনও রূপান্তর ছাড়াই লগনরমাল বিতরণ থেকে সরাসরি নমুনা তৈরি করা, কোনও বুটস্ট্র্যাপযুক্ত সিআই অনুমান নির্ভরযোগ্য হতে পারে না, যেমন ফ্র্যাঙ্ক হ্যারেল উল্লেখ করেছেন ।
এগুলি এবং অন্যান্য বুটস্ট্র্যাপযুক্ত সিআই-এর নির্ভরযোগ্যতা কী সীমাবদ্ধ?
বেশ কয়েকটি ইস্যু বুটস্ট্র্যাপযুক্ত সিআই-কে অবিশ্বাস্য করে তুলতে পারে। কিছু সমস্ত পদ্ধতির ক্ষেত্রে প্রযোজ্য, অন্যদের অনুশীলনামূলক / মৌলিক বা শতকরা পদ্ধতি ছাড়া অন্য পদ্ধতির দ্বারা উপশম হতে পারে।
প্রথম, সাধারণ, ইস্যুটি হ'ল অভিজ্ঞতামূলক বিতরণ জনসংখ্যা বন্টন উপস্থাপন করে । যদি এটি না হয় তবে কোনও বুটস্ট্র্যাপিং পদ্ধতি নির্ভরযোগ্য হবে না। বিশেষত, কোনও বিতরণের চূড়ান্ত মানগুলির কাছাকাছি যে কোনও কিছু নির্ধারণ করতে বুটস্ট্র্যাপিং অবিশ্বাস্য হতে পারে। এই সমস্যাটি এই সাইটে অন্যত্র আলোচনা করা হয়েছে, উদাহরণস্বরূপ এখানে এবং এখানে । কোনও নির্দিষ্ট নমুনার জন্য এর লেজগুলিতে পাওয়া যায় এমন কয়েকটি, বিচ্ছিন্ন, মানগুলি একটি অবিচ্ছিন্ন খুব ভালভাবে উপস্থাপন করতে পারে না । একটি চূড়ান্ত তবে উদাহরণস্বরূপ ইউনিফর্ম থেকে এলোমেলো নমুনার সর্বাধিক অর্ডার পরিসংখ্যান অনুমান করতে বুটস্ট্র্যাপিং ব্যবহার করার চেষ্টা করছে এফ এফ এফF^FF^FU[0,θ]বিতরণ হিসাবে এখানে সুন্দরভাবে ব্যাখ্যা করা হয়েছে । মনে রাখবেন যে 95% বা 99% সিআই বুটস্ট্র্যাপযুক্ত তারা নিজেরাই কোনও বিতরণের লেজ রয়েছে এবং এইভাবে বিশেষত ছোট নমুনা আকারের সাথে এ জাতীয় সমস্যা থেকে ভুগতে পারে।
দ্বিতীয়ত, কোনও আশ্বাস নেই যে থেকে যে পরিমাণের নমুনা নেওয়া হয় তা থেকে নমুনা দেওয়ার মতোই বিতরণ করবে । তবুও এই ধারণাটি বুটস্ট্র্যাপিংয়ের মৌলিক নীতির অন্তর্গত। সেই পছন্দসই সম্পত্তি সহ পরিমাণকে প্রধান বলা হয় । অ্যাডামো যেমন ব্যাখ্যা করেছেন : এফF^F
এর অর্থ হ'ল যদি অন্তর্নিহিত প্যারামিটারটি পরিবর্তন হয় তবে বিতরণের আকারটি কেবল ধ্রুবক দ্বারা স্থানান্তরিত হয় এবং স্কেল অগত্যা পরিবর্তন হয় না। এটি একটি দৃ ass় ধারণা!
উদাহরণস্বরূপ, যদি সেখানে পক্ষপাত এটা থেকে যে স্যাম্পলিং জেনে রাখা গুরুত্বপূর্ণ প্রায় থেকে স্যাম্পলিং হিসাবে একই প্রায় । এবং ননপ্যারমেট্রিক স্যাম্পলিংয়ে এটি একটি বিশেষ সমস্যা; রেফারেন্স হিসাবে 1 এটি 33 পৃষ্ঠায় রাখে:θ এফ টিFθF^t
ননপ্রেমেট্রিক সমস্যায় পরিস্থিতি আরও জটিল is এটি এখন অসম্ভব (তবে কঠোরভাবে অসম্ভব নয়) যে কোনও পরিমাণ হুবহু অবিচ্ছিন্ন হতে পারে।
সুতরাং সাধারণত যেটি সম্ভব সর্বোত্তম তা হল একটি আনুমানিক। তবে এই সমস্যাটি প্রায়শই পর্যাপ্তভাবে সমাধান করা যায়। নমুনাযুক্ত পরিমাণটি কতটা নিকটবর্তী তা অনুমান করা সম্ভব, উদাহরণস্বরূপ ক্যান্টি এট আল দ্বারা প্রস্তাবিত পিভট প্লটগুলির সাথে । এই প্রদর্শন করতে পারেন কিভাবে স্থানে বুট-স্ট্র্যাপ অনুমান ডিস্ট্রিবিউশন সঙ্গে পরিবর্তিত হতে , বা কত ভাল একটি রূপান্তর পরিমান প্রদান করে যে কেঁদ্রগত হয়। উন্নত বুটস্ট্র্যাপযুক্ত সিআই-র পদ্ধতিগুলি এমন একটি রূপান্তর করার চেষ্টা করতে পারে যে রূপান্তরিত স্কেলে সিআই অনুমানের জন্য মূলের নিকটে, তারপরে মূল স্কেলে ফিরে যেতে পারে।টি জ ( জ ( টি * ) - জ ( T ) ) জ ( জ ( টি * ) - জ ( T ) )(T∗−t)th(h(T∗)−h(t))h(h(T∗)−h(t))
boot.ci()
ফাংশন বুটস্ট্র্যাপ studentized প্রদান করে সিআইএস (যাকে বলা হয় "bootstrap- টি " দ্বারা DiCiccio এবং এফরন ) এবং সিআইএস (পক্ষপাত সংশোধন এবং ত্বরিত, যেখানে স্কিউ সঙ্গে "ত্বরণ" পুলিশ) যে হল "দ্বিতীয়-অর্ডার সঠিক" যে এর মধ্যে পার্থক্য পছন্দসই এবং অর্জিত কভারেজ (উদাহরণস্বরূপ, 95% সিআই) order এর ক্রমানুসারে , কেবল প্রথম-অর্ডার যথার্থ ( of of এর ক্রম ) বোধগম্য / মৌলিক এবং পার্সেন্টাইল পদ্ধতির জন্য ( রেফ 1 , পিপি 212-3; রেফারি 4 )। এই পদ্ধতিগুলির জন্য, প্রতিটি টি- the স্বতন্ত্র মানগুলি নয়, বুটস্ট্র্যাপযুক্ত প্রতিটি নমুনার মধ্যেই α n - 1 এন - 0.5 টি ∗ জেBCaαn−1n−0.5T∗j এই সহজ পদ্ধতি দ্বারা ব্যবহৃত।
চরম ক্ষেত্রে, আত্মবিশ্বাসের অন্তরগুলির পর্যাপ্ত সামঞ্জস্যতা সরবরাহ করতে নিজেরাই বুটস্ট্র্যাপযুক্ত নমুনাগুলির মধ্যে বুটস্ট্র্যাপিংয়ের আশ্রয় নিতে পারে। এই "ডাবল বুটস্ট্র্যাপ" রেফার 5.5 সেকশনে বর্ণিত হয়েছে । 1 , সেই বইয়ের অন্যান্য অধ্যায়গুলির সাথে এর চূড়ান্ত গণনার চাহিদা হ্রাস করার উপায়গুলি বোঝায়।
ডেভিসন, এসি এবং হিঙ্কলি, ডিভি বুটস্ট্র্যাপ পদ্ধতি এবং তাদের অ্যাপ্লিকেশন, কেমব্রিজ বিশ্ববিদ্যালয় প্রেস, 1997 ।
ইফ্রন, বি। বুটস্ট্র্যাপ পদ্ধতি: জ্যাকনিফের আরেকটি চেহারা, আন। পরিসংখ্যানবিৎ। 7: 1-26, 1979 ।
ফক্স, জে এবং ওয়েইসবার্গ, এস। এর বুটস্ট্র্যাপিং রিগ্রেশন মডেলগুলি। একটি অ্যাপেন্ডিক্স টু আন আর কম্পিয়ন টু অ্যাপ্লাইড রিগ্রেশন, দ্বিতীয় সংস্করণ (সেজ, ২০১১)। 10 অক্টোবর 2017 হিসাবে সংশোধন ।
ডিকিসিও, টিজে এবং ইফ্রন, বি বুটস্ট্র্যাপের আত্মবিশ্বাসের বিরতি। তাত্ক্ষণিকবাজার। সী। 11: 189-228, 1996 ।
ক্যান্টি, এজে, ডেভিসন, এসি, হিঙ্কলি, ডিভি, এবং ভেন্টুরা, ভি। বুটস্ট্র্যাপ ডায়াগনস্টিকস এবং প্রতিকার। করতে পারেনা। জে স্ট্যাটাস 34: 5-27, 2006 ।