এটি কি সত্য যে পারসেন্টাইল বুটস্ট্র্যাপ কখনও ব্যবহার করা উচিত নয়?


31

এমআইটি ওপেনকোর্স ওয়্যার নোটগুলিতে 18.05 এর জন্য সম্ভাবনা এবং পরিসংখ্যানের পরিচিতি, স্প্রিং 2014 (বর্তমানে এখানে উপলভ্য ) রয়েছে:

বুটস্ট্র্যাপ পারসেন্টাইল পদ্ধতিটি তার সরলতার কারণে আবেদন করছে। তবে এটি এর বুটস্ট্র্যাপ বন্টন উপর নির্ভর করে একটি উপর ভিত্তি করে বিশেষ নমুনা সত্য বন্টন করার জন্য একটি ভাল পড়তা হচ্ছে । ভাত পারসেন্টাইল পদ্ধতি সম্পর্কে বলেছেন, "যদিও আত্মবিশ্বাস সীমা সহ বুটস্ট্র্যাপের নমুনা বিতরণের কোয়ান্টাইলের সরাসরি সমীকরণটি প্রাথমিকভাবে আপত্তিজনক বলে মনে হতে পারে, তবে এর যুক্তি কিছুটা অস্পষ্ট is" [২] সংক্ষেপে, বুটস্ট্র্যাপ পারসেন্টাইল পদ্ধতিটি ব্যবহার করবেন না । পরিবর্তে এমিরিকাল বুটস্ট্র্যাপ ব্যবহার করুন (আমরা উভয়কে আশাবাদে ব্যাখ্যা করেছি যে আপনি পারসেন্টাইল বুটস্ট্র্যাপের জন্য বুদ্ধিদীপ্ত বুটস্ট্র্যাপ গুলিয়ে ফেলবেন না)।x¯*এক্স¯

[২] জন রাইস, গাণিতিক পরিসংখ্যান এবং ডেটা বিশ্লেষণ , ২ য় সংস্করণ, পৃষ্ঠা। 272

অনলাইনে অনুসন্ধানের পরে, আমি একমাত্র উদ্ধৃতিটি খুঁজে পেয়েছি যা পুরোপুরি জানিয়েছে যে পারসেন্টাইল বুটস্ট্র্যাপ ব্যবহার করা উচিত নয়।

ক্লার্ক এট আল-র দ্বারা ডেটা মাইনিং এবং মেশিন লার্নিংয়ের পাঠ্য নীতি ও থিয়োরি থেকে আমি যা পড়ছি তা প্রত্যাহার করছি । বুটস্ট্র্যাপিংয়ের মূল সমর্থনযোগ্যতা হ'ল যেখানে হল অভিজ্ঞতামূলক সিডিএফ। (আমি এর বাইরে বিস্তারিত মনে করি না don't) এফ এন

1এনΣআমি=1এনএফ^এন(এক্স)পিএফ(এক্স)
এফ^এন

এটি কি সত্য যে পারসেন্টাইল বুটস্ট্র্যাপ পদ্ধতি ব্যবহার করা উচিত নয়? যদি তা হয় তবে প্রয়োজনীয়ভাবে জানা না গেলে কী বিকল্প রয়েছে (যেমন, প্যারামেট্রিক বুটস্ট্র্যাপ করার জন্য পর্যাপ্ত তথ্য পাওয়া যায় না)?এফ


হালনাগাদ

যেহেতু স্পষ্টির জন্য অনুরোধ করা হয়েছে, এই এমআইটি নোটগুলি থেকে "এম্পিরিকাল বুটস্ট্র্যাপ" নীচের পদ্ধতিটিকে বোঝায়: তারা এবং সহ এর বুটস্ট্র্যাপড অনুমান এবং এর পূর্ণ নমুনা হিসাব , এবং তার ফলে আনুমানিক আস্থা ব্যবধান হবে । δ 2 = ( θ * - θ ) 1 - α / 2 θ * θ θ θ [ θ - δ 2 , θ - δ 1 ]δ1=(θ^*-θ^)α/2δ2=(θ^*-θ^)1-α/2θ^θθ^θ[θ^δ2,θ^δ1]

সংক্ষেপে, মূল ধারণাটি হ'ল: ইমিরিকাল বুটস্ট্র্যাপিং বিন্দু অনুমান এবং প্রকৃত প্যারামিটারের মধ্যে পার্থক্যের পরিমাণের পরিমাণ অনুমান করে, ie এবং নিম্ন এবং এই পার্থক্যটি ব্যবহার করে ব্যবহার করে উপরের সিআই সীমানাθ^θ

"পার্সেন্টাইল বুটস্ট্র্যাপ" নিম্নলিখিত বিষয়গুলি বোঝায়: আত্মবিশ্বাসের ব্যবধান হিসাবে জন্য । এই পরিস্থিতিতে, আমরা আগ্রহের প্যারামিটারের অনুমানগুলি গণনা করতে এবং আস্থার ব্যবধানের জন্য এই অনুমানের শতকরা অংশ নিতে বুটস্ট্র্যাপিং ব্যবহার করি।θ[θ^α/2,θ^1α/2]θ


2
আমি আপনার আপডেটটি ভারীভাবে সম্পাদনা করেছি। দয়া করে পরীক্ষা করে দেখুন যে আমার সম্পাদনাটি অর্থবোধ করে। ইফ্রনের বই থেকে আপনার উদ্ধৃতিগুলি বিভ্রান্তিকর ছিল কারণ ইফ্রন যা বর্ণনা করেছেন তা আপনার এমআইটি নোটকে "এম্পিরিকাল বুটস্ট্র্যাপ" বলে যা তার সাথে মিলে না। সুতরাং আমি এমআইটি নোটগুলি কী করে তার বিবরণটি রেখে দিয়েছি। বিটিডাব্লু, আমি তাদের "ইমিরিকাল বুটস্ট্র্যাপ" এর বর্ণনায় একটি বিষয় সম্পর্কে বিভ্রান্ত হয়েছি: page পৃষ্ঠার একেবারে শীর্ষে এটি বলেছে "যেহেতু 90 তম পার্সেন্টাইলের দিকে ..." - আমি ডোন না এটা বুঝতে পারি না। উদাহরণ থেকে এটি পরিষ্কার যে সিআইয়ের বাম দিকটি 90 তম পার্সেন্টাইল, অর্থাৎ আপনার বিয়োগ করে দেওয়া হয় । δ 2δ.1δ2
অ্যামিবা

2
@ অ্যামিবা আপনার সম্পাদনাগুলি সঠিক। সর্বত্র সাহায্য করার জন্য ধন্যবাদ। আমি মনে করি এমআইটি নোট নিয়ে কিছু সমস্যা আছে; পারসেন্টাইল বুটস্ট্র্যাপগুলির সাথে তাদের সমস্যার বর্ণনা খুব পরিষ্কার ছিল না এবং তাদের বিরুদ্ধে তাদের যুক্তি প্রধানত কর্তৃত্বের কাছে আবেদন। পারসেন্টাইল বুটস্ট্র্যাপের বিপরীতে আমি তাদের শেষ সংখ্যাটির উদাহরণ পুনরুত্পাদন করতে পারিনি। আমরা এই দরকারী প্রশ্নটি সম্বোধন করার সময় তারা কিছু বিশদ দিয়ে কাজ করেছি বলে মনে করবেন না এবং এভাবে আপনি উল্লেখ করার সাথে তাদের পাঠ্যে কিছু ঘাটতি থাকতে পারে।
এডিএম

এই এমআইটি নোটটি দেখে, আমি দেখতে পাচ্ছি না যে লেখকরা কীভাবে [৩ 37.৪, ৪২.৪] এর "বুটস্ট্র্যাপ পারসেন্টাইল পদ্ধতি (ব্যবহার করা উচিত নয়)" বিভাগ 9 এর আস্থার অন্তর পেয়েছিলেন। দেখে মনে হচ্ছে যে তারা যে নমুনাটি ব্যবহার করছেন তা section নং বিভাগের মতো নয়, যার সাথে তারা তুলনা করছেন। যদি আমরা পৃষ্ঠার 5 পৃষ্ঠার নীচে reported for = x ∗ - এক্স এর জন্য নমুনা গ্রহণ করি এবং 40.3.3 এর নমুনাটির গড়টি যোগ করি এবং সিআই গ্রহণ করি তবে আমি প্রাপ্ত সীমাটি [38.9, 41.9] যার সমান প্রস্থ রয়েছে 3 সীমা হিসাবে তারা [38.7, 41.7] এর 6 ধারায় রিপোর্ট করেছে।
হতবুদ্ধি

উত্তর:


21

কিছু সমস্যার যে আস্থা অন্তর সব nonparametric বুটস্ট্র্যাপিং অনুমান (ci), কিছু উভয় নিয়ে একটি সমস্যা আরো হয় সাধারণ আছে "গবেষণামূলক" (বলা "প্রাথমিক" এ boot.ci()আর এর ফাংশন bootপ্যাকেজ এবং সূত্র। 1 ) এবং "পারসেন্টাইল" সিআই অনুমান (যেমন রেফ। ২ তে বর্ণিত হয়েছে ), এবং কিছু কিছু শতাংশ যে পারসেন্টাইল সিআই দ্বারা বর্ধিত হতে পারে।

টিএল; ডিআর : কিছু ক্ষেত্রে পারসেন্টাইল বুটস্ট্র্যাপ সিআই অনুমান পর্যাপ্ত পরিমাণে কাজ করতে পারে তবে কিছু অনুমান যদি ধরে না রাখে তবে পরেরটি সবচেয়ে বেশি অভিজ্ঞতামূলক / বুনিয়াদি বুটস্ট্র্যাপের সাথে পারসেন্টাইল সিআই সবচেয়ে খারাপ পছন্দ হতে পারে। অন্যান্য বুটস্ট্র্যাপ সিআই অনুমান আরও কভারেজ সহ আরও নির্ভরযোগ্য হতে পারে। সব সমস্যা হতে পারে। ডায়াগনস্টিক প্লটগুলি বরাবরের মতো সন্ধান করা কেবলমাত্র একটি সফ্টওয়্যার রুটিনের আউটপুট স্বীকার করে নেওয়া সম্ভাব্য ত্রুটিগুলি এড়াতে সহায়তা করে।

বুটস্ট্র্যাপ সেটআপ

সাধারণত রেফারির পরিভাষা এবং যুক্তি অনুসরণ করে । 1 , আমাদের কাছে ডেটা এর একটি নমুনা রয়েছে যা স্বতন্ত্র এবং অভিন্নভাবে বিতরণ করা এলোমেলো ভেরিয়েবল একটি বন্টন ক্রিয়াকলাপ ভাগ করে নিচ্ছে । গবেষণামূলক বিতরণের ফাংশনটি (EDF) ডেটা নমুনা থেকে নির্মাণ করা হয় । আমরা একটি চরিত্রগত আগ্রহী জনসংখ্যার একটি পরিসংখ্যাত দ্বারা আনুমানিক নমুনা যার মান । আমরা জানতে কতটা ভাল অনুমান করে উদাহরণস্বরূপ, বিতরণ ।ওয়াই আমি এফ এফ θ টি টি টি θ ( টি - θ )y1,...,ynYiFF^θTtTθ(Tθ)

Nonparametric বুটস্ট্র্যাপ EDF থেকে স্যাম্পলিং ব্যবহারসমূহ থেকে অনুকরণমূলক স্যাম্পলিং করার , গ্রহণ আকার প্রতিটি নমুনা থেকে প্রতিস্থাপন সঙ্গে । বুটস্ট্র্যাপ নমুনাগুলি থেকে গণনা করা মানগুলি "*" দিয়ে চিহ্নিত করা হয়। উদাহরণস্বরূপ, বুটস্ট্র্যাপ নমুনা জে গণনা করা স্ট্যাটিস্টিক একটি মান । এফআরএনওয়াইআমিটিটি * F^FRnyiTTj

পার্সেন্টাইল বুটস্ট্র্যাপ সিআই গুলিতে এমিরিকাল / বেসিক বনাম

এমিরিকালিক / বেসিক বুটস্ট্র্যাপ দ্বারা বর্ণিত জনগোষ্ঠীর মধ্যে বন্টন অনুমান করার জন্য থেকে বুটস্ট্র্যাপ নমুনাগুলির মধ্যে বিতরণ ব্যবহার করে। এর সিআই অনুমানগুলি এইভাবে বিতরণের উপর ভিত্তি করে তৈরি করা হয় , যেখানে মূল নমুনায় স্ট্যাটিস্টিকের মান।আর এফ ( টি - θ ) এফ ( টি * - টি ) টি(Tt)RF^(Tθ)F(Tt)t

এই পদ্ধতির বুটস্ট্র্যাপিংয়ের মূল নীতির উপর ভিত্তি করে ( রেফারি 3 ):

নমুনাটি বুটস্ট্র্যাপের নমুনাগুলির হিসাবে জনসংখ্যার নমুনায়।

পারসেন্টাইল বুটস্ট্র্যাপ পরিবর্তে সিআই নির্ধারণ করতে মানগুলির কোয়ান্টাইলগুলি ব্যবহার করে। বিতরণে স্কিউ বা পক্ষপাত থাকলে এই অনুমানগুলি বেশ আলাদা হতে পারে । ( টি - θ )Tj(Tθ)

বলুন একটি পর্যবেক্ষিত পক্ষপাত নেই যেমন যে: ˉ টি = টি + বি ,B

T¯=t+B,

যেখানে এর গড় । সংক্ষিপ্ততার জন্য, বলুন যে এর 5 ম এবং 95 তম পার্সেন্টাইলগুলি এবং হিসাবে প্রকাশ করা হয় , যেখানে বুটস্ট্র্যাপের নমুনাগুলির চেয়ে বেশি এবং স্কু করার অনুমতি দেওয়ার জন্য প্রতিটি ইতিবাচক এবং সম্ভাব্য ভিন্ন। ৫ ম এবং 95 তম সিআই পারসেন্টাইল-ভিত্তিক অনুমানগুলি যথাক্রমে যথাক্রমে দেওয়া হবে:টিজে টিজে ˉ টি-δ1 ˉ টি+δ2 ˉ টিδ1,δ2T¯TjTjT¯δ1T¯+δ2T¯δ1,δ2

T¯δ1=t+Bδ1;T¯+δ2=t+B+δ2.

অভিজ্ঞতা / বেসিক বুটস্ট্র্যাপ পদ্ধতি অনুসারে 5 ম এবং 95 তম পার্সেন্টাইল সিআই অনুমান যথাক্রমে হবে ( রেফার্ট। 1 , একা। 5.6, পৃষ্ঠা 194):

2t(T¯*+ +δ2)=টি-বি-δ2;2টি-(টি¯*-δ1)=টি-বি+ +δ1

সুতরাং পারসেন্টাইল ভিত্তিক সিআই উভয় পক্ষপাতদুষ্ট ভুল পেয়ে যায় এবং দ্বিগুণ পক্ষপাতযুক্ত কেন্দ্রের আশেপাশের আত্মবিশ্বাসের সীমাবদ্ধতার সম্ভাব্য অসামান্য অবস্থানের দিকগুলি সরিয়ে দেয় । এই ক্ষেত্রে বুটস্ট্র্যাপিং থেকে পারসেন্টাইল সিআইগুলি বিতরণের প্রতিনিধিত্ব করে না ।(Tθ)

এই আচরণটি এই পৃষ্ঠায় খুব সুন্দরভাবে চিত্রিত করা হয়েছে , এমন কোনও নেতিবাচক পক্ষপাতদুষ্ট কোনও বুটস্ট্র্যাপিংয়ের জন্য যে মূল নমুনা অনুমানটি অনুভূমিক / বেসিক পদ্ধতির ভিত্তিতে 95% সিআই এর নীচে থাকে (যার মধ্যে সরাসরি উপযুক্ত পক্ষপাত সংশোধন অন্তর্ভুক্ত থাকে)। দ্বিগুণ-নেতিবাচক পক্ষপাতদুষ্ট কেন্দ্রের চারপাশে সাজানো পারসেন্টাইল পদ্ধতির ভিত্তিতে 95% সিআই প্রকৃত নমুনা থেকে নেতিবাচক পক্ষপাতদুষ্ট বিন্দু অনুমানের উভয়ই নীচে !

শতকরা বুটস্ট্র্যাপ কখনও ব্যবহার করা উচিত নয়?

এটি আপনার দৃষ্টিকোণের উপর নির্ভর করে একটি বাড়াবাড়ি বা একটি স্বল্পমূল্য হতে পারে। আপনি যদি ন্যূনতম পক্ষপাতিত্ব এবং স্কিউ ডকুমেন্ট করতে পারেন, উদাহরণস্বরূপ হিস্টোগ্রাম বা ঘনত্বের প্লটগুলির সাথে বিতরণটি কল্পনা করে , পার্সেন্টাইল বুটস্ট্র্যাপটি অবশ্যই অভিজ্ঞতা / বেসিক সিআই হিসাবে একই সিআই সরবরাহ করতে হবে। এগুলি সম্ভবত সিআই-এর সাধারণ আনুমানিকতার চেয়ে উভয়ই ভাল।(Tt)

উভয়ই পন্থা কভারেজের যথার্থতা সরবরাহ করে না যা অন্যান্য বুটস্ট্র্যাপ পদ্ধতির দ্বারা সরবরাহ করা যেতে পারে। ইফ্রন শুরু থেকেই পারসেন্টাইল সিআইয়ের সম্ভাব্য সীমাবদ্ধতাগুলি স্বীকৃতি দিয়েছিল তবে বলেছিল: "বেশিরভাগ ক্ষেত্রে আমরা উদাহরণের সাফল্যের বিভিন্ন ডিগ্রি নিজেদের পক্ষে কথা বলতে দিতে সন্তুষ্ট থাকব।" ( রেফারি 2 , পৃষ্ঠা 3)

পরবর্তী কাজ, উদাহরণস্বরূপ ডিকিসিও এবং ইফ্রন (রেফারি 4 ) দ্বারা সংক্ষিপ্তসারিত পদ্ধতিগুলির দ্বারা উন্নত পদ্ধতিগুলি তৈরি করা হয়েছে যা " অনুমিতিক / মৌলিক বা পার্সেন্টাইল পদ্ধতির দ্বারা সরবরাহিত" স্ট্যান্ডার্ড ইন্টারভালের যথার্থতার উপর নির্ভর করে "উন্নতি করে"। সুতরাং আপনি যদি অন্তরগুলির যথার্থতার বিষয়ে চিন্তা করেন তবে অনুভূতিক / মৌলিক বা শতকরা পদ্ধতিগুলি ব্যবহার করা উচিত নয় এমন যুক্তি হতে পারে।

চরম ক্ষেত্রে, উদাহরণস্বরূপ কোনও রূপান্তর ছাড়াই লগনরমাল বিতরণ থেকে সরাসরি নমুনা তৈরি করা, কোনও বুটস্ট্র্যাপযুক্ত সিআই অনুমান নির্ভরযোগ্য হতে পারে না, যেমন ফ্র্যাঙ্ক হ্যারেল উল্লেখ করেছেন

এগুলি এবং অন্যান্য বুটস্ট্র্যাপযুক্ত সিআই-এর নির্ভরযোগ্যতা কী সীমাবদ্ধ?

বেশ কয়েকটি ইস্যু বুটস্ট্র্যাপযুক্ত সিআই-কে অবিশ্বাস্য করে তুলতে পারে। কিছু সমস্ত পদ্ধতির ক্ষেত্রে প্রযোজ্য, অন্যদের অনুশীলনামূলক / মৌলিক বা শতকরা পদ্ধতি ছাড়া অন্য পদ্ধতির দ্বারা উপশম হতে পারে।

প্রথম, সাধারণ, ইস্যুটি হ'ল অভিজ্ঞতামূলক বিতরণ জনসংখ্যা বন্টন উপস্থাপন করে । যদি এটি না হয় তবে কোনও বুটস্ট্র্যাপিং পদ্ধতি নির্ভরযোগ্য হবে না। বিশেষত, কোনও বিতরণের চূড়ান্ত মানগুলির কাছাকাছি যে কোনও কিছু নির্ধারণ করতে বুটস্ট্র্যাপিং অবিশ্বাস্য হতে পারে। এই সমস্যাটি এই সাইটে অন্যত্র আলোচনা করা হয়েছে, উদাহরণস্বরূপ এখানে এবং এখানে । কোনও নির্দিষ্ট নমুনার জন্য এর লেজগুলিতে পাওয়া যায় এমন কয়েকটি, বিচ্ছিন্ন, মানগুলি একটি অবিচ্ছিন্ন খুব ভালভাবে উপস্থাপন করতে পারে না । একটি চূড়ান্ত তবে উদাহরণস্বরূপ ইউনিফর্ম থেকে এলোমেলো নমুনার সর্বাধিক অর্ডার পরিসংখ্যান অনুমান করতে বুটস্ট্র্যাপিং ব্যবহার করার চেষ্টা করছে এফ এফ এফF^FF^FU[0,θ]বিতরণ হিসাবে এখানে সুন্দরভাবে ব্যাখ্যা করা হয়েছে । মনে রাখবেন যে 95% বা 99% সিআই বুটস্ট্র্যাপযুক্ত তারা নিজেরাই কোনও বিতরণের লেজ রয়েছে এবং এইভাবে বিশেষত ছোট নমুনা আকারের সাথে এ জাতীয় সমস্যা থেকে ভুগতে পারে।

দ্বিতীয়ত, কোনও আশ্বাস নেই যে থেকে যে পরিমাণের নমুনা নেওয়া হয় তা থেকে নমুনা দেওয়ার মতোই বিতরণ করবে । তবুও এই ধারণাটি বুটস্ট্র্যাপিংয়ের মৌলিক নীতির অন্তর্গত। সেই পছন্দসই সম্পত্তি সহ পরিমাণকে প্রধান বলা হয় । অ্যাডামো যেমন ব্যাখ্যা করেছেন : এফF^F

এর অর্থ হ'ল যদি অন্তর্নিহিত প্যারামিটারটি পরিবর্তন হয় তবে বিতরণের আকারটি কেবল ধ্রুবক দ্বারা স্থানান্তরিত হয় এবং স্কেল অগত্যা পরিবর্তন হয় না। এটি একটি দৃ ass় ধারণা!

উদাহরণস্বরূপ, যদি সেখানে পক্ষপাত এটা থেকে যে স্যাম্পলিং জেনে রাখা গুরুত্বপূর্ণ প্রায় থেকে স্যাম্পলিং হিসাবে একই প্রায় । এবং ননপ্যারমেট্রিক স্যাম্পলিংয়ে এটি একটি বিশেষ সমস্যা; রেফারেন্স হিসাবে 1 এটি 33 পৃষ্ঠায় রাখে:θ এফ টিFθF^t

ননপ্রেমেট্রিক সমস্যায় পরিস্থিতি আরও জটিল is এটি এখন অসম্ভব (তবে কঠোরভাবে অসম্ভব নয়) যে কোনও পরিমাণ হুবহু অবিচ্ছিন্ন হতে পারে।

সুতরাং সাধারণত যেটি সম্ভব সর্বোত্তম তা হল একটি আনুমানিক। তবে এই সমস্যাটি প্রায়শই পর্যাপ্তভাবে সমাধান করা যায়। নমুনাযুক্ত পরিমাণটি কতটা নিকটবর্তী তা অনুমান করা সম্ভব, উদাহরণস্বরূপ ক্যান্টি এট আল দ্বারা প্রস্তাবিত পিভট প্লটগুলির সাথে । এই প্রদর্শন করতে পারেন কিভাবে স্থানে বুট-স্ট্র্যাপ অনুমান ডিস্ট্রিবিউশন সঙ্গে পরিবর্তিত হতে , বা কত ভাল একটি রূপান্তর পরিমান প্রদান করে যে কেঁদ্রগত হয়। উন্নত বুটস্ট্র্যাপযুক্ত সিআই-র পদ্ধতিগুলি এমন একটি রূপান্তর করার চেষ্টা করতে পারে যে রূপান্তরিত স্কেলে সিআই অনুমানের জন্য মূলের নিকটে, তারপরে মূল স্কেলে ফিরে যেতে পারে।টি ( ( টি * ) - ( T ) ) ( ( টি * ) - ( T ) )(Tt)th(h(T)h(t))h(h(T)h(t))

boot.ci()ফাংশন বুটস্ট্র্যাপ studentized প্রদান করে সিআইএস (যাকে বলা হয় "bootstrap- টি " দ্বারা DiCiccio এবং এফরন ) এবং সিআইএস (পক্ষপাত সংশোধন এবং ত্বরিত, যেখানে স্কিউ সঙ্গে "ত্বরণ" পুলিশ) যে হল "দ্বিতীয়-অর্ডার সঠিক" যে এর মধ্যে পার্থক্য পছন্দসই এবং অর্জিত কভারেজ (উদাহরণস্বরূপ, 95% সিআই) order এর ক্রমানুসারে , কেবল প্রথম-অর্ডার যথার্থ ( of of এর ক্রম ) বোধগম্য / মৌলিক এবং পার্সেন্টাইল পদ্ধতির জন্য ( রেফ 1 , পিপি 212-3; রেফারি 4 )। এই পদ্ধতিগুলির জন্য, প্রতিটি টি- the স্বতন্ত্র মানগুলি নয়, বুটস্ট্র্যাপযুক্ত প্রতিটি নমুনার মধ্যেই α n - 1 এন - 0.5 টি জেBCaαn1n0.5Tj এই সহজ পদ্ধতি দ্বারা ব্যবহৃত।

চরম ক্ষেত্রে, আত্মবিশ্বাসের অন্তরগুলির পর্যাপ্ত সামঞ্জস্যতা সরবরাহ করতে নিজেরাই বুটস্ট্র্যাপযুক্ত নমুনাগুলির মধ্যে বুটস্ট্র্যাপিংয়ের আশ্রয় নিতে পারে। এই "ডাবল বুটস্ট্র্যাপ" রেফার 5.5 সেকশনে বর্ণিত হয়েছে । 1 , সেই বইয়ের অন্যান্য অধ্যায়গুলির সাথে এর চূড়ান্ত গণনার চাহিদা হ্রাস করার উপায়গুলি বোঝায়।


  1. ডেভিসন, এসি এবং হিঙ্কলি, ডিভি বুটস্ট্র্যাপ পদ্ধতি এবং তাদের অ্যাপ্লিকেশন, কেমব্রিজ বিশ্ববিদ্যালয় প্রেস, 1997

  2. ইফ্রন, বি। বুটস্ট্র্যাপ পদ্ধতি: জ্যাকনিফের আরেকটি চেহারা, আন। পরিসংখ্যানবিৎ। 7: 1-26, 1979

  3. ফক্স, জে এবং ওয়েইসবার্গ, এস। এর বুটস্ট্র্যাপিং রিগ্রেশন মডেলগুলি। একটি অ্যাপেন্ডিক্স টু আন আর কম্পিয়ন টু অ্যাপ্লাইড রিগ্রেশন, দ্বিতীয় সংস্করণ (সেজ, ২০১১)। 10 অক্টোবর 2017 হিসাবে সংশোধন

  4. ডিকিসিও, টিজে এবং ইফ্রন, বি বুটস্ট্র্যাপের আত্মবিশ্বাসের বিরতি। তাত্ক্ষণিকবাজার। সী। 11: 189-228, 1996

  5. ক্যান্টি, এজে, ডেভিসন, এসি, হিঙ্কলি, ডিভি, এবং ভেন্টুরা, ভি। বুটস্ট্র্যাপ ডায়াগনস্টিকস এবং প্রতিকার। করতে পারেনা। জে স্ট্যাটাস 34: 5-27, 2006


1
আমি সত্যিই বুঝতে পারি না আপনি কেন বলছেন যে জনগণের বন্টন থেকে বিচ্যুত হওয়ার জন্য "অভিজ্ঞতামূলক বুটস্ট্র্যাপ" "অনেক কম সংবেদনশীল" হবে। পার্সেন্টাইল বুটস্ট্র্যাপ এবং বুটস্ট্র্যাপযুক্ত বিতরণের ঠিক একই পরিমাণ কোয়ান্টাইল ব্যবহার করে এই "ইমিরিকাল বুটস্ট্র্যাপ" নয়? আমি ভেবেছিলাম একমাত্র পার্থক্য হ'ল বুটস্ট্র্যাপ বিতরণ যদি নমুনার আশেপাশে অসম্পৃক্ত হয় তবে এই দুটি পদ্ধতির অন্তরগুলি উল্টানো হবে। এখানে বর্ণিত মত: en.wikedia.org/wiki/… ("বেসিক" বনাম "পার্সেন্টাইল")।
অ্যামিবা বলেছেন

1
অ্যামিবা @ বুটস্ট্র্যাপের প্রাক্কলন অনুসারে কীভাবে তারা পক্ষপাতিত্ব পরিচালনা করে তার মধ্যে তারতম্য, কেবলমাত্র অন্তরগুলি উল্টানোর ক্ষেত্রে নয়। এই উত্তরের জন্য বন্টনগুলির লেজ সম্পর্কিত বিষয়গুলি থেকে অভিজ্ঞতামূলক বনাম পারসেন্টাইল বুটস্ট্র্যাপিংয়ের বিষয়গুলি আলাদা করার জন্য আরও কাজ করা দরকার, যা আমি এখানে কিছুটা বিভ্রান্ত করেছি এবং যা আমি কয়েক দিনের মধ্যে পরিষ্কার করার আশা করছি।
এডিএম

1
আমি এই উত্তরটিকে সমর্থন করি না কারণ প্রদত্ত রেফারেন্সগুলির ভিত্তিতে এবং উপস্থাপিত (অত্যন্ত যুক্তিসঙ্গত) যুক্তিগুলির ভিত্তিতে: " পার্সেন্টাইল বুটস্ট্র্যাপ কখনও ব্যবহার করা উচিত নয় " কেবল একটি অতিমাত্রায় কাজ করা হয়, "কিছুটা" নয়। হ্যাঁ, যদি আমরা পারি তবে আমাদের কিছু ধরণের পক্ষপাত-সংশোধন করা বুটস্ট্র্যাপ পদ্ধতি ব্যবহার করা উচিত তবে না, পার্সেন্টাইল বুটস্ট্র্যাপ ব্যবহারের চেয়ে কিছুটা অকার্যকর সিআই অনুমান পেতে বরং নির্ধারিতভাবে 2SE বুদ্ধিমানের কাছাকাছি স্থির করে রাখুন এবং ভাবেন যে আমরা আমেরিকা আবিষ্কার করেছি। (উত্তরের মূল সংস্থাটি যা বলে তার সাথে আমি বেশিরভাগই একমত, কেবল শেষ অনুচ্ছেদে এটি
অনুধাবন

1
মন্তব্যের প্রতিক্রিয়াতে অংশটি যথেষ্ট পুনর্গঠিত এবং সংশোধন করা হয়েছে।
এডিএম

1
@ আপনি যা লিখেছেন তা বিচক্ষণ / বুনিয়াদি বুটস্ট্র্যাপের জন্য আমি যে ফর্মটি দিয়েছি তার সমান। মনে রাখবেন যে আপনার হয় , যেখানে বুটস্ট্র্যাপ নমুনার মধ্যে সুদ উপরের শতকরা হয়। সুতরাং । আমি আপনার জন্য ব্যবহার করেছি এবং বুটস্ট্র্যাপের অর্থ প্লাস অফসেট হিসাবে প্রকাশ করেছি । * θ * ইউ - θ θ * ইউ θ - ইউ * = θ - ( θ * ইউ - θ ) = 2 θ - θ * ইউ টি θ θ * ইউ ˉ টি * 2Uθ^Uθ^θ^Uθ^U=θ^(θ^Uθ^)=2θ^θ^Utθ^θ^UT¯δ2
এডিএম

8

এমআইটি / রাইস এবং ইফ্রনের বইয়ের মধ্যে বিভিন্ন পরিভাষা সম্পর্কে কিছু মন্তব্য

আমি মনে করি যে এমআইটির বক্তৃতা নোটের সাথে সম্পর্কিত, ওপেনের মূল প্রশ্নের উত্তর দেওয়ার ক্ষেত্রে এডিএমের উত্তরটি দুর্দান্ত কাজ করে। তবে ওপি এফ্রম (২০১ 2016) কম্পিউটার যুগের পরিসংখ্যানগত অনুক্রমের বইটিও উদ্ধৃত করেছে যা কিছুটা আলাদা সংজ্ঞা ব্যবহার করে যা বিভ্রান্তির কারণ হতে পারে।


অধ্যায় 11 - শিক্ষার্থীর স্কোর নমুনা পারস্পরিক সম্পর্ক উদাহরণ

এই উদাহরণটি এমন একটি নমুনা ব্যবহার করে যার জন্য আগ্রহের প্যারামিটারটি পারস্পরিক সম্পর্ক। নমুনায় এটি হিসাবে পরিলক্ষিত হয় । ইফ্রন তারপরে নন প্যারাম্যাট্রিক বুটস্ট্র্যাপের প্রতিলিপিগুলি সম্পাদন করে শিক্ষার্থীর স্কোরের নমুনা পারস্পরিক সম্পর্কের জন্য এবং ফলাফলের হিস্টগ্রাম প্লট করে (পৃষ্ঠা 186)বি=2000 θ *θ^=0.498B=2000θ^

এখানে চিত্র বর্ণনা লিখুন

স্ট্যান্ডার্ড ইন্টারভাল বুটস্ট্র্যাপ

তারপরে তিনি নিম্নলিখিত স্ট্যান্ডার্ড ইন্টারভাল বুটস্ট্র্যাপটি সংজ্ঞায়িত করেন :

θ^±1.96se^

95% কভারেজের জন্য যেখানে বুটস্ট্র্যাপের স্ট্যান্ডার্ড ত্রুটি হিসাবে ধরা হয়: , এটি বুটস্ট্র্যাপ মানগুলির অভিজ্ঞতাগত মান বিচ্যুতিও বলে। গুলিটিse^seboot

বুটস্ট্র্যাপ মানগুলির অভিজ্ঞতাগত মান বিচ্যুতি:

আসল নমুনাটি হতে হবে এবং বুটস্ট্র্যাপ নমুনাটি হতে হবে । প্রতিটি বুটস্ট্র্যাপ নমুনা একটি উপলব্ধ বুটস্ট্র্যাপ রেপ্লিকেশন সুদের পরিসংখ্যাত এর: এক্স * = ( x এর * 1 , x এর * 2 , , এক্স * এন ) θ * = গুলি ( এক্স * )  জন্য  = 1 , 2 , , x=(x1,x2,...,xn)x=(x1,x2,...,xn)b

θ^b=s(xb)  for b=1,2,...,B

জন্য আদর্শ ত্রুটির ফলে বুটস্ট্র্যাপ অনুমান হয়θ^

se^boot=[b=1B(θ^bθ^)2/(B1)]1/2
θ^=b=1Bθ^bB

এই সংজ্ঞাটি এডএম এর উত্তরে ব্যবহৃত অন্যটির থেকে পৃথক বলে মনে হচ্ছে:

এমিরিকালিক / বেসিক বুটস্ট্র্যাপ দ্বারা বর্ণিত জনগোষ্ঠীর মধ্যে বন্টন অনুমান করার জন্য থেকে বুটস্ট্র্যাপ নমুনাগুলির মধ্যে বিতরণ ব্যবহার করে।(Tt)RF^(Tθ)F


পারসেন্টাইল বুটস্ট্র্যাপ

এখানে, উভয় সংজ্ঞা সংযুক্ত মনে হয়। ইফ্রন পৃষ্ঠা 186 থেকে:

শতকরা পদ্ধতি বুটস্ট্র্যাপ বিতরণের আকৃতি ব্যবহার মান অন্তর উপর উন্নত। রয়ে উত্পন্ন প্রতিলিপিকৃত আমরা কি তবে আস্থা সীমা শতকরা সংজ্ঞায়িত করতে তাদের বিতরণের শতকরা ব্যবহার ।Bθ^1,θ^2,...,θ^B

এই উদাহরণে, এগুলি যথাক্রমে 0.118 এবং 0.758।

এডএমের উদ্ধৃতি:

পার্সেন্টাইল বুটস্ট্র্যাপ পরিবর্তে সিআই নির্ধারণ করার জন্য মানগুলির কোয়ান্টাইলগুলি ব্যবহার করে।Tj


ইফ্রন দ্বারা নির্ধারিত মান এবং পারসেন্টাইল পদ্ধতির তুলনা করা

তার নিজের সংজ্ঞা অনুসারে, ইফ্রন পার্সেন্টাইল পদ্ধতিটি একটি উন্নতি হিসাবে তর্ক করতে যথেষ্ট দৈর্ঘ্যে যায়। উদাহরণস্বরূপ ফলাফল প্রাপ্ত সিআই হ'ল:

এখানে চিত্র বর্ণনা লিখুন


উপসংহার

আমি যুক্তি দিয়ে বলব যে ওপির মূল প্রশ্নটি এডএম দ্বারা প্রদত্ত সংজ্ঞাগুলির সাথে সংযুক্ত করা হয়েছে। সংজ্ঞাগুলি স্পষ্ট করতে ওপি দ্বারা সম্পাদিত সম্পাদনাগুলি এফ্রনের বইয়ের সাথে সংযুক্ত এবং এম্পিরিকাল বনাম স্ট্যান্ডার্ড বুটস্ট্র্যাপ সিআইয়ের জন্য ঠিক একই নয়।

মন্তব্য স্বাগত


2
পরিভাষা সংক্রান্ত স্পষ্টতার জন্য ধন্যবাদ। এক নজরে, "মান বিরতি বুটস্ট্র্যাপ" সিআইএস দ্বারা উত্পাদিত "স্বাভাবিক" সিআইএস অনুরূপ হবে বলে মনে হচ্ছে boot.ci(), এ যে, তারা ত্রুটির একটি স্বাভাবিক পড়তা উপর ভিত্তি করে এবং নমুনা হিসাব সম্পর্কে প্রতিসম হতে বাধ্য । এটি "অভিজ্ঞতাগত / মৌলিক" সিআই থেকে আলাদা, যা "পারসেন্টাইল" সিআই পছন্দ করে অসম্পূর্ণতার জন্য। পক্ষপাতিত্ব পরিচালনার ক্ষেত্রে "অভিজ্ঞতা / মৌলিক" সিআই এবং "পার্সেন্টাইল" সিআইয়ের মধ্যে বড় পার্থক্য দেখে আমি অবাক হয়েছি; আমি এই প্রশ্নের উত্তর দেওয়ার চেষ্টা না করা পর্যন্ত আমি সে সম্পর্কে খুব বেশি চিন্তা করিনি। θ
এডিএম

স্রেফ এইটির জন্য ম্যানুয়ালটি পরীক্ষা করা হয়েছে boot.ci(): "সাধারণ বিরতিগুলি বুটস্ট্র্যাপ পক্ষপাতিত্ব সংশোধনও ব্যবহার করে।" সুতরাং এটি ইফ্রন দ্বারা বর্ণিত "স্ট্যান্ডার্ড ইন্টারভাল বুটস্ট্র্যাপ" থেকে একটি পার্থক্য বলে মনে হচ্ছে।
এডিএম

যথেষ্ট উপযুক্ত - বইটিতে বর্ণিত সাধারণ ব্যবধানগুলি হ'ল বেস কেস যা থেকে তিনি আরও ভাল এবং আরও সুনির্দিষ্ট পন্থাগুলি তৈরি করেন (বিসি এবং বিসিএর সমস্ত উপায়) তাই এটি বোঝা যায় যে এটি প্রয়োগ করা হয়নি
জেভিয়ার বুরেট সিকোটে

@ এডিএম এবং জাভিয়ার: কম্পিউটার যুগের পরিসংখ্যানগত অনুক্রমগুলি কি "এম্পিরিয়াল / বেসিক" সিআই-কে আদৌ বর্ণনা করে? যদি তা হয় তবে বইটি তাদের কীভাবে ডাকবে? তা না হলে কি আজব লাগছে না?
অ্যামিবা বলেছেন

1
অ্যামিবা নয় যে আমি প্রথম দেখাতে দেখতে পারি। বইটি ব্যক্তিগত ব্যবহারের জন্য পিডিএফ হিসাবে উপলব্ধ । আমি যেমন আমার উত্তরে তর্ক করেছি এবং যেমনটি বইটিতে উল্লেখ করা হয়েছে, কভারেজের ক্ষেত্রে "এম্পিরিকাল / বেসিক" এবং "পারসেন্টাইল" সিআইয়ের চেয়ে আরও ভাল পছন্দ রয়েছে, সুতরাং আমি দেখতে পাচ্ছি যে কেন বাদ পড়তে পারে: পক্ষপাত ছাড়াই এবং প্রতিসম সিআই সহ, তাদের মধ্যে খুব একটা পার্থক্য নেই। আমি অবশ্যই তার প্রাথমিক সিআই পদ্ধতিতে জোর দেওয়ার জন্য বুটস্ট্র্যাপের উদ্ভাবককে দোষ দিতে পারি না, কারণ এটি "অভিজ্ঞতা / বেসিক" এর চেয়ে সরাসরি খ্রিস্টপূর্ব এবং বিসিএর দিকে নিয়ে যায়।
এডিএম

5

আমি আপনার গাইডলাইন অনুসরণ করছি: "বিশ্বাসযোগ্য এবং / অথবা অফিসিয়াল উত্স থেকে উত্তর অঙ্কনের সন্ধান করছি" "

বুটস্ট্র্যাপ আবিষ্কার করেছিলেন ব্র্যাড এফ্রন। আমি মনে করি এটি ন্যায়সঙ্গত যে তিনি একজন বিশিষ্ট পরিসংখ্যানবিদ। এটা সত্য যে তিনি স্ট্যানফোর্ডের অধ্যাপক। আমি মনে করি এটি তার মতামতকে বিশ্বাসযোগ্য এবং অফিসিয়াল করে তোলে।

আমি বিশ্বাস করি যে ইফ্রন এবং হাস্টির কম্পিউটার যুগের পরিসংখ্যানমূলক অনুগ্রহ তাঁর সর্বশেষ বই এবং তাই তার বর্তমান মতামতগুলি প্রতিবিম্বিত করা উচিত। থেকে পি। 204 (11.7, নোট এবং বিশদ),

বুটস্ট্র্যাপের আত্মবিশ্বাসের বিরতিগুলি যথাযথ বা সর্বোত্তম নয়, তবে কাছাকাছি-নির্ভুল নির্ভুলতার সাথে একত্রিত একটি প্রশস্ত প্রয়োগের জন্য লক্ষ্য করুন for

আপনি যদি অধ্যায় 11, "বুটস্ট্র্যাপ কনফিডেন্স ইন্টারভেলস" পড়েন তবে তিনি বুটস্ট্র্যাপের আত্মবিশ্বাসের অন্তর তৈরির 4 টি পদ্ধতি দেন। এই পদ্ধতির দ্বিতীয়টি হল (১১.২) পারসেন্টাইল পদ্ধতি। তৃতীয় এবং চতুর্থ পদ্ধতিগুলি পার্সেন্টাইল পদ্ধতিতে বৈকল্পিক যা এফ্রন এবং হাসটি আত্মবিশ্বাসের ব্যবধানে পক্ষপাতিত্ব হিসাবে বর্ণনা করে এবং যার জন্য তারা একটি তাত্ত্বিক ব্যাখ্যা দেয় তার জন্য সংশোধন করার চেষ্টা করে।

একদিকে যেমন, আমি সিদ্ধান্ত নিতে পারছি না যে এমআইটি লোকেরা ইমিরিকাল বুটস্ট্র্যাপ সিআই এবং পার্সেন্টাইল সিআই বলে। আমার মস্তিষ্কের উচ্ছ্বাস হতে পারে তবে আমি একটি নির্দিষ্ট পরিমাণ বাদ দিয়ে পার্সেন্টাইল পদ্ধতি হিসাবে অভিজ্ঞতা অভিজ্ঞতা দেখি। এটি কিছুই পরিবর্তন করা উচিত। আমি সম্ভবত ভুলভাবে পড়ছি, তবে আমি কীভাবে তাদের লেখাকে ভুল বুঝতে পারছি তা যদি কেউ ব্যাখ্যা করতে পারে তবে আমি সত্যিই কৃতজ্ঞ হব।

নির্বিশেষে, শীর্ষস্থানীয় কর্তৃপক্ষের পারসেন্টাইল সিআইয়ের সাথে কোনও সমস্যা আছে বলে মনে হয় না। আমিও মনে করি তাঁর মন্তব্য বুটস্ট্র্যাপ সিআইয়ের সমালোচনার জবাব দেয় যা কিছু লোক উল্লেখ করেছেন।

মেজর চালু করুন

প্রথমত, এমআইটি অধ্যায় এবং মন্তব্যগুলি হজম করার জন্য সময় নেওয়ার পরে, সবচেয়ে গুরুত্বপূর্ণ বিষয়টি লক্ষ্য করা যায় যে এমআইটি যাকে ইমিরিকাল বুটস্ট্র্যাপ এবং পারসেন্টাইল বুটস্ট্র্যাপ বলে পৃথক করে - এম্পিরিকাল বুটস্ট্র্যাপ এবং পারসেন্টাইল বুটস্ট্র্যাপের মধ্যে তারা পৃথক হবে যা আলাদা বলে মনে হয় বুটস্ট্র্যাপের বিরতি হবে তবে পার্সেন্টাইল বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবধান থাকবে । আমি আরও যুক্তি দিয়ে বলব যে এফ্রন-হাসটি অনুসারে পারসেন্টাইল বুটস্ট্র্যাপ আরও প্রমিত হয়। এমআইটি যা অনুভূত বুটস্ট্রাপ বলে তার মূল চাবিকাঠিটি এর বিতরণ দেখতে হবে । তবে কেন , কেন নয়[x¯δ.1,x¯δ.9][x¯δ.9,x¯δ.1]
δ=x¯μx¯μμx¯ । ঠিক যেমন যুক্তিযুক্ত। তদ্ব্যতীত, দ্বিতীয় সেটটির বদ্বীপগুলি হ'ল অশুচি পার্সেন্টাইল বুটস্ট্র্যাপ! ইফ্রন পারসেন্টাইল ব্যবহার করে এবং আমি মনে করি যে প্রকৃত মাধ্যমের বিতরণটি সবচেয়ে মৌলিক হওয়া উচিত। আমি যুক্ত করব যে ইফ্রন এবং হাসটি এবং এফ্রন এর ১৯৯৯ সালের পেপারে অন্য একটি উত্তরে উল্লেখ করা হয়েছে, এফ্রন ১৯৮২ সালে বুটস্ট্র্যাপে একটি বই লিখেছিলেন। তিনটি সূত্রে পারসেন্টাইল বুটস্ট্র্যাপের উল্লেখ রয়েছে, তবে আমি এর কোন উল্লেখ পাইনি এমআইটি-র লোকেরা এম্পিরিকাল বুটস্ট্র্যাপ বলে। তদতিরিক্ত, আমি নিশ্চিত যে তারা পার্সেন্টাইল বুটস্ট্র্যাপ ভুলভাবে গণনা করে। নীচে আমি লিখেছি একটি আর নোটবুক আছে।

এমআইটি রেফারেন্সের বিষয়ে মন্তব্যগুলি প্রথমে এমআইটির ডেটা আর-তে পাওয়া যাক their আমি তাদের বুটস্ট্র্যাপের নমুনাগুলির একটি সাধারণ কাটা এবং পেস্ট করার কাজটি করেছি এবং এটি বুট.txt এ সংরক্ষণ করেছি।

অরিজিন.বুট = সি (30, 37, 36, 43, 42, 43, 43, 46, 41, 42) বুট = পঠনযোগ্য (ফাইল = "বুট.টেক্সট") এর অর্থ = as.numeric (ল্যাপ্লি (বুট , মানে)) # ল্যাপ্লি তালিকা তৈরি করে, ভেক্টরগুলি নয়। আমি এটি ডেটা ফ্রেমের জন্য সর্বদা ব্যবহার করি। মিউ = গড় (উত্স। বুট) ডেল = সাজান (মানে - মিউ) # পার্থক্যগুলি মি মানে ডেল এবং আরও

লুকান মু - সাজান (দেল) [3] মিউ - সাজান (দেল) [18] সুতরাং আমরা তাদের একই উত্তর পাই। বিশেষত আমার একই দশম এবং 90 তম পার্সেন্টাইল রয়েছে। আমি এটি উল্লেখ করতে চাই যে 10 ম থেকে 90 তম পার্সেন্টাইল 3 এর রেঞ্জ 3 This এটি এমআইটির মতোই।

আমার মানে কি?

লুকান মানে সাজানো (মানে) আমি বিভিন্ন উপায়ে পাচ্ছি। গুরুত্বপূর্ণ পয়েন্ট- আমার দশম এবং 90 তম মানে 38.9 এবং 41.9। এটিই আমি প্রত্যাশা করতাম। এগুলি পৃথক কারণ আমি 40.3 থেকে দূরত্ব বিবেচনা করছি, তাই আমি বিয়োগের ক্রমটিকে বিপরীত করছি। দ্রষ্টব্য যে 40.3-38.9 = 1.4 (এবং 40.3 - 1.6 = 38.7)। সুতরাং তারা যাকে পারসেন্টাইল বুটস্ট্রাপ বলে তা এমন একটি বিতরণ দেয় যা প্রকৃত উপায়ের উপর নির্ভর করে যা আমরা পেয়েছি এবং পার্থক্যগুলি নয়।

কী পয়েন্ট ইমেরিকাল বুটস্ট্র্যাপ এবং পারসেন্টাইল বুটস্ট্র্যাপের মধ্যে পৃথক হবে যেগুলিকে তারা এম্পিরিকাল বুটস্ট্র্যাপ বলে তার অন্তর হবে [x ∗ ¯ − δ.1, x ∗ ¯ δ δ.৯] [x ∗ ¯ − δ.1.1, x ∗ ¯ − δ.৯] যেখানে পার্সেন্টাইল বুটস্ট্র্যাপের আত্মবিশ্বাসের ব্যবধান থাকবে [x ∗ ¯ − δ.৯, x ∗ ¯ − δ.১] [x ∗ ¯ − δ.৯, এক্স ∗ ¯ − δ δ.১ ]। সাধারণত এগুলি পৃথক হওয়া উচিত নয়। আমি যা পছন্দ করব সে সম্পর্কে আমার চিন্তাভাবনা রয়েছে, তবে ওপি অনুরোধ করে এমন নির্দিষ্ট উত্স আমি নই। ভেবেচিন্তে পরীক্ষা- নমুনার আকার বাড়লে দুজনকে একত্রিত করা উচিত। লক্ষ করুন যে আকারের 210210 সম্ভাব্য নমুনা রয়েছে 10 আসুন বাদাম না চলুন তবে কীভাবে আমরা 2000 টি নমুনা গ্রহণ করি - একটি আকার সাধারণত পর্যাপ্ত বলে বিবেচিত হয়।

(আমি সি (1: 2000)) এর জন্য সেট.সীড (1234) # পুনরুত্পাদনযোগ্য বুট ২ কে = ম্যাট্রিক্স (এনএ, 10,2000) লুকান {বুট ২ কে [, i] = নমুনা (অরিজিনবুট, 10, প্রতিস্থাপন) = টি)} mu2k = সাজান (প্রয়োগ করুন (boot.2k, 2, গড়)) আসুন mu2k দেখুন at

সংক্ষিপ্তসার লুকান (mu2k) অর্থ (mu2k) - মুম 2 কে [200] গড় (mu2k) - mu2k [1801] এবং আসল মানগুলি-

মিউ 2 কে লুকান [২০০] মুউ কে কে [১৮০১] সুতরাং এখন এমআইটি যা অনুভবের বুটস্ট্র্যাপ বলে তাকে [, 40.3 -1.87,40.3 +1.64] বা [38.43,41.94] এর একটি 80% আত্মবিশ্বাস অন্তর দেয় এবং তাদের খারাপ পার্সেন্টাইল বিতরণ দেয় [38.5, 42]। এটি অবশ্যই বোধগম্য কারণ কারণ প্রচুর সংখ্যক আইন এই ক্ষেত্রে বলবে যে বিতরণটি একটি সাধারণ বিতরণে রূপান্তরিত হওয়া উচিত। ঘটনাচক্রে, এটি এফ্রন এবং হাস্টিতে আলোচিত। বুটস্ট্র্যাপ ব্যবধান গণনা করার জন্য তারা প্রথম পদ্ধতিটি দেয় mu = / - 1.96 এসডি ব্যবহার করা। তারা উল্লেখ করে যে, যথেষ্ট পরিমাণে নমুনা আকারের জন্য এটি কাজ করবে। তারপরে তারা একটি উদাহরণ দেয় যার জন্য এন = 2000 তথ্যের আনুমানিক স্বাভাবিক বন্টন পাওয়ার জন্য এত বড় নয়।

উপসংহার প্রথমত, আমি নামকরণের প্রশ্নগুলি সিদ্ধান্ত নেওয়ার জন্য যে নীতিটি ব্যবহার করি তা বলতে চাই। "এটি চাইলে আমার পার্টি আমি চাইলে কাঁদতে পারি।" মূলত পেটুলা ক্লার্কের দ্বারা অনুমোদিত, আমি মনে করি এটি নামকরণ কাঠামোকেও প্রয়োগ করে। সুতরাং এমআইটির প্রতি আন্তরিকভাবে শ্রদ্ধার সাথে, আমি মনে করি যে ব্র্যাডলি এফ্রন বিভিন্ন ইচ্ছামত বুটস্ট্র্যাপিং পদ্ধতির নামটি প্রাপ্য তার ইচ্ছামত। সে কি করে ? ইফ্রন-এ 'ইমিরিকাল বুটস্ট্র্যাপ'-এর কোনও উল্লেখ খুঁজে পাই না, কেবল পারসেন্টাইল। তাই আমি ভাত, এমআইটি, এট আল সহ বিনয়ের সাথে একমত নই। আমি আরও উল্লেখ করতে পারি যে, এমআইটি বক্তৃতায় যেমন প্রচুর সংখ্যক আইন রয়েছে, অনুশীলনমূলক এবং পারসেন্টাইল একই সংখ্যায় রূপান্তরিত হওয়া উচিত। আমার স্বাদে, পারসেন্টাইল বুটস্ট্র্যাপ স্বজ্ঞাত, ন্যায়সঙ্গত এবং বুটস্ট্র্যাপের উদ্ভাবকের মনে কী ছিল। আমি যুক্ত করব যে আমি এটি করার জন্য সময় নিলাম কেবল নিজের উত্সাহের জন্য, অন্য কিছু নয়। নির্দিষ্টভাবে, আমি ইফ্রন লিখিনি, যা সম্ভবত ওপি করা উচিত। আমি সংশোধন দাঁড়িয়ে সবচেয়ে ইচ্ছুক।


3
"আমি মনে করি যে তিনি একজন বিশিষ্ট পরিসংখ্যানবিদ to - হ্যাঁ আমি বলব যে এটি ন্যায্য!
জাভিয়ের বুরেট সিকোট

আমি মনে করি ওপিকে "এম্পিরিকাল বুস্ট্র্যাপ" বলে যা উইকিপিডিয়াকে এখানে "বেসিক বুটস্ট্র্যাপ" বলে en.wikedia.org/wiki/… । এটি "পারসেন্টাইল বুটস্ট্র্যাপ" এর মতো একই শতকরা ব্যবহার করে, আপনি ঠিক বলেছেন তবে একধরণের তাদের চারপাশে ফ্লিপ করে। ইফ্রন এবং হাস্টি কি তাদের 4 টি পদ্ধতিতে এটি অন্তর্ভুক্ত করে? তারা এটিকে কীভাবে ডাকবে?
অ্যামিবা বলেছেন মনিকার পুনর্নির্ধারণ

এমআইটির নোটগুলিতে আমি কী পড়েছি তার ভিত্তিতে আমি প্রশ্নটিতে এটি স্পষ্ট করার চেষ্টা করেছি। কিছু অস্পষ্ট কিনা তা আমাকে জানতে দিন (বা যদি আপনার নিজের কাছে নোটগুলি চেক করার সময় থাকে তবে সঠিকতার জন্য আমার পোস্টটি দেখুন)।
ক্লারিনেটিস্ট

@ জাভিয়ার কেউ একটি মামলা করতে পারে যে আমার ইফ্রন স্টেটমেন্টটি সংক্ষিপ্তকরণ ছিল।
অ্যাগিনেস্কে

1
[x¯δ.1,x¯δ.9]x¯ , বুটস্ট্র্যাপ অনুমান গড় পরিপ্রেক্ষিতে ভুল এমআইটি পৃষ্ঠাটি লিখিত হয়েছে ওপি দ্বারা। অভিজ্ঞতা / বুনিয়াদি বুটস্ট্র্যাপ বুটস্ট্র্যাপ অনুমানের পার্থক্যগুলির মূল নমুনা অনুমান থেকে বিতরণ পরীক্ষা করে না, বুটস্ট্র্যাপ অনুমানের বিতরণ করে না। পক্ষপাতিত্ব থাকলে এটি সিআইয়ের মধ্যে গুরুতর পার্থক্যের দিকে পরিচালিত করে, যেমন আমার উত্তরটি ব্যাখ্যা করে। উদাহরণ হিসাবে এই পৃষ্ঠাটি দেখুন ।
এডিএম

2

পূর্ববর্তী জবাবগুলিতে ইতিমধ্যে উল্লিখিত হিসাবে, "ইমিরিকাল বুটস্ট্র্যাপ" কে অন্য উত্সগুলিতে (আর ফাংশন সহ) "বেসিক বুটস্ট্র্যাপ" বলা হয় বুট.সিআই ) , যা বিন্দু অনুমানের সাথে উল্টানো "পার্সেন্টাইল বুটস্ট্র্যাপ" এর অনুরূপ। ভেনেবলস এবং রিপলি লিখেছেন ("মডার্ন অ্যাপ্লাইড স্ট্যাটাসটিক্স উইথ এস", ৪ র্থ সংস্করণ, স্প্রঞ্জার, ২০০২, পৃষ্ঠা ১৩6):

অসম্পূর্ণ সমস্যাগুলিতে মৌলিক এবং শতাংশের অন্তরগুলি যথেষ্ট পার্থক্য করতে পারে এবং প্রাথমিক অন্তরগুলি আরও যুক্তিযুক্ত বলে মনে হয়।

কৌতূহলের বাইরে, আমি দুটি অ্যাসিমেট্রিকভাবে বিতরণকৃত অনুমানক সহ বিস্তৃত মন্টেকার্লো সিমুলেশনগুলি করেছি, এবং এটি আমার নিজের বিস্ময়ের - ঠিক তার বিপরীতে পাওয়া গেছে, অর্থাত্ পার্সেন্টাইল ব্যবধান কভারেজ সম্ভাবনার ক্ষেত্রে প্রাথমিক ব্যবধানকে ছাড়িয়ে গেছে। প্রতিটি নমুনার আকার কভারেজ সম্ভাব্যতার সাথে আমার ফলাফলগুলি এখানে রয়েছেnএক মিলিয়ন বিভিন্ন নমুনা হিসাবে অনুমান করা ( এই প্রযুক্তিগত প্রতিবেদন থেকে নেওয়া হয়েছে , পৃষ্ঠা 26f):

f(x)=3x2 অসম্পূর্ণ বিতরণের গড়ের জন্য বিভিন্ন বুটস্ট্র্যাপ ব্যবধানের কভারেজ সম্ভাবনা±t1α/2s2/n)±z1α/2s2/n)

λএমএল অনুমানের জন্য বিভিন্ন বুটস্ট্র্যাপ অন্তরগুলির জন্য কভারেজ সম্ভাবনা±z1α/2±z1α/2

উভয় ব্যবহারের ক্ষেত্রে, বিসিএ বুটস্ট্র্যাপের বুটস্ট্র্যাপ পদ্ধতিগুলির মধ্যে সর্বাধিক কভারেজ সম্ভাব্যতা রয়েছে, এবং পার্সেন্টাইল বুটস্ট্র্যাপের বেসিক / এম্পিরিকাল বুটস্ট্র্যাপের চেয়ে বেশি কভারেজ সম্ভাবনা থাকে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.