বুটস্ট্র্যাপকে ছোট নমুনার আকারের জন্য "নিরাময়" হিসাবে দেখা যেতে পারে?


71

এই প্রশ্নটি আমি এই স্নাতক স্তরের পরিসংখ্যান পাঠ্যপুস্তকটিতে পড়েছি এবং একটি পরিসংখ্যান সেমিনারে এই উপস্থাপনা চলাকালীন (স্বতন্ত্রভাবে) শুনেছি এমন কিছু দ্বারা ট্রিগার করা হয়েছে। উভয় ক্ষেত্রেই, বিবৃতিটি "" নমুনার আকারটি খুব ছোট হওয়ায়, আমরা এই প্যারাম্যাট্রিক পদ্ধতি পরিবর্তে (বা পাশাপাশি) বুটস্ট্র্যাপের মাধ্যমে অনুমান করার সিদ্ধান্ত নিয়েছি ।X

তারা বিশদে getোকেনি, তবে সম্ভবত যুক্তিটি নিম্নরূপ: পদ্ধতি অনুমান করেছে যে ডেটা একটি নির্দিষ্ট প্যারাম্যাট্রিক বিতরণ অনুসরণ করে । বাস্তবে বিতরণটি ঠিক হয় না , তবে যতক্ষণ না নমুনার আকার যথেষ্ট পরিমাণে বড় হয় ঠিক ততক্ষণ ঠিক। যেহেতু এই ক্ষেত্রে নমুনার আকার খুব ছোট, তাই আসুন (নন-প্যারামেট্রিক) বুটস্ট্র্যাপে স্যুইচ করুন যা কোনও বিতরণযোগ্য অনুমান করে না। সমস্যা সমাধান!XDD

আমার মতে, এটি বুটস্ট্র্যাপের জন্য নয়। এখানে আমি এটি কীভাবে দেখছি: বুটস্ট্র্যাপ যখন আরও কম সংখ্যক তথ্য উপস্থিত থাকে তবে এটি প্রান্ত দিতে পারে তবে মানক ত্রুটি, পি-মান এবং অনুরূপ পরিসংখ্যান পাওয়ার জন্য কোনও বন্ধ ফর্ম সমাধান নেই। একটি ক্লাসিক উদাহরণ একটি দ্বিবিভক্ত সাধারণ বিতরণ থেকে একটি নমুনা দেওয়া পারস্পরিক সম্পর্কের সহগের জন্য একটি সিআই অর্জন করা: বদ্ধ ফর্ম সমাধান বিদ্যমান, তবে এটি এতটাই সংশ্লেষিত যে বুটস্ট্র্যাপিং সহজ is তবে, কিছুই বোঝায় না যে বুটস্ট্র্যাপ কোনওভাবেই ছোট্ট নমুনার আকার নিয়ে পালাতে সহায়তা করতে পারে।

আমার উপলব্ধি কি ঠিক?

আপনি যদি এই প্রশ্নটিকে আকর্ষণীয় মনে করেন তবে আমার কাছ থেকে আরও একটি সুনির্দিষ্ট বুটস্ট্র্যাপ প্রশ্ন রয়েছে:

বুটস্ট্র্যাপ: ওভারফিটিংয়ের বিষয়টি

পিএস আমি "বুটস্ট্র্যাপ অ্যাপ্রোচ" এর একটি অতি উদাহরণ উদাহরণ ভাগ করতে সহায়তা করতে পারি না। আমি লেখকের নাম প্রকাশ করছি না, তবে তিনি প্রবীণ প্রজন্মের অন্যতম "কোয়ান্টস" যিনি 2004 সালে কোয়ান্টেটিভ ফিনান্সের উপর একটি বই লিখেছিলেন। উদাহরণটি সেখান থেকে নেওয়া হয়েছে।

নিম্নলিখিত সমস্যাটি বিবেচনা করুন: ধরুন আপনার কাছে প্রতিটির জন্য 4 টি সম্পদ এবং 120 টি মাসিক রিটার্ন পর্যবেক্ষণ রয়েছে। লক্ষ্যটি হল বার্ষিক রিটার্নের যৌথ চার-মাত্রিক সিডিএফ তৈরি করা। এমনকি একটি একক সম্পত্তির জন্য, টাস্কটি কেবলমাত্র 10 বার্ষিক পর্যবেক্ষণের সাথে খুব সহজেই অর্জনযোগ্য বলে মনে হয়, 4-মাত্রিক সিডিএফ অনুমান করা যাক। তবে চিন্তা করার দরকার নেই, "বুটস্ট্র্যাপ" আপনাকে সাহায্য করবে: উপলভ্য সমস্ত 4-মাত্রিক পর্যবেক্ষণগুলি গ্রহণ করুন, পুনরায় প্রতিস্থাপন সহ 12 টি পুনরায় নমুনা নিন এবং বার্ষিক রিটার্নের একক "বুটস্ট্র্যাপড" 4-মাত্রিক ভেক্টর তৈরি করতে তাদের মিশ্রণ করুন। এটি 1000 বার পুনরাবৃত্তি করুন এবং দেখুন এবং দেখুন, আপনি নিজেকে 1000 বার্ষিক রিটার্নের একটি "বুটস্ট্র্যাপ নমুনা" পেয়েছেন। সিডিএফ অনুমানের উদ্দেশ্যে, বা হাজার বছরের ইতিহাস থেকে আঁকা যায় এমন কোনও অন্য অনুমানের উদ্দেশ্যে 1000 আকারের আইডির নমুনা হিসাবে এটি ব্যবহার করুন।


18
আপনার প্রথম অনুচ্ছেদে আমি একই রকম অনুভূতিগুলি শুনি বা পড়ি, তবে আমি একমত নই। আমি সাধারণত ছোট নমুনায় প্রয়োজনীয়ভাবে বুটস্ট্র্যাপিং দেখি না। এর ন্যায্যতা asympotic / বৃহত নমুনা, এবং অনেক ক্ষেত্রে অনুশীলনে এর ছোট নমুনার কার্যকারিতা সমস্যাযুক্ত; অন্তরগুলির কভারেজ, উদাহরণস্বরূপ, প্রায়শই নামমাত্র হার থেকে বেশ আলাদা different এটি অন্য একটি দরকারী সরঞ্জাম তবে অনেকের মতো যা বছরের পর বছর ধরে প্রকাশিত হয়েছে, কিছু লোক এটি কল্পনাও করতে পারে এটি নিরাময়ের বিষয় নয়। আমি সত্যিই এটি খুব ছোট নমুনার সমাধান বলে মনে করি না।
গ্লেন_বি

সাইমন শেদার বইতে (চিত্র 3.40) রিগ্রেশনের জন্য একটি ফ্লো চার্ট রয়েছে যা নমুনার আকার বড় না হলে এবং ত্রুটিগুলি সাধারণত বিতরণ না করা হলে অনুমিতকরণের জন্য বুটস্ট্র্যাপের পরামর্শ দেয়।
টনি লাডসন

2
চতুর্থ অনুচ্ছেদে প্রশ্নের উত্তর হ্যাঁ (বা কমপক্ষে আপনি যদি আমার ক্লাসের পরীক্ষায় এই উত্তরটি দেন তবে আপনার যুক্তির জন্য আপনি ক্রেডিট পাবেন)। আপনি কি এই আলোচনাটি পরীক্ষা করেছেন ? ইন আমার উত্তর , আমি অনুমান যে বুটস্ট্র্যাপ তোলে একটি ব্যাখ্যা দিয়েছে, এবং ঘা-আপনার-মন কাগজ যে প্রতি bootstrapper পদ্ধতি সীমাবদ্ধতা সচেতন হতে হবে পড়া উচিত একটি রেফারেন্স দিয়েছেন। আপনার প্রশ্নটির সূত্রপাতকারী বই / কাগজপত্র / উপস্থাপনাগুলির রেফারেন্সগুলি দেখে ভাল
লাগবে

সংশোধন শর্তের সাথে একটি সাধারণ আনুষঙ্গিকতার মতো - বুটস্ট্র্যাপ কী কেবল আপনাকে একটি কিনারোশের সম্প্রসারণে অতিরিক্ত শব্দ দেয় না?
সম্ভাব্যতা

উত্তর:


34

আমার পড়াটি মনে আছে যে বুটস্ট্র্যাপিংয়ের জন্য পারসেন্টাইল কনফিডেন্স ব্যবধানটি টি ইন্টারভেলের পরিবর্তে জেড ইন্টারভাল এবং ডিনোমিনেটরের জন্য পরিবর্তে ব্যবহারের সমতুল্য । দুর্ভাগ্যক্রমে আমি মনে করি না আমি কোথায় এটি পড়েছি এবং আমার দ্রুত অনুসন্ধানে কোনও রেফারেন্স খুঁজে পাইনি। এই পার্থক্য ব্যাপার অনেক না তখন এন বড় (এবং বুটস্ট্র্যাপ সুবিধার এই ছোটখাট সমস্যা গুরুত্বে অতিক্রম করা যখন বড়), কিন্তু ছোট সঙ্গে এই সমস্যা সৃষ্টি করতে পারে। অনুকরণ এবং তুলনা করার জন্য এখানে কিছু আর কোড রয়েছে:এন - 1 এন এনnn1nn

simfun <- function(n=5) {
    x <- rnorm(n)
    m.x <- mean(x)
    s.x <- sd(x)
    z <- m.x/(1/sqrt(n))
    t <- m.x/(s.x/sqrt(n))
    b <- replicate(10000, mean(sample(x, replace=TRUE)))
    c( t=abs(t) > qt(0.975,n-1), z=abs(z) > qnorm(0.975),
        z2 = abs(t) > qnorm(0.975), 
        b= (0 < quantile(b, 0.025)) | (0 > quantile(b, 0.975))
     )
}

out <- replicate(10000, simfun())
rowMeans(out)

এক দফার জন্য আমার ফলাফলগুলি হ'ল:

     t      z     z2 b.2.5% 
0.0486 0.0493 0.1199 0.1631 

সুতরাং আমরা দেখতে পাচ্ছি যে টি-টেস্ট এবং জেড-টেস্ট ব্যবহার করে (সত্য জনসংখ্যার মানক বিচ্যুতি সহ) উভয়ই টাইপ আই ত্রুটির হার দেয় যা মূলত নকশা অনুযায়ী is অযোগ্য z পরীক্ষা (নমুনা স্ট্যান্ডার্ড বিচ্যুতি দ্বারা বিভাজন, কিন্তু টি এর পরিবর্তে জেড সমালোচনা মান ব্যবহার করে) নালটিকে যতবার করা উচিত তার দ্বিগুণেরও বেশি প্রত্যাখ্যান করে। এখন বুটস্ট্র্যাপে, এটি যতবার উচিত ততবার 3 বার নালাকে প্রত্যাখ্যান করে (যদি 0, সত্যিকার অর্থটি অন্তরবর্তী হয় বা না হয়), সুতরাং এই ছোট নমুনার আকারের জন্য সহজ বুটস্ট্র্যাপ সঠিকভাবে আকারের হয় না এবং তাই করে সমস্যার সমাধান না করা (এবং এটি যখন ডেটা অনুকূলভাবে স্বাভাবিক হয়)। উন্নত বুটস্ট্র্যাপ ব্যবধানগুলি (বিসিএ ইত্যাদি) সম্ভবত আরও ভাল করবে, তবে এটি ছোট নমুনা মাপের জন্য প্যানেশিয়া হিসাবে বুটস্ট্র্যাপিং ব্যবহার সম্পর্কে কিছুটা উদ্বেগ বাড়িয়ে তুলবে।α


6
আপনার শেষ বাক্যটি আমাকে কৌতুহলী করেছিল, তাই আপনার উদাহরণ দিয়ে আমি এটি চেষ্টা করেছিলাম। আমি bootপ্যাকেজটি ব্যবহার করেছি এবং এটিতে সমস্ত সম্ভাব্য অন্তর অন্তর্ভুক্ত করেছি: প্রথম ক্রমের সাধারণ আনুমানিক অন্তর, প্রাথমিক বুটস্ট্র্যাপ বিরতি, স্টুটিঞ্জযুক্ত বুটস্ট্র্যাপ বিরতি, বুটস্ট্র্যাপ পারসেন্টাইল অন্তর (যা আপনার কোড ইতিমধ্যে সরবরাহ করে), এবং অ্যাডজাস্ট করা বুটস্ট্র্যাপ পারসেন্টাইল (বিসিএ) অন্তর. ফলাফলগুলি মূলত সমস্ত একই (প্রত্যাখার হার .16-.17 এর আশেপাশে) ছিল, কেবলমাত্র স্ট্যান্ডিনেটেড বিরতি ছাড়া, যার নামমাত্র (.05) প্রত্যাখ্যান হার ছিল (এটি বোঝায় যেহেতু এটি আরও বেশি স্ট্যান্ডার্ড টি-টেস্টের মতো)।
ওল্ফগ্যাং

2
@ ওল্ফগ্যাং, অতিরিক্ত সিমুলেশন করার জন্য ধন্যবাদ। আমি কিছুটা অবাক হলাম যে অন্যান্য অন্তরগুলি কিছুটা আরও ভাল করে না, তবে অবাক হয় না যে তারা 0.05 স্তরটি পূরণ করেনি।
গ্রেগ তুষার

1
হ্যাঁ, আমিও কিছুটা অবাক হয়েছিলাম! কখনও কখনও আমাদের অন্তর্দৃষ্টি ব্যর্থ হয়। আর এ কারণেই কিছুক্ষণের মধ্যে আর-তে একটি ছোট স্ক্রিপ্ট লিখতে সক্ষম হওয়া, এটি 10,000 \times 10,000পুনরাবৃত্তি চালাতে (যাতে সম্পূর্ণ হতে আরও কয়েক মিনিট সময় লেগেছিল), এবং জিনিসগুলি পরীক্ষা করতে সক্ষম হওয়া এত বিস্ময়কর । এবং আপনার উদাহরণটি দুর্দান্তভাবে দেখায় যে বুটস্ট্র্যাপ ছোট নমুনাগুলি দিয়ে খুব খারাপভাবে পারফরম্যান্স করতে পারে এমনকি যখন জিনিসগুলি "দুর্দান্ত" হয় (যেমন, তথ্যগুলি আসলে স্বাভাবিক থাকে)।
ওল্ফগ্যাং

প্রকৃতপক্ষে, এই সিমুলেশনটিতে দেখা সমস্যাটি হ'ল আমি ঠিক এখানেই জিজ্ঞাসা করেছি এবং @Whuber দ্বারা দেওয়া মন্তব্যে জবাব দিয়েছি: stats.stackexchange.com/questions/323455/… । অতএব, আমি মনে করি না যে সমস্যাটি নমুনার আকার, তবে প্রতিটি নমুনার মধ্যে প্যারামিট্রিক অনুক্রমের জন্য স্বাধীনতার লঙ্ঘন।
অর্ধ-পাস

2
শতকরা আস্থা ব্যবধান আপনার মন্তব্যকে ব্যবহার সমতূল্য হচ্ছে পরিবর্তে থেকে এখানে শুধু রেকর্ডের জন্য। টিzt
দায়েরউং লিম

14

যদি আপনাকে ছোট নমুনা আকার সরবরাহ করা হয় (একপাশ হিসাবে, "ছোট" কী বলে মনে হয় প্রতিটি গবেষণা ক্ষেত্রে কিছু অন্তর্নিহিত প্রচলিত নিয়মের উপর নির্ভর করে), কোনও বুটস্ট্র্যাপ যাদু করবে না। ধরে নিই যে একটি ডাটাবেস তদন্তাধীন দুটি ভেরিয়েবলের প্রত্যেকটির জন্য তিনটি পর্যবেক্ষণ রয়েছে, কোনও অনুমানের অর্থ হবে না। আমার অভিজ্ঞতায়, নন-প্যারামেট্রিক বুটস্ট্র্যাপ টিউ-টেস্টের প্রতিস্থাপনে ভাল কাজ করে যখন নমুনা বিতরণ (কমপক্ষে 10-15 টি পর্যবেক্ষণ) স্কুড থাকে এবং তাই সাধারণ টি-পরীক্ষার পূর্বশর্তগুলি সন্তুষ্ট হয় না। এছাড়াও, পর্যবেক্ষণের সংখ্যা নির্বিশেষে, ডেটা ইতিবাচকভাবে আঁকানো হলে প্যারামিমেট্রিক নয় এমন বুটস্ট্র্যাপ বাধ্যতামূলক পছন্দ হতে পারে, কারণ এটি স্বাস্থ্যসেবা ব্যয়ের জন্য সর্বদা ঘটে।


1
ডেটা ইতিবাচকভাবে আঁকলে বুটস্ট্র্যাপ বাধ্যতামূলক পছন্দ হতে পারে - পরিবর্তে লগনরমাল বা অনুরূপ স্কিউ বিতরণ ব্যবহার করবেন না কেন? এসএএস এবং আর এর প্রচুর পছন্দ রয়েছে।
জেমস

1
জেমস এর উত্তর বিবেচনা মূল্য। যাইহোক, লগিং ব্যয়ের ডেটা নিয়ে আমি যে সাধারণ সমস্যার মুখোমুখি হচ্ছি তা হ'ল সিদ্ধান্ত গ্রহণকারীদের কাছে ফলাফল উপস্থাপনের আগে আসল মেট্রিকটিতে ব্যাক-ট্রান্সফর্মেশন। নন-প্যারাম্যাট্রিক বুটস্ট্র্যাপের সাহায্যে আপনি এই সমস্যাটি এড়াতে পারেন।
কার্লো লাজারো

কার্লো, যেহেতু আপনার লগ রূপান্তরের অভিজ্ঞতা রয়েছে, তাই আপনি আমার অন্য একটি প্রশ্নের উত্তর দিতে চাইতে পারেন (এখানে একটি 50 পয়েন্টের অনুগ্রহ রয়েছে): stats.stackexchange.com/a/111932/54099
জেমস

জেমস, আমি কয়েক মিনিট আগে আপনার প্রশ্নের একটি লোভনীয় উত্তর দিয়েছি।
কার্লো লাজারো

χ 2 1t স্টেটসগুলি স্কিউড জনসংখ্যার জন্য সংশোধন করা যায়, দেখুন jstor.org/stable/2286597 - প্রস্তাবিত সংশোধনগুলি 10 টি পর্যবেক্ষণ সহ ske মতো যথেষ্ট স্কিউ জনসংখ্যার সাথে ভালভাবে কাজ করেছে worked χ12
স্টাসকে

13

অন্যান্য উত্তরগুলি বুটস্ট্র্যাপের আত্মবিশ্বাসের বিরতিগুলির কার্যকারিতা সমালোচনা করে , নিজেই বুটস্ট্র্যাপ করে না। এটি একটি ভিন্ন সমস্যা।

যদি আপনার প্রসঙ্গটি বুটস্ট্র্যাপ বিতরণের একত্রিতকরণের জন্য নিয়মিততার শর্তগুলি পূরণ করে (বুটস্ট্র্যাপ নমুনার সংখ্যার সাথে একত্রিত করে), তবে আপনি যদি যথেষ্ট পরিমাণে বুটস্ট্র্যাপ নমুনা ব্যবহার করেন তবে পদ্ধতিটি কার্যকর হবে।

আপনি যদি সত্যিই ননপ্যারামেট্রিক বুটস্ট্র্যাপ ব্যবহারের বিষয়গুলি খুঁজতে চান তবে এখানে দুটি সমস্যা রয়েছে:

(1) পুনরায় মডেল সহ সমস্যাগুলি।

ছোট বা বড় নমুনাগুলির জন্য বুটস্ট্র্যাপের অন্যতম সমস্যা হ'ল পুনর্নির্মাণের পদক্ষেপ। নমুনার কাঠামো (নির্ভরতা, অস্থায়ী, ...) রাখার সময় পুনরায় নমুনা দেওয়া সম্ভব হয় না। এর উদাহরণ হ'ল একটি সুপারপোজড প্রক্রিয়া

মনে করুন যে প্রতিটি সময়েই বিভিন্ন সংখ্যক স্বতন্ত্র উত্স রয়েছে যা সময়ে সময়ে ঘটে থাকে। যে কোনও একটি উত্সে ক্রমাগত ইভেন্টগুলির মধ্যে অন্তরগুলি সমস্ত একই ডিস্ট্রিবিউশনের সাথে স্বতন্ত্র র্যান্ডম ভেরিয়েবল হিসাবে ধরে নেওয়া হয়, যাতে প্রতিটি উত্স একটি পরিচিত ধরণের পুনর্নবীকরণ প্রক্রিয়া গঠন করে। উত্সগুলির আউটপুটগুলি একটি পোল্ড আউটপুটে মিলিত হয়।

নির্ভরতা অজানা কাঠামো রেখে আপনি কীভাবে পুনরায় নমুনা পাবেন ?

(২) ছোট নমুনাগুলির জন্য সংকীর্ণ বুটস্ট্র্যাপ নমুনা এবং বুটস্ট্র্যাপের আত্মবিশ্বাসের বিরতি

ছোট নমুনাগুলিতে প্রতিটি উপস্থাপকের জন্য সর্বনিম্ন এবং সর্বাধিক অনুমানকগুলি একটি সংকীর্ণ বিরতি সংজ্ঞায়িত করতে পারে তবে কোনও আত্মবিশ্বাসের অন্তরগুলির ডান এবং বাম প্রান্তের পয়েন্টগুলি বেশ কয়েকটি মডেলগুলিতে খুব সংকীর্ণ হবে (যা ছোট নমুনা প্রদত্ত প্রতিরক্ষামূলক!)।

ধরুন যে , যেখানে এর হার। প্রোফাইল সম্ভাবনা ব্যবহার করে আপনি আনুমানিক আত্মবিশ্বাসের ব্যবধান (95% আনুমানিক আত্মবিশ্বাসের ব্যবধান 0.147-স্তরের প্রোফাইল সম্ভাবনার অন্তর) নিম্নলিখিত হিসাবে পেতে পারেন:λ > 0x1,x2Exp(λ)λ>0

set.seed(1)
x <- rexp(2,1)
# Maximum likelihood estimator
1/mean(x)

# Profile likelihood: provides a confidence interval with right-end point beyond the maximum inverse of the mean
Rp <- Vectorize(function(l) exp(sum(dexp(x,rate=l,log=T))-sum(dexp(x,rate=1/mean(x),log=T))))

curve(Rp,0,5)
lines(c(0,5),c(0.147,0.147),col="red")

এই পদ্ধতিটি থেকে অবিচ্ছিন্ন বক্ররেখা উত্পন্ন হয় যেখানে আপনি আত্মবিশ্বাসের ব্যবধানটি বের করতে পারেন। সর্বাধিক সম্ভাবনা অনুমানকারী হ'ল । পুনরায় মডেলিংয়ের মাধ্যমে, কেবলমাত্র তিনটি সম্ভাব্য মান রয়েছে যা আমরা এই অনুমানকারীটির জন্য পেতে পারি, যার সর্বাধিক এবং ন্যূনতম সংশ্লিষ্ট বুটস্ট্র্যাপের আত্মবিশ্বাসের অন্তরগুলির সীমা নির্ধারণ করে। এটি বৃহত বুটস্ট্র্যাপের নমুনাগুলির জন্যও অদ্ভুত লাগতে পারে (আপনি এই সংখ্যাটি বাড়িয়ে বেশি অর্জন করতে পারেন না):λ = 2 / ( এক্স 1 + + এক্স 2 )λλ^=2/(x1+x2)

library(boot)
set.seed(1)
x <- rexp(2,1)
1/mean(x)
# Bootstrap interval: limited to the maximum inverse of the mean
f.boot <- function(data,ind) 1/mean(data[ind])
b.b <- boot(data=x, statistic=f.boot, R=100000)
boot.ci(b.b, conf = 0.95, type = "all")
hist(b.b$t)

এই ক্ষেত্রে, এবং এর কাছাকাছি , বুটস্ট্র্যাপ বিতরণ যত সংক্ষিপ্ত হবে এবং ফলস্বরূপ সংক্ষিপ্ততর আস্থার ব্যবধান (যা আসল মান থেকে অনেক দূরে অবস্থিত হতে পারে)। এই উদাহরণটি বাস্তবে @ গ্রেগস্নো দ্বারা উপস্থাপিত উদাহরণের সাথে সম্পর্কিত, যদিও তার যুক্তি আরও অনুপ্রাণিত ছিল। আমি যে সীমাগুলির কথা উল্লেখ করেছি তা @ ওল্ফগ্যাং দ্বারা বিশ্লেষণ করা সমস্ত বুটস্ট্র্যাপ আত্মবিশ্বাসের অন্তরগুলির খারাপ কার্যকারিতা ব্যাখ্যা করে।x 2x1x2


6

বুটস্ট্র্যাপ পরীক্ষাগুলির নির্ভুলতা নিশ্চিত করে ছোট নমুনা আকারগুলিতে ভাল কাজ করে (উদাহরণস্বরূপ, নামমাত্র ০.০৫ তাত্পর্য স্তর পরীক্ষার প্রকৃত আকারের কাছাকাছি), তবে বুটস্ট্র্যাপ আপনাকে যাদুতে অতিরিক্ত শক্তি দেয় না । আপনার যদি একটি ছোট নমুনা থাকে, আপনার কাছে গল্পের শেষ শক্তি power

প্যারামেট্রিক (লিনিয়ার মডেল) এবং সেমিপ্রেমেট্রিক (জিইই) রিগ্রেশনগুলির ছোট ছোট নমুনা বৈশিষ্ট্য রয়েছে ... ছোট ছোট নমুনাগুলিতে দৃ standard় স্ট্যান্ডার্ড ত্রুটির প্রাক্কলনকে বাড়িয়ে তোলার কারণে প্যারামেট্রিক অনুমানের উপর বড় নির্ভরতার ফলস্বরূপ এটি পূর্ববর্তী। বুটস্ট্র্যাপিং (এবং অন্যান্য পুনরায় মডেলিং ভিত্তিক পরীক্ষাগুলি) সেই পরিস্থিতিতে সত্যিই দুর্দান্ত সম্পাদন করে ।

পূর্বাভাসের জন্য, বুটস্ট্র্যাপিং আপনাকে বিভক্ত নমুনার বৈধতার চেয়ে অভ্যন্তরীণ বৈধতার আরও ভাল (আরও সৎ) অনুমান দেবে।

বুটস্ট্র্যাপিং প্রায়শই বার অবিচ্ছিন্নভাবে গড় অবোধের পদ্ধতি / হটডেকিং সংশোধন করার ফলস্বরূপ আপনাকে কম শক্তি দেয় (যেমন অস্পষ্ট মেলানো)। বিশ্লেষণী ডেটাসেটের চেয়ে বৃহত্তর সহ বুটস্ট্র্যাপযুক্ত ম্যাচিং ডেটাসেট প্রদান করে, পর্যাপ্ত ক্লাস্টারের আকার পূরণের জন্য ব্যক্তিদের পুনরায় তৈরি করা হয়েছিল এমন ম্যাচ বিশ্লেষণগুলিতে আরও শক্তি দেওয়ার জন্য বুটস্ট্র্যাপিং ভুলভাবে তৈরি করা হয়েছে ।n


2
(যেমন নমুনা 0.05 তাত্পর্য স্তর পরীক্ষার প্রকৃত আকারের নিকটবর্তী), - তবে উপরের আর কোডে আমরা কেবল দেখেছি বুটস্ট্র্যাপ পরীক্ষার আকার সংরক্ষণ করে না, তাই না?
জেমস

আমি দেখতে পাচ্ছি আপনি গ্রেগ স্নো প্রদত্ত উত্তরটি উল্লেখ করছেন। আমি ফলাফল দ্বারা অবাক হয়েছিল। আমার আমার তথ্যগুলি পুনরায় পরীক্ষা করা উচিত এবং আমার উত্তরটি সম্পাদনা করতে হবে। ধন্যবাদ।
অ্যাডমো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.