বায়েশীয় দৃষ্টিকোণ থেকে বুটস্ট্র্যাপটির ব্যাখ্যা করা সম্ভব?


43

ঠিক আছে, এটি এমন একটি প্রশ্ন যা আমাকে রাতে রাখে।

বুটস্ট্র্যাপ পদ্ধতিটি কিছু বায়েশিয়ান পদ্ধতি (বায়েসিয়ান বুটস্ট্র্যাপ ব্যতীত) আনুমানিক হিসাবে ব্যাখ্যা করা যেতে পারে?

আমি পরিসংখ্যানগুলির বাইয়েশিয়ান "ব্যাখ্যা" সত্যিই পছন্দ করি যা আমি সুন্দরভাবে সুসংগত এবং সহজে বুঝতে পারি। তবে বুটস্ট্র্যাপ পদ্ধতিতে আমারও দুর্বলতা রয়েছে যা এত সহজ, তবুও অনেক পরিস্থিতিতে যুক্তিসঙ্গত তথ্য সরবরাহ করে। আমি তবে বুটস্ট্র্যাপিংয়ের সাথে আরও খুশি হব, তবে যদি আমি জানতাম যে বুটস্ট্র্যাপ কোনও অর্থে উত্তরোত্তর বিতরণের কাছাকাছি চলেছে।

আমি "বয়েসিয়ান বুটস্ট্র্যাপ" (রুবিন, 1981) সম্পর্কে জানি, তবে আমার দৃষ্টিতে বুটস্ট্র্যাপের সংস্করণটি স্ট্যান্ডার্ড বুটস্ট্র্যাপের মতোই সমস্যাযুক্ত matic ক্লাসিকাল এবং বায়সিয়ান বুটস্ট্র্যাপ করার সময় সমস্যাটি হ'ল সত্যই অদ্ভুত মডেল অনুমান যা আপনি ইতিমধ্যে দেখেছেন এমন মানগুলিই বন্টনের সম্ভাব্য মানগুলি। এই অদ্ভুত মডেল অনুমানগুলি এখনও কীভাবে খুব যুক্তিসঙ্গত সূচনা পেতে পারে যা বুটস্ট্র্যাপ পদ্ধতিগুলি দেয়? আমি এমন নিবন্ধগুলি সন্ধান করছি যা বুটস্ট্র্যাপের বৈশিষ্ট্যগুলি তদন্ত করেছে (উদাঃ ওয়েং, 1989) তবে আমি এর সাথে সুখী এমন কোনও পরিষ্কার ব্যাখ্যা পাইনি।

তথ্যসূত্র

ডোনাল্ড বি রুবিন (1981)। বায়েশিয়ান বুটস্ট্র্যাপ। অ্যান। পরিসংখ্যানবিৎ। খণ্ড 9, সংখ্যা 1, 130-134।

চুং-সিং ওয়েং (1989)। বায়েসিয়ান বুটস্ট্র্যাপ গড়ের দ্বিতীয়-আদেশের এ্যাসিম্পোটিক সম্পত্তি। পরিসংখ্যানগুলির অ্যানালস , খণ্ড। 17, নং 2, পিপি 705-710।


3
আমি সবেমাত্র "বায়েশিয়ান মডেল হিসাবে বুটস্ট্র্যাপ" ( sumsar.net/blog/2015/04/… ) এ একটি ব্লগ পোস্ট লিখেছি যা বুটস্ট্র্যাপের বায়েশিয়ান "ব্যাখ্যা" আবিষ্কার করে। এটি উপরের প্রশ্নের সরাসরি উত্তর দেয় না তবে আমি আশা করি এটি বুটস্ট্র্যাপ কী এবং এটি কী করে তা আরও পরিষ্কার করে দেয়।
রাসমুস বুথ

মুলিয়ার এবং সেকচি (1996) বেইসিয়ান ননপ্যারমেট্রিকের ভবিষ্যদ্বাণীমূলক অনুমান এবং বুটস্ট্র্যাপ কৌশলগুলি পড়ুন। ঠিক ঠিক আপনার কথা ঠিকানা!

উত্তর:


30

হস্টি, তিবশিরানী এবং ফ্রেডম্যানের স্ট্যাটাসটিকাল লার্নিংয়ের উপাদানসমূহের 8.4 বিভাগ হ'ল "বুটস্ট্র্যাপ এবং বায়সিয়ান ইনফারেন্সের মধ্যে সম্পর্ক"। এটি আপনি যা খুঁজছেন ঠিক তেমনই হতে পারে। আমি বিশ্বাস করি যে এই বইটি একটি স্ট্যানফোর্ড ওয়েবসাইটের মাধ্যমে অবাধে উপলভ্য, যদিও আমার কাছে লিঙ্কটি হাতে নেই।

সম্পাদনা:

এখানে বইটির একটি লিঙ্ক দেওয়া হয়েছে, যা লেখকরা অনলাইনে অনলাইনে উপলব্ধ করেছেন:

http://www-stat.stanford.edu/~tibs/ElemStatLearn/

পৃষ্ঠা 272 এ, লেখকরা লিখেছেন:

এই অর্থে, বুটস্ট্র্যাপ বিতরণটি আমাদের প্যারামিটারের জন্য একটি (আনুমানিক) ননপ্যারমেট্রিক, নন-ইনফর্মটিভ পোস্টেরিয়র বিতরণ উপস্থাপন করে। তবে এই বুটস্ট্র্যাপ বিতরণটি বেদাহীনভাবে প্রাপ্ত হয় - আনুষ্ঠানিকভাবে কোনও পূর্বের নির্দিষ্ট করে না রেখে এবং উত্তরোত্তর বিতরণ থেকে নমুনা না নিয়ে। সুতরাং আমরা বুটস্ট্র্যাপ বিতরণটিকে "দরিদ্র লোক" বেয়েস উত্তরোত্তর হিসাবে ভাবতে পারি। ডেটাটিবার্বিংয়ের মাধ্যমে, বুটস্ট্র্যাপটি প্যারামিটারগুলিকে নষ্ট করার বায়েশিয়ান প্রভাবটিকে প্রায় অনুমান করে এবং সাধারণত সম্পাদন করা খুব সহজ।

ধাঁধাটির আরও একটি টুকরো এই ক্রস বৈধতাযুক্ত প্রশ্নের মধ্যে পাওয়া যায় যা দ্বোরেটজকি – কিফার – ওল্ফোভিটস অসমতার উল্লেখ করে যে "দেখায় [...] যে অভিজ্ঞতা অভিজ্ঞতা বিতরণ ফাংশনটি তাত্পর্যপূর্ণভাবে দ্রুত তাত্পর্যপূর্ণভাবে দ্রুত বিতরণ ফাংশনে রূপান্তরিত করে।"

সুতরাং সমস্ত নন-প্যারাম্যাট্রিক বুটস্ট্র্যাপকে এমন একটি অ্যাসিম্পটোটিক পদ্ধতি হিসাবে দেখা যেতে পারে যা আমাদের প্যারামিটারের জন্য "একটি (আনুমানিক) ননপ্যারমেট্রিক, ননফর্মেন্টিভ পোস্টেরিয়র ডিস্ট্রিবিউশন" উত্পাদন করে এবং যেখানে নমুনার সংখ্যা বাড়ার সাথে সাথে এই সান্নিধ্য আরও ভাল "তাত্ক্ষণিকভাবে দ্রুত" হয়)।


3
যদিও আমরা প্রাসঙ্গিক উপাদানের রেফারেন্সকে সর্বদা প্রশংসা করি, এই বিভাগটির সংক্ষিপ্তসার অন্তর্ভুক্ত করা গেলে এই উত্তরটি আরও উন্নত হবে greatly
কার্ডিনাল

1
বিভাগটি থেকে শেষ বিটটি আরও কার্যকর হতে পারে: বুটস্ট্র্যাপ আনুমানিক প্যারামিটারের জন্য আনুমানিক অ-প্যারামিট্রিক, অ-তথ্যমূলক পোস্টেরিয়র বিতরণ। পুরো বিভাগটি পড়ার মতো।
ফ্রেইজো

2
লিঙ্কের জন্য ধন্যবাদ! আমি যদি হাসতি এট পড়ি। ঠিক তারা নন-প্যারাম্যাট্রিক বুস্ট্র্যাপ এবং বায়েসিয়ান বুটস্ট্র্যাপের মধ্যে একটি চিঠিপত্র দেখায় এবং দাবি করে যে প্রাক্তনটি পরবর্তীটির প্রায় নিকটবর্তী হয়। বুটস্ট্র্যাপ কেন (বেয়েসিয়ান বা না) প্রথম স্থানে বোধগম্য ফলাফলের ফলাফল দেয় সে সম্পর্কে তারা বেশি কিছু লেখেন না। আমি যা প্রত্যাশা করেছিলাম তা এরকম ছিল: "[কিছু সাধারণ পরিস্থিতিতে] বুটস্ট্র্যাপ প্যারামিটার / পরিসংখ্যানের সত্যিকারের উত্তরোত্তর বিতরণকে একটি ত্রুটিযুক্ত [কিছু] এবং এটি [এটি এবং এটি]" এর উপর নির্ভর করে।
রাসমুস বুথ

আমার উত্তর উন্নত করতে সাহায্য করার জন্য ধন্যবাদ। বুটস্ট্র্যাপ কেন কাজ করে তার জন্য আমি যে স্পষ্ট ব্যাখ্যাটি শুনেছি তা হ'ল আপনি যে নমুনাটি সবেমাত্র সংগ্রহ করেছেন তা হ'ল সামগ্রিক জনসংখ্যার আপনার সেরা উপস্থাপনা। তবে আমি এটিকে আরও আনুষ্ঠানিকভাবে বলার মতো কোনও সম্ভাব্য ব্যক্তির পক্ষে যথেষ্ট নয়।
এডিএম

যদি আমি মনে করি, তারা এই যুক্তিটি তৈরি করে, একটি এনএন বুটস্ট্র্যাপ করে এবং র‌্যাডফোর্ড নীল দ্বারা সম্পূর্ণ বয়েশিয়ান এনএন দ্বারা কবর দেওয়া হয়। আমি মনে করি যে এটি কিছু বলেছে, যদিও নিশ্চিত তা নয়।
লোক

3

এটি এই বিষয়ে আমি সর্বশেষতম কাগজটি দেখেছি:

@article{efr13bay,
author={Efron, Bradley},
title={Bayesian inference and the parametric bootstrap},
journal={Annals of Applied Statistics},
volume=6,
number=4,
pages={1971-1997},
year=2012,
doi={10.1214/12-AOAS571},
abstract={Summary: The parametric bootstrap can be used for the efficient
    computation of Bayes posterior distributions. Importance sampling formulas
    take on an easy form relating to the deviance in exponential families and
    are particularly simple starting from Jeffreys invariant prior. Because of
    the i.i.d. nature of bootstrap sampling, familiar formulas describe the
    computational accuracy of the Bayes estimates. Besides computational
    methods, the theory provides a connection between Bayesian and frequentist
    analysis. Efficient algorithms for the frequentist accuracy of Bayesian
    inferences are developed and demonstrated in a model selection example.},
keywords={Jeffreys prior; exponential families; deviance; generalized linear
    models},
classmath={*62F15 (Bayesian inference)
62F40 (Resampling methods)
62J12 (Generalized linear models)
65C60 (Computational problems in statistics)}}

2
আমার কাগজটির ব্যাখ্যাটি হ'ল এটি নির্দিষ্ট মডেলের উত্তরোত্তর বিতরণ গণনার জন্য একটি বুটস্ট্র্যাপ পদ্ধতি বর্ণনা করে, এটি একটি পদ্ধতি যা উদাহরণস্বরূপ মহানগরীর নমুনার পরিবর্তে ব্যবহার করা যেতে পারে। আমি দেখতে পাচ্ছি না যে কাগজটি নন-প্যারামেট্রিক বুটস্ট্র্যাপ মডেল অনুমান এবং বায়েশিয়ান অনুমানের মধ্যে সংযোগ নিয়ে আলোচনা করেছে ...
রাসমাস বুথ

1
এটি যে দাবি করে না। আমি বিস্তারিত কাগজ পড়িনি।
ফ্র্যাঙ্ক হ্যারেল

5
ফ্রাঙ্ক: আমি ইফ্রন দ্বারা এই কাগজটি পড়তে খুব বেশি কিছু পাইনি - তিনি যা করেন তা কেবল একটি অনুক্রমিক গুরুত্বের নমুনা হিসাবে দেখা যেতে পারে যা সম্ভাবনা থেকে শুরু হয় এবং উত্তরের দিকে যাওয়ার চেষ্টা করে (যা প্রায়শই কাজ করবে)। 1981-র গবেষণাপত্রে রুবিনের উদ্দেশ্য ছিল বুটস্ট্র্যাপের যথাযথতা নিয়ে প্রশ্ন তোলা কিন্তু এফ্রনের দৃশ্যত বিপরীত দৃষ্টিভঙ্গি পৌঁছেছিল। ডেভিড ড্রাগার এই গ্রীষ্মটি তার জেএসএম কোর্সে এটি পুনরুদ্ধার করেছিলেন এবং নমুনায় আপনি বেশিরভাগ সম্ভাবনা দেখতে পান তবে ব্যতীত শেষ করেছেন। তবে এখানে দেখুন normaldeviate.wordpress.com/2013/06/12/…
ফ্যানেরন

1

আমিও বুটস্ট্র্যাপিং এবং বয়েসের উপপাদ্য উভয়ের দ্বারা প্রলুব্ধ হয়েছি, তবে আমি বায়েশিয়ার দৃষ্টিকোণ থেকে না তাকানো পর্যন্ত বুটস্ট্র্যাপিংয়ের ন্যায্যতার বিষয়ে খুব একটা ধারণা করতে পারি না। তারপরে - যেমন আমি নীচে ব্যাখ্যা করছি - বুটস্ট্র্যাপ বিতরণটি একটি বয়েসিয়ান উত্তরোত্তর বিতরণ হিসাবে দেখা যেতে পারে, যা বুটস্ট্র্যাপিংয়ের পিছনে (ক?) যুক্তিটি সুস্পষ্ট করে তোলে এবং অনুমানগুলি স্পষ্ট করার সুবিধাও ছিল। Https://arxiv.org/abs/1803.06214 (পৃষ্ঠা 22-26) এ নীচে যুক্তি এবং অনুমানগুলি সম্পর্কে আরও বিশদ রয়েছে ।

উদাহরণ হিসাবে, যা http://woodm.myweb.port.ac.uk/SL/resample.xlsx এ স্প্রেডশিটে সেট আপ করা হয়েছে (স্ক্রিনের নীচে বুটস্ট্র্যাপ ট্যাবে ক্লিক করুন), ধরুন আমরা পেয়েছি 60০ টির সাথে 9 টি পরিমাপের একটি নমুনা I আমি যখন এই নমুনাটি প্রতিস্থাপনের সাথে 1000 টি রেসপন্স তৈরি করতে স্প্রেডশিটটি ব্যবহার করেছি এবং এর মাধ্যমটি নিকটতম এমনকি সমান সংখ্যায় পেয়েছি, তখন এর মধ্যে 82 টির 54 টি ছিল boot বুটস্ট্র্যাপিংয়ের ধারণাটি হ'ল আমরা "নমুনা" জনগণের হিসাবে নমুনাটি 9 এর নমুনার মাধ্যমগুলি কতটা পরিবর্তনশীল হতে পারে তা দেখতে ব্যবহার করুন, সুতরাং এটি পরামর্শ দেয় যে কোনও নমুনার সম্ভাবনা জনসংখ্যার নীচে 6 হওয়ার মানে (এই ক্ষেত্রে এর উপর ভিত্তি করে ভান করা জনসংখ্যা 60 এর গড় সহ নমুনা) 8.2%। এবং আমরা রিস্যাম্পলিং হিস্টোগ্রামের অন্যান্য বারগুলি সম্পর্কে একইরকম সিদ্ধান্তে আসতে পারি।

এখন আসুন কল্পনা করুন যে সত্যটি সত্যিকারের জনসংখ্যার গড় গড় 66 is জন। যদি এটি হয় তবে আমাদের নমুনার সম্ভাবনাটি অনুমান করার অর্থ being০ (অর্থাত্ ডেটা) হওয়ার কথাটি ৮.২% (মনে রাখার উপরের অনুচ্ছেদে উপসংহারটি ব্যবহার করে) যে 66০ জন অনুমানিত জনসংখ্যার গড় 60 66 এর নিচে।। এর হিসাবে এটি লিখুন

পি (ডেটা প্রদত্ত গড় = 66) = 8.2%

এবং এই সম্ভাবনাটি পুনরায় মডেলিং বিতরণে একটি এক্স মানের 54 এর সাথে মিলে যায়। একই ধরণের আর্গুমেন্ট 0, 2, 4 ... 100 থেকে প্রতিটি সম্ভাব্য জনসংখ্যার ক্ষেত্রে প্রযোজ্য each

এবার বেয়েসের উপপাদ্য প্রয়োগ করা যাক। প্রশ্নের পরিমাপটি কেবল 0 এবং 100 এর মধ্যে মান গ্রহণ করতে পারে, সুতরাং জনসংখ্যার সম্ভাবনাগুলি 0, 2, 4, 6, .... 100 এর নিকটতম এমনকি সমান সংখ্যায় গোল করে। যদি আমরা ধরে নিই যে পূর্বের বিতরণটি সমতল, তবে এর প্রত্যেকটির পূর্ববর্তী সম্ভাব্যতা 2% (থেকে 1 ডিপি) হয়, এবং বেয়েসের উপপাদ্য আমাদের বলে যে

পি (পপমিয়ান = 66 প্রদত্ত ডেটা) = 8.2% * 2% / পি (ডেটা)

কোথায়

পি (ডেটা) = পি (পপমিয়ান = 0 প্রদত্ত ডেটা) * 2% + পি (পপমিয়ান = 2 প্রদত্ত ডেটা) * 2% + ... + পি (পপমিয়ান = 100 প্রদত্ত ডেটা) * 2%

আমরা এখন ২% কে বাতিল করতে পারি এবং মনে রাখতে পারি যে সম্ভাবনার যোগফলগুলি অবশ্যই 1 হওয়া উচিত কারণ সম্ভাবনাগুলি কেবল পুনরায় মডেলিং বিতরণ থেকে। যা আমাদের এই সিদ্ধান্তে পৌঁছে দেয়

পি (PopMean = 66) = 8.2%

মনে রাখবেন যে 8.2% হ'ল 54 টি (distribution 66 এর পরিবর্তে) পুনরায় মডেলিং বিতরণ থেকে সম্ভাবনা, উত্তরোত্তর বিতরণ কেবলমাত্র নমুনাটির মানে (60০) প্রতিফলিত পুনরায় মডেলিং বিতরণ। তদ্ব্যতীত, যদি পুনরায় মডেলিং বিতরণ এই অর্থে যে অসম্পূর্ণতাগুলি এলোমেলোভাবে হয় - যেমন এটি এবং অন্যান্য অনেক ক্ষেত্রে রয়েছে, আমরা পুনরায় নমুনা বিতরণকে উত্তরীয় সম্ভাবনার বন্টনের অনুরূপ হিসাবে নিতে পারি।

এই যুক্তিটি বিভিন্ন অনুমান করে, মূলটি হ'ল পূর্ব বিতরণটি অভিন্ন। এগুলি উপরোক্ত উদ্ধৃত নিবন্ধে আরও বিশদে বর্ণিত।


বায়েশিয়ান বুটস্ট্র্যাপের মতো জিনিস রয়েছে যা রুবিনের দ্বারা প্রবর্তিত হয়েছিল। তবে আমি মনে করি না এটিই আপনি উল্লেখ করছেন। ইফ্রন প্রবর্তিত সাধারণ বুটস্ট্র্যাপটি আসলেই একটি ঘনত্ববাদী ধারণা।
মাইকেল চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.