আমরা কি বুটস্ট্র্যাপের নমুনাগুলি ব্যবহার করতে পারি যা মূল নমুনার চেয়ে ছোট?


12

আমি এন = 250 ফার্ম এবং টি = 50 মাসের সাথে প্যানেল ডেটাসেট থেকে অনুমান পরামিতিগুলির জন্য আত্মবিশ্বাসের ব্যবধানগুলি অনুমান করতে বুটস্ট্র্যাপিং ব্যবহার করতে চাই। কলম্যান ফিল্টারিং এবং জটিল ননলাইনার অনুমানের কারণে পরামিতিগুলির অনুমান গণনামূলকভাবে ব্যয়বহুল (গণনার কয়েক দিন)। সুতরাং আসল নমুনা থেকে এম = এন = 250 ফার্মগুলির নমুনা (প্রতিস্থাপন সহ) বি (কয়েকশো বা তার বেশি) নমুনাগুলি এবং বি প্যারামিটারগুলির বার সময় নির্ণয় করা গণনার ক্ষেত্রে অপরিহার্য, যদিও এটি বুটস্ট্র্যাপিংয়ের প্রাথমিক পদ্ধতি।

সুতরাং আমি বুটস্ট্র্যাপের নমুনার (ছোট এন = 250 এর চেয়ে বেশি আকারের চেয়ে) ছোট এম (উদাহরণস্বরূপ) ব্যবহার করার কথা ভাবছি, মূল সংস্থাগুলি থেকে প্রতিস্থাপনের সাথে এলোমেলোভাবে আঁকা, এবং তারপরে মডেল প্যারামিটারগুলির বুটস্ট্র্যাপ-আনুমানিক কোভারিয়েন্স ম্যাট্রিক্সকে দিয়ে স্কেল করব on (উদাহরণস্বরূপ উপরে 1/5 দ্বারা) সম্পূর্ণ নমুনার উপর ভিত্তি করে মডেল পরামিতিগুলির জন্য কোভেরিয়েন্স ম্যাট্রিক্স গণনা করতে।1NM

পছন্দসই আত্মবিশ্বাসের বিরতিগুলি তখন স্বাভাবিকতা অনুমানের উপর ভিত্তি করে, বা অনুরূপ পদ্ধতি ব্যবহার করে ছোট আকারের নমুনার জন্য অভিজ্ঞজনিত (উদাহরণস্বরূপ of ।1NM

এই কর্মপরিকল্পনা কি কোনও অর্থপূর্ণ? এটি ন্যায়সঙ্গত করার জন্য কি তাত্ত্বিক ফলাফল রয়েছে? এই চ্যালেঞ্জ মোকাবেলায় বিকল্প?

উত্তর:


4

এই প্রশ্নটি অনেক আগে জিজ্ঞাসা করা হয়েছিল, তবে ভবিষ্যতে কেউ যদি এটি আবিষ্কার করে তবে আমি একটি প্রতিক্রিয়া পোস্ট করছি। সংক্ষেপে, উত্তর হবে হ্যাঁ: আপনি অনেক সেটিংসে এই কাজ করতে পারেন, এবং আপনার দ্বারা নমুনা আকার পরিবর্তনের জন্য সংশোধন ধার্মিক প্রতিপন্ন হয়েছ। এই পদ্ধতির সাধারণত আউট অফ বুস্ট্র্যাপ বলা হয় এবং এটি বেশিরভাগ সেটিংসে কাজ করে যা `` প্রথাগত '' 'বুটস্ট্র্যাপ করে, পাশাপাশি কিছু সেটিংসেও এটি কার্যকর হয় না।MNMN

এর কারণ হ'ল অনেক বুটস্ট্র্যাপের ধারাবাহিকতা যুক্তিগুলি ফর্ম অনুমানকারী ব্যবহার করে , যেখানে এলোমেলো পরিবর্তনশীল এবং এর কিছু প্যারামিটার অন্তর্নিহিত বিতরণ। উদাহরণস্বরূপ, নমুনা গড়ের জন্য, এবং ।1N(TNμ)X1,,XNμTN=1Ni=1NXiμ=E(X1)

অনেকগুলি বুটস্ট্র্যাপের ধারাবাহিকতার প্রমাণ যুক্ত করে যে হিসাবে কিছু সীমাবদ্ধ নমুনা দেওয়া হয়েছে এবং সম্পর্কিত পয়েন্ট অনুমান , যেখানে সত্য অন্তর্নিহিত বন্টন থেকে টানা হয় এবং থেকে প্রতিস্থাপন সঙ্গে টানা হয় ।N{x1,,xN}μ এন = টি এন ( এক্স 1 , ... , x এন ) μ^N=TN(x1,,xN)

(1)N(TN(X1,,XN)μ^N)DN(TN(X1,,XN)μ)
XiXi{x1,,xN}

তবে, আমরা দৈর্ঘ্যের সংক্ষিপ্ততর নমুনাগুলিও ব্যবহার করতে পারি এবং অনুমানকারী এটা পরিনত হয় যে, যেমন , মূল্নির্ধারক ( ) আছে সবচেয়ে সেটিংসে যেখানে (উপরে হিসাবে একই সীমিত বন্টন গুলি ) ঝুলিতে এবং কিছু যেখানে এটি না। এই ক্ষেত্রে, ( ) এবং ( ) একই সীমাবদ্ধ বন্টন রয়েছে, সংশোধন ফ্যাক্টরকে অনুপ্রাণিত করে eg যেমন নমুনা স্ট্যান্ডার্ড বিচ্যুতি।M<N

(2)M(TM(X1,,XM)μ^N).
M,N2112MN

এই যুক্তিগুলি সমস্ত অ্যাসিপোটোটিক এবং কেবল সীমাতে থাকে । এটি কাজ করার জন্য, খুব ছোট বাছাই করা গুরুত্বপূর্ণ নয় । সর্বোত্তম তাত্ত্বিক ফলাফল পাওয়ার জন্য কার্যকারিতা হিসাবে কীভাবে সর্বোত্তম বেছে নেওয়া যায় সে সম্পর্কে কিছু তত্ত্ব রয়েছে (যেমন নীচে বিকেল এবং সাকভ) তবে আপনার ক্ষেত্রে গণ্য সংস্থানগুলি সিদ্ধান্ত গ্রহণকারী কারণ হতে পারে।M,NM MN

কিছুটা জন্য: অনেক ক্ষেত্রে আমাদের হিসাবে , যাতে এবং সাথে বুটস্ট্র্যাপের বাইরে কিছুটা মতো ভাবা যেতে পারে (স্বরলিপি বিভ্রান্তি এড়াতে আমি ছোট ব্যবহার করছি) )। এইভাবে, সাথে বুটস্ট্র্যাপের আউট ব্যবহার করে ( ) বিতরণ অনুকরণ করা প্রথাগত ( বাইরে চেয়ে আরও বেশি `` সঠিক '' কাজμ^NDμN

(3)N(TN(X1,,XN)μ),
mnm=Nn=এমএনএম<এনএনএন3MNM<NNN) ধরনের। আপনার ক্ষেত্রে একটি যুক্ত বোনাস হ'ল এটি মূল্যায়ন করার জন্য কম কম্পিউটেশনাল ব্যয়বহুল।

আপনি যেমন উল্লেখ করেছেন, পলিটাইটিস এবং রোমানো মূল কাগজ। আমি বুটস্ট্র্যাপের বাইরে এর একটি সুন্দর ওভারভিউয়ের নীচে বিকেল এট আল (1997) পাই ।MN

সূত্র :

পি জে বিকেল, এফ গয়েটজি, ডাব্লুআর ভ্যান জায়েট। 1997. পর্যবেক্ষণের চেয়ে কম পুনর্নির্মাণ : লাভ, ক্ষতি এবং ক্ষতির প্রতিকার। স্ট্যাটিস্টিক সিনিকা।n

পিজে বিকেল, এ সাকভ। 2008 পছন্দের উপর মধ্যে এর ouf চরম জন্য বুটস্ট্র্যাপ ও আস্থা সীমা। স্ট্যাটিস্টিক সিনিকা।mmn


3

বিষয়টিতে আরও পড়ার পরে, মনে হয় "সাব-স্যাম্পলিং" এর অধীনে প্রতিষ্ঠিত তত্ত্বটি এই ধরণের আত্মবিশ্বাসের অন্তর্বর্তী অনুমানটি করার অনুমতি দেয়। মূল উল্লেখটি হ'ল "পলিটাইটিস, ডিএন; রোমানো, জেপি (1994) min

এন এম প্রাথমিক তথ্য পয়েন্টগুলি (আমার ক্ষেত্রে ধারাবাহিক) থেকে প্রতিটি নমুনার জন্য এম <এন এন আকারের নমুনা "প্রতিস্থাপন ছাড়াই" (তবে বি আকারের বিভিন্ন নমুনা জুড়ে প্রতিস্থাপনের সাথে) আঁকতে হবে এবং এর আত্মবিশ্বাসের ব্যবধানটি অনুমান করা হবে এই নমুনাগুলি এবং সাধারণ বুটস্ট্র্যাপ পদ্ধতি ব্যবহার করে আগ্রহের প্যারামিটার। তারপরে এম এর পরিবর্তনের সাথে প্যারামিটারের অন্তর্নিহিত বিতরণের পরিবর্তনের পরিবর্তনের হারের উপর ভিত্তি করে আত্মবিশ্বাসের ব্যবস্থাকে স্কেল করুন যে হারটি প্রচলিত সেটিংসে 1 / এম, তবে আমরা যদি কিছু আলাদা এম দিয়ে পদ্ধতিটি পুনরাবৃত্তি করি তবে অনুমিতভাবে অনুমান করা যেতে পারে মান এবং আন্ত-পারসেন্টাইল রেঞ্জগুলির আকারের পরিবর্তনগুলি দেখুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.