প্রথমত: আমি যা বুঝতে পেরেছি সেগুলি থেকে বুটস্ট্র্যাপিং অবশিষ্টাংশগুলি নিম্নলিখিত হিসাবে কাজ করে:
- ডেটা মাপসই মডেল
- অবশিষ্টগুলি গণনা করুন
- অবশিষ্টগুলি পুনরায় নমুনা করুন এবং তাদের 1 এ যুক্ত করুন।
- 3 থেকে নতুন ডেটাসেটে মডেল ফিট করুন।
- পুনরাবৃত্তি
n
বার করুন, কিন্তু সর্বদা 1 থেকে পুনরায় সজ্জিত অবশিষ্টাংশ যুক্ত করুন।
এখনও কি এটি সঠিক?
আমি যা করতে চাই তা কিছুটা আলাদা:
আমি একটি অ্যালগরিদমের জন্য প্যারামিটার এবং পূর্বাভাসের অনিশ্চয়তা অনুমান করতে চাই যা কিছু পরিবেশগত পরিবর্তনশীল অনুমান করে।
আমার কাছে যা আছে তা হ'ল সেই ভেরিয়েবলের একটি ত্রুটি-মুক্ত টাইম-সিরিজ (একটি সিমুলেশন থেকে) , যাতে একটি সিন্থেটিক ডেটাসেট উত্পন্ন করার জন্য x_true
আমি কিছুটা আওয়াজ যোগ করি । আমি তারপরে আমার অ্যালগরিদমকে একটি বুনিয়াদি ফাংশন হিসাবে স্কোয়ারের যোগফল (! না !) দিয়ে ফিট করে সর্বোত্তম পরামিতিগুলি সন্ধান করার চেষ্টা করি । আমার অ্যালগরিদম কীভাবে সম্পাদন করে তা দেখতে এবং আমার পরামিতিগুলির বিতরণের নমুনা তৈরি করতে, আমি পুনরায় নমুনা দিতে চাই , এতে যুক্ত করতে , আমার মডেলটিকে আবার ফিট করতে, ধুয়ে ফেলতে এবং পুনরাবৃত্তি করতে চাই। প্যারামিটারের অনিশ্চয়তা মূল্যায়ন করার জন্য এটি কি বৈধ পদ্ধতির? আমি কি বুটস্ট্র্যাপড ডেটাসেটগুলির ফিটগুলি ব্যাখ্যার অনিশ্চয়তা হিসাবে ব্যাখ্যা করতে পারি, বা আমার উপরে পোস্ট করা পদ্ধতিটি অনুসরণ করতে হবে?x_noise
x
sum((x_estimate - x_true)^2)
x_estimate - x
x_noise
x_true
/ সম্পাদনা: আমি মনে করি আমার মডেল কী করে তা আমি সত্যিই পরিষ্কার করে দেখিনি। এটিকে মূলত একটি ডি-শাইনিং পদ্ধতির মতো ভাবেন। এটি কোনও ভবিষ্যদ্বাণীমূলক মডেল নয়, এটি একটি অ্যালগরিদম যা পরিবেশের উপাত্তগুলির শোরগোল সময়-সিরিজের অন্তর্নিহিত সংকেতটি বের করার চেষ্টা করে।
/ সম্পাদনা করুন ^ 2: সেখানে ম্যাটল্যাব-ব্যবহারকারীদের জন্য , আমি কী বোঝাতে চাইছি তার জন্য কিছু দ্রুত এবং নোংরা লিনিয়ার রিগ্রেশন উদাহরণ লিখেছি।
এটিই আমি বিশ্বাস করি যে অবশিষ্টাংশগুলির "সাধারণ" বুটস্ট্র্যাপিং হ'ল (আমি ভুল হলে দয়া করে আমাকে সংশোধন করুন): http://pastebin.com/C0CJp3d1
এটিই আমি করতে চাই: http://pastebin.com/mbapsz4c