প্রথমত: আমি যা বুঝতে পেরেছি সেগুলি থেকে বুটস্ট্র্যাপিং অবশিষ্টাংশগুলি নিম্নলিখিত হিসাবে কাজ করে:
- ডেটা মাপসই মডেল
- অবশিষ্টগুলি গণনা করুন
- অবশিষ্টগুলি পুনরায় নমুনা করুন এবং তাদের 1 এ যুক্ত করুন।
- 3 থেকে নতুন ডেটাসেটে মডেল ফিট করুন।
- পুনরাবৃত্তি
nবার করুন, কিন্তু সর্বদা 1 থেকে পুনরায় সজ্জিত অবশিষ্টাংশ যুক্ত করুন।
এখনও কি এটি সঠিক?
আমি যা করতে চাই তা কিছুটা আলাদা:
আমি একটি অ্যালগরিদমের জন্য প্যারামিটার এবং পূর্বাভাসের অনিশ্চয়তা অনুমান করতে চাই যা কিছু পরিবেশগত পরিবর্তনশীল অনুমান করে।
আমার কাছে যা আছে তা হ'ল সেই ভেরিয়েবলের একটি ত্রুটি-মুক্ত টাইম-সিরিজ (একটি সিমুলেশন থেকে) , যাতে একটি সিন্থেটিক ডেটাসেট উত্পন্ন করার জন্য x_trueআমি কিছুটা আওয়াজ যোগ করি । আমি তারপরে আমার অ্যালগরিদমকে একটি বুনিয়াদি ফাংশন হিসাবে স্কোয়ারের যোগফল (! না !) দিয়ে ফিট করে সর্বোত্তম পরামিতিগুলি সন্ধান করার চেষ্টা করি । আমার অ্যালগরিদম কীভাবে সম্পাদন করে তা দেখতে এবং আমার পরামিতিগুলির বিতরণের নমুনা তৈরি করতে, আমি পুনরায় নমুনা দিতে চাই , এতে যুক্ত করতে , আমার মডেলটিকে আবার ফিট করতে, ধুয়ে ফেলতে এবং পুনরাবৃত্তি করতে চাই। প্যারামিটারের অনিশ্চয়তা মূল্যায়ন করার জন্য এটি কি বৈধ পদ্ধতির? আমি কি বুটস্ট্র্যাপড ডেটাসেটগুলির ফিটগুলি ব্যাখ্যার অনিশ্চয়তা হিসাবে ব্যাখ্যা করতে পারি, বা আমার উপরে পোস্ট করা পদ্ধতিটি অনুসরণ করতে হবে?x_noisexsum((x_estimate - x_true)^2)x_estimate - xx_noisex_true
/ সম্পাদনা: আমি মনে করি আমার মডেল কী করে তা আমি সত্যিই পরিষ্কার করে দেখিনি। এটিকে মূলত একটি ডি-শাইনিং পদ্ধতির মতো ভাবেন। এটি কোনও ভবিষ্যদ্বাণীমূলক মডেল নয়, এটি একটি অ্যালগরিদম যা পরিবেশের উপাত্তগুলির শোরগোল সময়-সিরিজের অন্তর্নিহিত সংকেতটি বের করার চেষ্টা করে।
/ সম্পাদনা করুন ^ 2: সেখানে ম্যাটল্যাব-ব্যবহারকারীদের জন্য , আমি কী বোঝাতে চাইছি তার জন্য কিছু দ্রুত এবং নোংরা লিনিয়ার রিগ্রেশন উদাহরণ লিখেছি।
এটিই আমি বিশ্বাস করি যে অবশিষ্টাংশগুলির "সাধারণ" বুটস্ট্র্যাপিং হ'ল (আমি ভুল হলে দয়া করে আমাকে সংশোধন করুন): http://pastebin.com/C0CJp3d1
এটিই আমি করতে চাই: http://pastebin.com/mbapsz4c