"ইন-নমুনা" এবং "সিউডো-অফ-স্যাম্পল" পূর্বাভাসের মধ্যে পার্থক্য


12

নমুনা পূর্বাভাস এবং সিউডোর বাইরে নমুনা পূর্বাভাসের মধ্যে একটি সুস্পষ্ট পার্থক্য আছে কি ? উভয়ই পূর্বাভাসের মডেলগুলির মূল্যায়ন ও তুলনা প্রসঙ্গে।

উত্তর:


18

ধরুন আপনার কাছে ডেটা আছে , যেখানে এবং আপনার লক্ষ্য একটি মডেল তৈরি করা (বলুন , ) ভবিষ্যদ্বাণী করা দেওয়া । সংক্ষিপ্ততার জন্য, ধরুন ডেটা দৈনিক এবং আজকের সাথে মিলে।{ 1 , 2 , ... } , ( এক্স টি - ) ওয়াই টি এক্স টি - টি{Yt,Xth}t=h+1Th{1,2,},f^(Xth)YtXthT

ইন-স্যাম্পল বিশ্লেষণটির অর্থ পর্যন্ত এবং সমস্ত সহ উপলব্ধ সমস্ত ডেটা ব্যবহার করে মডেলটি অনুমান করা এবং তারপরে মডেলটির লাগানো মানগুলি প্রকৃত উপলব্ধির সাথে তুলনা করা। যাইহোক, এই পদ্ধতিটি মডেলটির পূর্বাভাস ক্ষমতাটির অত্যধিক আশাবাদী ছবি আঁকার জন্য পরিচিত, যেহেতু সাধারণ ফিটিং অ্যালগরিদমগুলি (যেমন স্কোয়ার ত্রুটি বা সম্ভাবনার মানদণ্ড ব্যবহার করে) বড় ভবিষ্যদ্বাণী ত্রুটিগুলি এড়ানোর জন্য ব্যথা গ্রহণ করে এবং এইভাবে অত্যধিক মানসিক চাপের প্রতি সংবেদনশীল - ভুল শব্দ তথ্য সংকেত জন্য।T

একটি সত্য- আজ অবধি এবং উপাত্তের ভিত্তিতে মডেলটি নির্ধারণ করা, আগামীকাল এর মান এর পূর্বাভাস তৈরি করা, আগামীকাল অপেক্ষা করুন, পূর্বাভাস ত্রুটিটি রেকর্ড করুন মডেলটির পুনরায় অনুমান করুন, এর একটি নতুন পূর্বাভাস তৈরি করুন এবং আরও অনেক কিছু। এই অনুশীলনের শেষে, একজনের পূর্বাভাসের ত্রুটির একটি নমুনা থাকবে যা সত্যই নমুনার বাইরে থাকবে এবং একটি বাস্তব চিত্র তুলে ধরবে মডেল এর অভিনয়। টি + + 1ওয়াই টি + + 1 - ( এক্স টি + + 1 - ) , ওয়াই টি + + 2 { টি + + } এল = 1YT+1টি+ +1ওয়াইটি+ +1-^(এক্সটি+ +1-),ওয়াইটি+ +2{টি+ +}=1এল

যেহেতু এই পদ্ধতিটি অত্যন্ত সময়সাপেক্ষ, তাই লোকেরা প্রায়শই "সিউডো" বা "সিমুলেটেড", নমুনা ছাড়াই বিশ্লেষণ অবলম্বন করে যার অর্থ শেষ অনুচ্ছেদে বর্ণিত পদ্ধতির নকল করা, কিছু date তারিখ ব্যবহার করে , আজকের তারিখের চেয়ে , প্রথম পয়েন্ট হিসাবে। ফলাফলের পূর্বাভাসের ত্রুটিগুলি এর পরে নমুনা পূর্বাভাসের ক্ষমতা অনুমান করার জন্য ব্যবহৃত হয়।টি { টি } টি টি = টি 0 + 1টি0<টিটি{টি}টি=টি0+ +1টি

নোট করুন যে ছদ্ম-বহিরাগত নমুনা বিশ্লেষণ কেবলমাত্র কোনও মডেলের আউট-অফ-নমুনা কর্মক্ষমতা অনুমান করার উপায় নয়। বিকল্পগুলির মধ্যে ক্রস-বৈধকরণ এবং তথ্যের মানদণ্ড অন্তর্ভুক্ত।

এই সমস্ত ইস্যুগুলির একটি খুব ভাল আলোচনাটি এর 7 ম অধ্যায়ে সরবরাহ করা হয়েছে

http://www.stanford.edu/~hastie/local.ftp/Springer/OLD/ESLII_print4.pdf


3
পিডিএফ লিংকটি কাজ করে না, তবে মনে হচ্ছে তিবশিরানীর বিনামূল্যে অনলাইন বই "স্ট্যাটাসটিকাল লার্নিংয়ের উপাদানগুলি: ডেটা মাইনিং, ইনফারেন্সেশন এবং প্রেডিকশন"
ওলেগ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.