এটিতে একটি চাক্ষুষ ব্যাখ্যা যুক্ত করতে: আসুন আপনি কয়েকটি পয়েন্ট বিবেচনা করুন যা আপনি মডেল করার পরিকল্পনা করছেন।
এগুলি দেখে মনে হচ্ছে এগুলি একটি সরল রেখার সাথে ভালভাবে বর্ণনা করা যেতে পারে, সুতরাং আপনি তাদের প্রতি লিনিয়ার রিগ্রেশন ফিট করুন:
এই রিগ্রেশন লাইন আপনাকে উভয়কে বিভক্ত করতে দেয় (আপনার ডেটা পয়েন্টগুলির মধ্যে প্রত্যাশিত মান উত্পন্ন করতে পারে) এবং এক্সট্রপোলেট (আপনার ডেটার পয়েন্টের সীমার বাইরে প্রত্যাশিত মান উত্পন্ন করতে পারে)। আমি রেডে এক্সট্রাপোলেশনটি এবং নীল রঙের আন্তঃপোলনের বৃহত্তম অঞ্চলটি হাইলাইট করেছি। স্পষ্ট করে বলতে গেলে, পয়েন্টগুলির মধ্যে এমনকি ক্ষুদ্র অঞ্চলগুলি বিভক্ত, তবে আমি এখানে কেবল বড়টিই হাইলাইট করছি।
কেন বহির্ভূতকরণ সাধারণত একটি উদ্বেগের বিষয়? কারণ আপনি সাধারণত আপনার ডেটার সীমার বাইরে সম্পর্কের আকৃতি সম্পর্কে খুব কম নিশ্চিত হন। আপনি আরও কয়েকটি ডেটা পয়েন্ট সংগ্রহ করার সময় কী ঘটতে পারে তা বিবেচনা করুন (ফাঁকা চেনাশোনা):
দেখা যাচ্ছে যে সম্পর্কটি সর্বোপরি আপনার অনুমানযুক্ত সম্পর্কের সাথে ভালভাবে ধরা পড়ে নি well বহির্মুখী অঞ্চলে ভবিষ্যদ্বাণীগুলি বন্ধ। এমনকি আপনি যদি এই অবৈধ সম্পর্কের সঠিকভাবে বর্ণনা করার জন্য সঠিক কাজটি অনুমান করেছিলেন, আপনার অফলাইনটিকে ভালভাবে ক্যাপচার করার জন্য আপনার ডেটা যথেষ্ট পরিসীমা ছাড়েনি, তাই আপনি এখনও বেশ দূরেই থাকতে পারেন। মনে রাখবেন যে এটি কেবল লিনিয়ার রিগ্রেশন নয়, যে কোনও সম্পর্কের ক্ষেত্রেই এই সমস্যা - এজন্যই এক্সট্রা পোলেশনকে বিপজ্জনক বলে মনে করা হয়।
ইন্টারপোলেটেড অঞ্চলে ভবিষ্যদ্বাণীগুলিও ফিট না করে অযোগ্যরূপতার অভাবের কারণে ভুল, তবে তাদের পূর্বাভাস ত্রুটিটি অনেক কম। আপনার পয়েন্টগুলির মধ্যে অপ্রত্যাশিত সম্পর্ক থাকবে না এমন কোনও গ্যারান্টি নেই (অর্থাত্ প্রদাহের অঞ্চল), তবে এটির সম্ভাবনা কম less
আমি যুক্ত করব যে অতিরিক্ত বহিরাবরণ সর্বদা একটি ভয়ঙ্কর ধারণা নয় - আপনি যদি নিজের ডেটার সীমার বাইরে একটি সামান্য বিট এক্সট্রোলেট করেন তবে আপনি সম্ভবত খুব ভুল হতে যাচ্ছেন না (যদিও এটি সম্ভব!)। পৃথিবীর প্রাচীন বৈজ্ঞানিক মডেল ছিল না এমন পূর্ববর্তীরা যদি ভবিষ্যদ্বাণী করে যে পরের দিন এবং তার পরের দিন সূর্য আবার উঠবে (যদিও ভবিষ্যতে একদিন দূরে থাকলেও এটি ব্যর্থ হবে)।
2
মন্তব্যের উপর ভিত্তি করে সম্পাদনা করুন: ইন্টারপোলটিং বা এক্সট্রাপোলটিং যা-ই হোক না কেন, প্রত্যাশার ভিত্তিতে কিছু তত্ত্ব থাকা ভাল। যদি থিওরি-মুক্ত মডেলিং অবশ্যই করা উচিত হয় তবে এক্সট্রোপোলেশন থেকে প্রসারণের ঝুঁকি সাধারণত কম থাকে। এটি বলেছে যে, ডেটা পয়েন্টের মধ্যে ব্যবধান যেমন প্রস্থে বৃদ্ধি পাবে, ততক্ষণ প্রসারণও ঝুঁকির সাথে আরও পরিপূর্ণ হয়ে উঠবে।