ধরুন আমাদের ফর্মের একটি সেট দেওয়া হয়েছে এবং । মানের উপর ভিত্তি করে এর পূর্বাভাস দেওয়ার কাজটি আমাদের দেওয়া হয় । আমরা দুটি রিগ্রেশন অনুমান করি যেখানে:
আমরা এমন একটি রিগ্রেশনও অনুমান করি যা মানগুলির উপর ভিত্তি করে of এর মানগুলির পূর্বাভাস দেয় , এটি:
ধরুন এখন আমরাও তা প্রদত্ত হই মান , তাহলে আমরা দুটি ভিন্ন পদ্ধতি ভবিষ্যদ্বাণী করা হবে :
কোনটি সাধারণভাবে ভাল হবে?
আমি অনুমান করছি যে প্রথম সমীকরণটি আরও ভাল হবে কারণ এটি দুটি পয়েন্টের ডেটা পয়েন্টের তথ্য ব্যবহার করে যেখানে দ্বিতীয় সমীকরণটি কেবলমাত্র ডেটা পয়েন্ট থেকে তথ্য ব্যবহার করে ভবিষ্যদ্বাণীকারী মান। পরিসংখ্যান সম্পর্কে আমার প্রশিক্ষণ সীমাবদ্ধ এবং এইভাবে আমি কিছু পেশাদার পরামর্শ নিতে চাই।
এছাড়াও, সাধারণভাবে, অসম্পূর্ণ তথ্য রয়েছে এমন ডেটার দিকে সেরা দৃষ্টিভঙ্গি কী? অন্য কথায়, আমরা কীভাবে ডেটা থেকে সর্বাধিক তথ্য বের করতে পারি যাগুলির মধ্যে মান নেই মাত্রা?