ওভারফিটিং থেকে সাবধান থাকুন । কোনও সিস্টেম থেকে সংগৃহীত ডেটার আরও সঠিক মডেল কোনও সিস্টেমের ভবিষ্যতের আচরণের জন্য আরও ভাল ভবিষ্যদ্বাণীকারী নাও হতে পারে।
উপরের চিত্রটি কিছু ডেটার দুটি মডেল দেখায়।
রৈখিক লাইনটি প্রশিক্ষণের ডেটা (গ্রাফের পয়েন্টগুলি) এর উপর কিছুটা নির্ভুল এবং পরীক্ষার ডেটাতে এটি কিছুটা সঠিক হবে (যেখানে পয়েন্টগুলি x <5 এবং x> -5 এর জন্য হতে পারে) )।
বিপরীতে, বহুপদী ট্রেনিং ডেটার জন্য 100% সঠিক, তবে (যদি আপনার 9 ম ডিগ্রি বহিরাগতটি কোনও শারীরিক কারণে যুক্তিসঙ্গত বিশ্বাস করার কোনও কারণ না থাকে), আপনি ধরে নিতে পারবেন এটি x> 5 এবং এর জন্য অত্যন্ত দরিদ্র ভবিষ্যদ্বাণী হবে x <-5।
লিনিয়ার মডেলটি 'কম নির্ভুল', আমরা যে তথ্য সংগ্রহ করেছি তার সাথে ত্রুটির তুলনার উপর ভিত্তি করে। তবে এটি আরও সাধারণীকরণযোগ্য।
অধিকন্তু, প্রকৌশলীগুলিকে তাদের মডেল সম্পর্কে কম চিন্তা করতে হবে এবং লোকেরা মডেলটির সাথে কী করবে about
যদি আমি আপনাকে বলি যে আমরা গরমের দিনে হাঁটতে যাচ্ছি এবং এটি 426 মিনিট স্থায়ী হবে বলে আশা করা হচ্ছে। আপনি যদি হাঁটা the ঘন্টা চলবে বলে তুলনায় আপনি কম জল নিয়ে আসেন, এবং আমি যদি বলি যে হাঁটাচলা 4-8 ঘন্টা চলবে তবে তার চেয়ে কম। এর কারণ আপনি আমার পূর্বাভাসের উপর আমার উল্লিখিত স্তরের আত্মবিশ্বাসের আমার প্রতিক্রিয়া ব্যক্তির সময়কালের মধ্য বিন্দুটির পরিবর্তে সাড়া দিচ্ছেন।
আপনি যদি মানুষকে একটি সঠিক মডেল দেন তবে লোকেরা তাদের ত্রুটির প্রান্তিকতা হ্রাস করবে। এটি বড় ঝুঁকি বাড়ে।
উত্তপ্ত দিনের উদাহরণে হাঁটাচলা করা, যদি আমি জানি তবে হাঁটতে নেভিগেশন এবং হাঁটার গতি সম্পর্কে কিছুটা অনিশ্চয়তার সাথে 95% ক্ষেত্রে 4-8 ঘন্টা সময় লাগবে। আমাদের চলার গতিটি পুরোপুরি জানলে 4-8 চিত্রের অনিশ্চয়তা হ্রাস পাবে, তবে 'জল এতটা সমস্যা হয়ে দাঁড়ায় আমাদের এতটা সময় নেওয়ার সুযোগ' এর উল্লেখযোগ্যভাবে প্রভাব ফেলবে না, কারণ এটি প্রায় পুরোপুরি অনিশ্চিত নেভিগেশন দ্বারা চালিত হয়, না অনিশ্চিত হাঁটার গতি।