যখন আমাদের কাছে একটি সংখ্যাসূচক মডেল থাকে যা একটি আসল শারীরিক ব্যবস্থা উপস্থাপন করে এবং বিশৃঙ্খলা প্রদর্শন করে (যেমন তরল ডায়নামিক্স মডেল, জলবায়ু মডেল), তখন আমরা কীভাবে জানতে পারি যে মডেলটি যেমনটি করা উচিত তেমন পারফর্ম করছে? আমরা সরাসরি মডেলের আউটপুট দুটি সেট তুলনা করতে পারি না, কারণ প্রাথমিক অবস্থার এমনকি ছোট পরিবর্তনগুলি নাটকীয়ভাবে পৃথক সিমুলেশনের আউটপুটগুলিকে পরিবর্তন করতে পারে। আমরা মডেল আউটপুটকে পর্যবেক্ষণের সাথে সরাসরি তুলনা করতে পারি না, কারণ আমরা পর্যবেক্ষণের প্রাথমিক অবস্থার সাথে পর্যাপ্ত পরিমাণে জানতে পারি না, এবং সংখ্যাসমূহের সান্নিধ্যে যাইহোক সিস্টেমের মাধ্যমে প্রচারিত হওয়া ছোটখাটো পার্থক্য দেখা দিতে পারে।
এই প্রশ্নটি আংশিকভাবে বৈজ্ঞানিক কোড ইউনিট পরীক্ষার বিষয়ে ডেভিড কেচসনের প্রশ্নের দ্বারা অনুপ্রাণিত : আমি বিশেষত আগ্রহী যে এই জাতীয় মডেলগুলির জন্য রিগ্রেশন টেস্টগুলি কীভাবে প্রয়োগ করা যেতে পারে। যদি একটি সামান্য প্রাথমিক অবস্থার পরিবর্তন বড় আউটপুট পরিবর্তন হতে পারে (যা এখনও বাস্তবে পর্যাপ্ত উপস্থাপনা হতে পারে), তবে আমরা প্যারামিটারগুলি সংশোধন করে বা নতুন সংখ্যাসূচক রুটিন প্রয়োগের ফলে যে পরিবর্তনগুলি করব সেগুলি থেকে কীভাবে পৃথক করতে পারি?