আমি গত উইকএন্ডে আর (1 ম সংস্করণ) সহ ফারাওয়ের পাঠ্যপুস্তকে রৈখিক মডেলগুলি পড়ছিলাম । ফারাওয়ের একটি "পরিসংখ্যান কৌশল এবং মডেল অনিশ্চয়তা" নামে একটি অধ্যায় ছিল। তিনি বর্ণনা করেছেন (পৃষ্ঠা 158) তিনি খুব জটিল মডেলটি ব্যবহার করে কৃত্রিমভাবে কিছু উপাত্ত তৈরি করেছেন, তারপরে তিনি তার ছাত্রদের ডেটা মডেল করতে এবং শিক্ষার্থীদের পূর্বাভাসের ফলাফল বনাম পড়ার ফলাফলের তুলনা করতে বলেছিলেন । দুর্ভাগ্যক্রমে, বেশিরভাগ শিক্ষার্থী পরীক্ষার ডেটা বেশি ফিট করে এবং পূর্বাভাসিত মানগুলি পুরোপুরি ছাপিয়ে যায়। এই ঘটনাটি ব্যাখ্যা করার জন্য, তিনি আমার কাছে খুব চিত্তাকর্ষক কিছু লিখেছিলেন:
"মডেলগুলি এত আলাদা হওয়ার কারণটি ছিল যে শিক্ষার্থীরা বিভিন্ন পদ্ধতিতে বিভিন্ন পদ্ধতি প্রয়োগ করেছিল Some কেউ কেউ পরিবর্তনের আগে পরিবর্তনশীল নির্বাচন করেছিলেন এবং অন্যরা বিপরীত। কিছু মডেল পরিবর্তনের পরে কোনও পদ্ধতি পুনরাবৃত্তি করেছিলেন এবং অন্যরা তা করেননি I আমি কৌশলগুলি অনুসরণ করেছি over বেশিরভাগ শিক্ষার্থী যা করেছে এবং যা করেছে তার সাথে পরিষ্কার কোনও ভুল খুঁজে পেল না।একজন ছাত্র তার বা তার পূর্বাভাসিত মানগুলি গণনা করতে ভুল করেছিল, তবে বাকী অংশে স্পষ্টত কোনও ভুল ছিল না। এই কার্যভারের অভিনয়টি প্রদর্শিত হয়নি পরীক্ষার সাথে যে কোনও সম্পর্ক। "
আমি শিক্ষিত হয়েছিলাম যে মডেল পূর্বাভাসের সঠিকতা আমাদের সেরা মডেল পারফরম্যান্স বাছাই করার জন্য 'সোনার মানদণ্ড'। যদি আমার ভুল না হয় তবে এটি কাগল প্রতিযোগিতায় ব্যবহৃত জনপ্রিয় পদ্ধতি। তবে এখানে ফ্যারাওয়ে একটি ভিন্ন প্রকৃতির কিছু পর্যবেক্ষণ করেছে, যা মডেল পূর্বাভাসের পারফরম্যান্সের কিছুই করতে পারে নাজড়িত পরিসংখ্যান ক্ষমতা সহ। অন্য কথায়, ভবিষ্যদ্বাণীপূর্ণ শক্তির দিক দিয়ে আমরা সেরা মডেলটি তৈরি করতে পারি কিনা তা আমরা কতটা অভিজ্ঞ তার দ্বারা প্রকৃতপক্ষে নির্ধারিত হয় না। পরিবর্তে এটি একটি বিশাল 'মডেল অনিশ্চয়তা' (অন্ধ ভাগ্য?) দ্বারা নির্ধারিত হয়। আমার প্রশ্ন: বাস্তব জীবনের ডেটা বিশ্লেষণেও কি এটি সত্য? নাকি আমি খুব বেসিক কিছু নিয়ে বিভ্রান্ত হয়েছিলাম? কারণ যদি এটি সত্য হয়, তবে বাস্তব তথ্য বিশ্লেষণের জড়িত হওয়া অপরিসীম: তথ্যের পিছনে "বাস্তব মডেল" না জেনে অভিজ্ঞ / অনভিজ্ঞ পরিসংখ্যানবিদদের দ্বারা করা কাজের মধ্যে কোনও প্রয়োজনীয় পার্থক্য নেই: উভয়ই কেবল সামনে বন্য অনুমান প্রশিক্ষণ তথ্য উপলব্ধ।