প্রশ্নটি খুব সহজ: কেন আমরা যখন আমাদের ডেটা, লিনিয়ার বা নন-লিনিয়ার সাথে একটি মডেল ফিট করার চেষ্টা করি, আমরা সাধারণত মডেল প্যারামিটারের জন্য আমাদের অনুমানকারীটি পেতে ত্রুটিগুলির স্কোয়ারের যোগফলকে হ্রাস করার চেষ্টা করি? হ্রাস করতে অন্য কিছু উদ্দেশ্যমূলক কার্যকারিতাটি বেছে নিচ্ছেন না কেন? আমি বুঝতে পারি যে প্রযুক্তিগত কারণে, চতুর্ভুজ ফাংশন অন্যান্য কিছু ফাংশনগুলির চেয়ে ভাল, উদাহরণস্বরূপ, নিখুঁত বিচ্যুতির যোগফল। তবে এটি এখনও খুব দৃ conv়প্রত্যয়ী উত্তর নয়। এই প্রযুক্তিগত কারণ ব্যতীত, বিশেষত লোকেরা দূরত্বের ক্রিয়াকলাপের এই 'ইউক্লিডিয়ান ধরণের' পক্ষে? এর জন্য কি কোনও নির্দিষ্ট অর্থ বা ব্যাখ্যা রয়েছে?
আমার চিন্তার পিছনে যুক্তিটি হ'ল:
আপনার যখন কোনও ডেটাসেট থাকে, আপনি প্রথমে কার্যকরী বা বিতরণীয় অনুমানের সেট তৈরি করে আপনার মডেলটি সেট আপ করুন (বলুন, কিছু মুহুর্তের শর্ত কিন্তু পুরো বিতরণ নয়)। আপনার মডেলটিতে কিছু প্যারামিটার রয়েছে (ধরে নিন এটি একটি প্যারামিট্রিক মডেল) তবে আপনার এই প্যারামিটারগুলির ধারাবাহিকভাবে অনুমান করার জন্য কোনও উপায় খুঁজে বের করতে হবে এবং আশা করা যায়, আপনার অনুমানকারীটির স্বল্প বৈচিত্র এবং কিছু অন্যান্য দুর্দান্ত বৈশিষ্ট্য থাকবে। আপনি এসএসই বা এলএডি বা অন্য কোনও উদ্দেশ্যমূলক ফাংশনটি ন্যূনতম করুন না কেন, আমি মনে করি একটি সামঞ্জস্যপূর্ণ অনুমানকারী পেতে এটি কেবল ভিন্ন পদ্ধতি। এই যুক্তি অনুসরণ করে, আমি ভেবেছিলাম লোকেরা কমপক্ষে বর্গ ব্যবহার করতে হবে 1) এটি মডেল 2 এর ধারাবাহিক অনুমানকারী উত্পাদন করে) অন্য কিছু যা আমি জানি না।
একনোমেট্রিক্সে আমরা জানি যে লিনিয়ার রিগ্রেশন মডেলটিতে, আপনি যদি ধরে নেন যে ত্রুটি শর্তাবলীর অনুমানকারীদের সাথে 0 টিরকম কন্ডিশনার রয়েছে এবং সমকামিতা এবং ত্রুটিগুলি একে অপরের সাথে সম্পর্কযুক্ত নয়, তবে বর্গ ত্রুটির যোগফলকে কমিয়ে দেওয়া আপনাকে আপনার মডেলটির একটি কনসিস্ট্যান্ট অনুমানকারী দেবে প্যারামিটারগুলি এবং গাউস-মার্কভ উপপাদ্য দ্বারা, এই অনুমানকটি ন্যূনতম। সুতরাং এটি আপনাকে পরামর্শ দিবে যে আপনি যদি এসএসই নয় এমন অন্য কোনও উদ্দেশ্যমূলক ফাংশনটি ন্যূনতম করতে বেছে নেন, তবে আপনার মডেল প্যারামিটারের একটি সামঞ্জস্যপূর্ণ অনুমানকারী পাবেন এমন কোনও গ্যারান্টি নেই। আমার বোধগম্যতা কি সঠিক? যদি এটি সঠিক হয়, তবে এসএসইকে কমিয়ে আনার পরিবর্তে কিছু অন্যান্য উদ্দেশ্যমূলক ক্রিয়াটি ধারাবাহিকতা দ্বারা ন্যায়সঙ্গত করা যায়, যা গ্রহণযোগ্য, বাস্তবে, চতুর্ভুজ ফাংশনটি আরও ভাল বলা ভাল।
প্রীতি হিসাবে, আমি আসলে অনেকগুলি ক্ষেত্রে দেখেছি যেখানে লোকেরা প্রথমে সম্পূর্ণ মডেলটিকে স্পষ্টভাবে নির্দিষ্ট না করে যেমন বর্গ ত্রুটির যোগফলকে সরাসরি হ্রাস করে, উদাহরণস্বরূপ, ত্রুটি শর্তে বন্টনমূলক অনুমান (মুহূর্ত অনুমান)। তারপরে আমার কাছে এটি মনে হয় যে এই পদ্ধতির ব্যবহারকারী বর্গক্ষেত্রের ফাংশনটির ক্ষেত্রে ডেটাটি 'মডেল'-এর সাথে কতটা ফিট করে (আমি উদ্ধৃতি চিহ্নটি ব্যবহার করি কারণ মডেল অনুমানগুলি সম্ভবত অসম্পূর্ণ) see
একটি সম্পর্কিত প্রশ্ন (এই ওয়েবসাইটের সাথেও সম্পর্কিত) হ'ল: আমরা যখন ক্রস-বৈধতা ব্যবহার করে বিভিন্ন মডেলকে তুলনা করার চেষ্টা করি, তখন কেন আমরা আবার এসএসইকে বিচারের মানদণ্ড হিসাবে ব্যবহার করি? অর্থাত্, কমপক্ষে এসএসই রয়েছে এমন মডেলটি বেছে নিন? কেন আর একটি মাপদণ্ড নয়?