এটি প্রায়শই বলা হয়ে থাকে যে কমপক্ষে স্কোয়ার অবশিষ্টাংশকে ন্যূনতম করা একেবারে নিখুঁত অবশিষ্টাংশগুলিকে ন্যূনতম করার চেয়ে পছন্দ করা হয় কারণ এটি কম্পিউটারের তুলনায় সহজ । তবে, অন্যান্য কারণে এটি আরও ভাল হতে পারে। যথা, যদি অনুমানগুলি সত্য হয় (এবং এটি এতটা অস্বাভাবিক নয়) তবে এটি এমন একটি সমাধান সরবরাহ করে যা (গড়) আরও নির্ভুল।
সর্বাধিক সম্ভাবনা
স্বল্প স্কোয়ার রিগ্রেশন এবং কোয়ান্টাইল রিগ্রেশন (পরম অবশিষ্টাংশগুলি হ্রাস করে যখন করা হয়) গাউসিয়ান / ল্যাপ্লেস বিতরণ ত্রুটিগুলির সম্ভাবনা কার্যকে সর্বাধিকীকরণ হিসাবে দেখা যায় এবং এই অর্থে এটি খুব বেশি সম্পর্কিত।
গাউসীয় বিতরণ:
f(x)=12πσ2−−−−√e−(x−μ)22σ2
বর্গাকার অবশিষ্টাংশের যোগফলকে কমিয়ে আনার সময় লগ-সম্ভাবনা সর্বাধিক করা যায়
logL(x)=−n2log(2π)−nlog(σ)−12σ2∑i=1n(xi−μ)2sum of squared residuals
ফাঁক বিতরণ:
f(x)=12be−|x−μ|b
নিখুঁত অবশিষ্টাংশের যোগফলকে হ্রাস করার সময় লগ-সম্ভাবনা সর্বাধিক করা যায়
logL(x)=−nlog(2)−nlog(b)−1b∑i=1n|xi−μ|sum of absolute residuals
দ্রষ্টব্য: ল্যাপ্লেস বিতরণ এবং নিখুঁত অবশিষ্টাংশগুলির যোগফল মধ্যকার সাথে সম্পর্কিত তবে এটি নেতিবাচক এবং ইতিবাচক অবশিষ্টাংশগুলিকে বিভিন্ন ওজন দিয়ে অন্য কোয়ান্টাইলগুলিতে সাধারণীকরণ করা যেতে পারে।
জ্ঞাত ত্রুটি বিতরণ
আমরা যখন ত্রুটি-বিতরণ জানি (যখন অনুমানগুলি সম্ভবত সত্য হয়) তখন সম্পর্কিত সম্ভাবনা ফাংশনটি চয়ন করা বোধগম্য হয়। এই ফাংশনটি হ্রাস করা আরও অনুকূল।
খুব প্রায়ই ত্রুটিগুলি প্রায় (প্রায়) সাধারণ বিতরণ করা হয়। যে ক্ষেত্রে লিস্ট স্কোয়ার ব্যবহার মাপদণ্ড এটি ভাল উপায় μ (যা সম্পর্কিত উভয় মিন ও মিডিয়ান)। এটি সবচেয়ে ভাল উপায় কারণ এতে সর্বনিম্ন নমুনা বৈকল্পিকতা রয়েছে (সমস্ত পক্ষপাতদুষ্ট অনুমানকারীদের মধ্যে সর্বনিম্ন )। অথবা আপনি আরও জোরালোভাবে বলতে পারেন: এটি কে স্টক্যাস্টিকালি বা অনির্দিষ্ট প্রভাবশালী (ইন চিত্রণ দেখতে এই প্রশ্নের নমুনা মধ্যমা বিতরণের এবং নমুনা গড় তুলনা)।
সুতরাং, যখন ত্রুটিগুলি স্বাভাবিক বিতরণ করা হয়, তখন নমুনা গড়টি নমুনার মধ্যকের চেয়ে বন্টন মিডিয়ানের আরও ভাল অনুমানকারী । সর্বনিম্ন স্কোয়ারের রিগ্রেশন কোয়ান্টাইলগুলির আরও অনুকূল অনুমানক। এটি সর্বনিম্ন অবশিষ্টাংশের সর্বনিম্ন যোগফল ব্যবহার করার চেয়ে ভাল।
কারণ এতগুলি সমস্যা সাধারণ বিতরণ ত্রুটিগুলির সাথে মোকাবিলা করে ন্যূনতম স্কোয়ার পদ্ধতির ব্যবহার খুব জনপ্রিয়। অন্যান্য ধরণের বিতরণগুলির সাথে কাজ করার জন্য কেউ জেনারেলাইজড লিনিয়ার মডেলটি ব্যবহার করতে পারেন । এবং, পুনরুদ্ধারযোগ্য ন্যূনতম স্কোয়ারগুলির পদ্ধতি, যা জিএলএমগুলি সমাধান করার জন্য ব্যবহার করা যেতে পারে, সেগুলি ল্যাপ্লেস বিতরণের জন্যও কাজ করে (যেমন নিখুঁত বিচ্যুতির জন্য ), যা মিডিয়ান (বা সাধারণ সংস্করণে অন্যান্য কোয়ান্টাইলগুলিতে) সন্ধানের সমতুল্য।
অজানা ত্রুটি বিতরণ
বলিষ্ঠতা
মিডিয়ান বা অন্যান্য কোয়ান্টাইলগুলির সুবিধা রয়েছে যে তারা বিতরণের ধরণের বিষয়ে খুব দৃ .়। প্রকৃত মানগুলি খুব বেশি গুরুত্ব দেয় না এবং কোয়ান্টাইলগুলি কেবল অর্ডারটি যত্ন করে। সুতরাং বিতরণটি যাই হোক না কেন, নিরঙ্কুশ অবশিষ্টগুলি (যা কোয়ান্টাইলগুলি সন্ধানের সমতুল্য) হ্রাস করা খুব ভালভাবে কাজ করছে।
প্রশ্নটি এখানে জটিল এবং বিস্তৃত হয়ে যায় এবং বিতরণ ফাংশন সম্পর্কে আমাদের কী ধরণের জ্ঞান আছে বা নেই তা নির্ভর করে। উদাহরণস্বরূপ, কোনও বিতরণ প্রায় সাধারণ বিতরণ হতে পারে তবে কেবলমাত্র কিছু অতিরিক্ত বিদেশী ers বাইরের মানগুলি মুছে ফেলে এটি মোকাবেলা করা যেতে পারে। চূড়ান্ত মানগুলির এই অপসারণ এমনকি কাচি বিতরণের লোকেশন প্যারামিটার অনুমান করতেও কাজ করে যেখানে কাটা কাটা গড়টি মধ্যকের চেয়ে আরও ভাল অনুমানকারী হতে পারে। সুতরাং অনুমানগুলি ধরে রাখলে কেবল আদর্শ পরিস্থিতিই নয়, কিছু কম আদর্শ অ্যাপ্লিকেশনগুলির জন্যও (উদাহরণস্বরূপ অতিরিক্ত বহিরাগত) এমন ভাল শক্তিশালী পদ্ধতি থাকতে পারে যা এখনও নিখুঁত অবশিষ্টাংশের যোগফলের পরিবর্তে স্কোয়ার অবশিষ্টাংশগুলির যোগফলের কিছু ফর্ম ব্যবহার করে।
আমি কল্পনা করেছিলাম যে কাটা কাটা অবশিষ্টাংশগুলির সাথে রিগ্রেশন গণনাগতভাবে আরও জটিল হতে পারে। সুতরাং এটি প্রকৃতপক্ষে কোয়ান্টাইল রিগ্রেশন হতে পারে যা সংখ্যার তুলনায় সরল (সাধারণ ন্যূনতম স্কোয়ারের চেয়ে সহজ নয়, তবে কাটা কাটা ন্যূনতম স্কোয়ারের চেয়ে সহজ ) কারণগুলির কারণে ঘটে থাকে ।
পক্ষপাতদুষ্ট / পক্ষপাতিত্বহীন
অন্য একটি বিষয় পক্ষপাতদুষ্ট বনাম পক্ষপাতদুষ্ট অনুমানকারী is উপরোক্ত ক্ষেত্রে আমি গড়ের সর্বাধিক সম্ভাবনার প্রাক্কলনটি অর্থাত্ ন্যূনতম স্কোয়ার সমাধানকে একটি ভাল বা পছন্দনীয় অনুমানক হিসাবে বর্ণনা করেছি কারণ এটি প্রায়শই সমস্ত পক্ষপাতদুষ্ট অনুমানকারীদের (যখন ত্রুটিগুলি সাধারণ বিতরণ করা হয়) এর সর্বনিম্নতম বৈকল্পিক থাকে। তবে, পক্ষপাতদুষ্ট অনুমানক আরও ভাল হতে পারে (স্কোয়ার ত্রুটির নিম্ন প্রত্যাশিত যোগফল)।
এটি প্রশ্নটিকে আবার বিস্তৃত এবং জটিল করে তুলেছে। এগুলি প্রয়োগ করার জন্য অনেকগুলি বিভিন্ন অনুমানক এবং বিভিন্ন পরিস্থিতি রয়েছে। স্কোয়ারড রেসিডুয়ালস লস ফাংশনের একটি অভিযোজিত পরিমাণের ব্যবহার প্রায়শই ত্রুটি হ্রাস করতে ভাল কাজ করে (যেমন নিয়মিতকরণের সমস্ত ধরণের পদ্ধতি), তবে এটি সমস্ত ক্ষেত্রে ভালভাবে কাজ করার প্রয়োজন নাও হতে পারে। স্বজ্ঞাতভাবে এটি কল্পনা করা অবাক হওয়ার মতো নয় যেহেতু স্কোয়্যার অবশিষ্টাংশের ক্ষতির ফাংশন প্রায়শই সমস্ত পক্ষপাতদুষ্ট অনুমানকারীদের জন্য ভাল কাজ করে, অনুকূল পক্ষপাতদুষ্ট অনুমানকারী সম্ভবত স্কোয়ার অবশিষ্টাংশ লোকসান ফাংশনের যোগফলের কাছাকাছি কিছু।