গড়টি স্কোয়ার ত্রুটি (বা এল 2 আদর্শ, এখানে বা এখানে দেখুন ) হ্রাস করে , তাই গড় থেকে দূরত্ব পরিমাপের জন্য বৈকল্পিকের জন্য প্রাকৃতিক পছন্দটি স্কোয়ার ত্রুটি ব্যবহার করা হয় ( কেন আমরা এটি বর্গাকার করব তা এখানে দেখুন )। অন্যদিকে, মিডিয়ান সম্পূর্ণ ত্রুটি (এল 1 আদর্শ) হ্রাস করে, অর্থাত এটি আপনার ডেটার "মাঝের" মধ্যে থাকা একটি মান, সুতরাং মধ্যমা থেকে পরম দূরত্ব (তথাকথিত মিডিয়ান পরম বিভাজন বা এমএডি) বলে মনে হয় মিডিয়ান এর চারপাশে পরিবর্তনশীলতার ডিগ্রির আরও ভাল পরিমাপ। আপনি এই থ্রেডে এই সম্পর্কগুলি সম্পর্কে আরও পড়তে পারেন ।
এটি সংক্ষেপে বললে, তারা কীভাবে আপনার ডেটার কেন্দ্রীয় বিন্দুটি সংজ্ঞায়িত করে এবং এর চারপাশে আমরা কীভাবে ডেটাপয়েন্টের ভিন্নতা পরিমাপ করি তা প্রভাবিত করে এমএডি থেকে পৃথক। মানগুলির স্কোয়ারিংয়ের ফলে বহিরাগতদের কেন্দ্রীয় বিন্দুতে (গড়) বেশি প্রভাব থাকে, তবে মধ্যস্থতার ক্ষেত্রে সমস্ত পয়েন্টই এর উপর একই রকম প্রভাব ফেলে, তাই পরম দূরত্ব আরও উপযুক্ত বলে মনে হয়।
এটি সাধারণ সিমুলেশন দ্বারাও প্রদর্শিত হতে পারে। আপনি যদি গড় এবং মাঝারি থেকে স্কোয়ার দূরত্বের মানগুলি তুলনা করেন, তবে মোট বর্গক্ষেত্রের দূরত্বটি মাঝারি থেকে প্রায় সর্বদা গড় থেকে ছোট হয়। অন্যদিকে, মোট নিখুঁত দূরত্ব মাঝারি থেকে ছোট, তারপরে গড় থেকে। সিমুলেশন পরিচালনার জন্য আর কোডটি নীচে পোস্ট করা হয়েছে।
sqtest <- function(x) sum((x-mean(x))^2) < sum((x-median(x))^2)
abstest <- function(x) sum(abs(x-mean(x))) > sum(abs(x-median(x)))
mean(replicate(1000, sqtest(rnorm(1000))))
mean(replicate(1000, abstest(rnorm(1000))))
mean(replicate(1000, sqtest(rexp(1000))))
mean(replicate(1000, abstest(rexp(1000))))
mean(replicate(1000, sqtest(runif(1000))))
mean(replicate(1000, abstest(runif(1000))))
এ জাতীয় "বৈকল্পিকতা" অনুমানের পরিবর্তে মিডিয়ান ব্যবহারের ক্ষেত্রে এটি উচ্চতর অনুমানের দিকে নিয়ে যায়, গড় হিসাবে ব্যবহার করার চেয়ে এটি traditionতিহ্যগতভাবে করা হয়।
যাইহোক, এই থ্রেডের মতো এল 1 এবং এল 2 মানদণ্ডের সম্পর্কগুলিও বায়সিয়ান প্রসঙ্গে বিবেচনা করা যেতে পারে ।