অবশিষ্টাংশের উপর ভিত্তি করে ডায়াগনস্টিকগুলি কেন?


12

সাধারণ লিনিয়ার রিগ্রেশন-তে সাধারণত কেউ যদি অনুমান করতে সক্ষম হয় যে নির্দিষ্ট অনুমানগুলি পূরণ করা হয় তবে তা যাচাই করতে চায় (যেমন, অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়)।

লাগানো মানগুলি সাধারণত বিতরণ করা হয় কিনা তা যাচাই করে অনুমানগুলি পরীক্ষা করা কি যুক্তিসঙ্গত?

উত্তর:


20

অবশিষ্টাংশের উপর ভিত্তি করে ডায়াগনস্টিকগুলি কেন?

কারণ অনেক অনুমানই এর শর্তাধীন বিতরণ সম্পর্কিত , এর শর্তহীন বিতরণ নয়। এটি ত্রুটিগুলির অনুমানের সমতুল্য, যা আমরা অবশিষ্টাংশ দ্বারা অনুমান করি।Y

সাধারণ লিনিয়ার রিগ্রেশন-তে সাধারণত কেউ যদি অনুমান করতে সক্ষম হয় যে নির্দিষ্ট অনুমানগুলি পূরণ করা হয় তবে তা যাচাই করতে চায় (যেমন, অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়)।

প্রকৃত স্বাভাবিকতা অনুমানটি অবশিষ্টাংশ সম্পর্কে নয় তবে ত্রুটি শর্ত সম্পর্কে। আপনার কাছে যাঁরা রয়েছেন তাদের নিকটতম জিনিসটিই অবশিষ্টাংশ, যার জন্য আমরা সেগুলি পরীক্ষা করে দেখি।

লাগানো মানগুলি সাধারণত বিতরণ করা হয় কিনা তা যাচাই করে অনুমানগুলি পরীক্ষা করা কি যুক্তিসঙ্গত?

না। লাগানো মানগুলির বন্টন এর ধরণের উপর নির্ভর করে । অনুমানগুলি সম্পর্কে এটি আপনাকে মোটেই কিছু বলে না।x

উদাহরণস্বরূপ, আমি সিমুলেটেড ডেটাতে কেবল একটি রিগ্রেশন চালিয়েছি, যার জন্য সমস্ত অনুমান সঠিকভাবে নির্দিষ্ট করা হয়েছিল। উদাহরণস্বরূপ ত্রুটির স্বাভাবিকতা সন্তুষ্ট ছিল। আমরা যখন লাগানো মানগুলির স্বাভাবিকতা যাচাই করার চেষ্টা করি তখন কী হয় তা এখানে:

লাগানো উপর স্বাভাবিকতা ডায়াগনস্টিক্স

তারা পরিষ্কারভাবে অস্বাভাবিক; আসলে এগুলিকে বিমোডাল লাগছে। কেন? ঠিক আছে, কারণ লাগানো মানগুলির বন্টন প্যাটার্নের উপর নির্ভর করে । ত্রুটিগুলি স্বাভাবিক ছিল, তবে লাগানো মানগুলি যে কোনও কিছু হতে পারে।x

আরেকটা জিনিস মানুষ প্রায়ই পরীক্ষা করুন (আরো অনেক কিছু প্রায়ই, আসলে) এর স্বাভাবিক হয় গুলি ... কিন্তু নিঃশর্তভাবে উপর ; আবার এটি এর প্যাটার্নের উপর নির্ভর করে এবং তাই আপনাকে আসল অনুমানগুলি সম্পর্কে বেশি কিছু বলে না। আবার, আমি এমন কিছু ডেটা তৈরি করেছি যেখানে অনুমানগুলি সব ধারণ করে; আমরা যখন শর্তহীন মানগুলির স্বাভাবিকতা যাচাই করার চেষ্টা করি তখন কী হয় তা এখানে :yxxy

কাঁচা ওয়াই-মানগুলির উপর স্বাভাবিকতা ডায়াগনস্টিক্স

আবার, আমরা এখানে যে অস্বাভাবিকতা দেখতে পাই তা (y এর স্কিউ হয়) এস এর শর্তযুক্ত স্বাভাবিকতার সাথে সম্পর্কিত নয় ।y

আসলে আমি আমার পাশে মুহূর্তে একটি পাঠ্যপুস্তক আছে আলোচনা এই পার্থক্য (শর্তাধীন বিতরণ এবং এর নিঃশর্ত বন্টন মধ্যে ) - যে, এটা একটি প্রাথমিক অধ্যায়ে ব্যাখ্যা দিয়েছে কেন শুধু বিতরণের দিকে তাকিয়ে গুলি নয় ' ডান এবং তারপর বস্তু গুলির নিম্নবর্তী অধ্যায় বারবার চেক বিতরণের দিকে তাকিয়ে স্বাভাবিক ধৃষ্টতা মধ্যে মান প্রভাব বিবেচনা না করে এর অনুমানের উপযুক্ততা (অন্য জিনিস এটা সাধারণত করে মাত্র তাকান হয় মূল্যায়ন করার এই মূল্যায়ন করতে হিস্টোগ্রামগুলি, তবে এটি সম্পূর্ণ অন্য একটি সমস্যা )।Yyyx


অনুমানগুলি কী কী, আমরা সেগুলি কীভাবে চেক করব এবং কখন সেগুলি করা দরকার?

  • এর হিসাবে নির্দিষ্ট (ত্রুটি ছাড়া পরিলক্ষিত) চিকিত্সা করা যেতে পারে। আমরা সাধারণত ডায়াগোনস্টিকালি এটি পরীক্ষা করার চেষ্টা করি না (তবে এটি সত্য কিনা আমাদের একটি ভাল ধারণা থাকা উচিত)।x

  • মডেলের এবং মধ্যে সম্পর্ক সঠিকভাবে নির্দিষ্ট করা হয়েছে (যেমন, লিনিয়ার)। যদি আমরা সেরা ফিটিং লিনিয়ার মডেলটি বিয়োগ করি, তবে অবশিষ্টাংশ এবং এর মধ্যকার সম্পর্কের কোনও অবশিষ্ট প্যাটার্ন থাকা উচিত না ।E(Y)xx

  • স্থায়ী ভ্যারিয়েন্স (অর্থাত, উপর নির্ভর করে না । ত্রুটি বিস্তার ধ্রুবক; এটি বিরুদ্ধে অবশিষ্টাংশ বিস্তারের দিকে তাকিয়ে দ্বারা চেক করা যেতে পারে , অথবা কিছু ফাংশন চেক করে বিপরীতে স্কোয়ার অবশিষ্টাংশগুলির মধ্যে এবং গড় পরিবর্তনের জন্য পরীক্ষা করা (যেমন লগ বা স্কোয়ার রুটের মতো ফাংশনগুলি। আর বর্গাকার অবশিষ্টাংশের চতুর্থ মূল ব্যবহার করে)।Var(Y|x)xxx

  • শর্তসাপেক্ষে স্বাধীনতা / ত্রুটির স্বাধীনতা। নির্ভরশীলতার বিশেষ ফর্মগুলির জন্য পরীক্ষা করা যেতে পারে (উদাহরণস্বরূপ, সিরিয়াল সম্পর্ক)। যদি আপনি নির্ভরতার ফর্মটি অনুমান করতে না পারেন তবে এটি পরীক্ষা করা একটু কঠিন।

  • স্বাভাবিকতা ত্রুটির / স্বাভাবিকতার শর্তযুক্ত বিতরণ । উদাহরণস্বরূপ, অবশিষ্টাংশের কিউকিউ প্লট করে পরীক্ষা করা যায়।Y

(আমি অন্যান্য কিছু অনুমান আছে যা আমি উল্লেখ করি নি, যেমন অ্যাডিটিভ ত্রুটিগুলি, ত্রুটিগুলির শূন্যের অর্থ রয়েছে ইত্যাদি))

আপনি যদি কেবলমাত্র সর্বনিম্ন স্কোয়ার লাইনের ফিট অনুমান করতে আগ্রহী হন এবং মানক ত্রুটিগুলি না বলেন, আপনার এই ধরণের বেশিরভাগ অনুমান করার দরকার নেই। উদাহরণস্বরূপ, ত্রুটির বিতরণ অনুমানকে (পরীক্ষা এবং অন্তরগুলি) প্রভাবিত করে এবং এটি অনুমানের দক্ষতার উপর প্রভাব ফেলতে পারে তবে এলএস লাইনটি এখনও উদাহরণস্বরূপ সেরা লিনিয়ার নিরপেক্ষ; সুতরাং বিতরণটি এত খারাপভাবে স্বাভাবিক না হওয়া পর্যন্ত যে সমস্ত লিনিয়ার অনুমানকগুলি খারাপ, ত্রুটি শর্ত সম্পর্কে অনুমানগুলি ধরে না রাখলে এটি অগত্যা কোনও সমস্যা নয়।


আমি আমার উত্তরে কিছু ডায়াগ্রাম যুক্ত করেছি।
গ্লেন_বি -রিনস্টেট মনিকা

2
এটি একটি দুর্দান্ত উত্তর। আপনি যদি আরও চান, তবে আমি এখানে কিছুটা অনুরূপ অঞ্চলটি কভার করি: যদি অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয় তবে Y হয় না?
গুং - মনিকা পুনরায়

@ গুং আমি প্রথমে এর সাথে সংযোগ না দেওয়ার জন্য নিজেকে লাথি দিচ্ছি।
গ্লেন_বি -রিনস্টেট মনিকা

1
@ গ্লেন: খুব ভাল মনোভাব পাঠ্যপুস্তকগুলিতে এবং ইন্টারনেটে প্রায় প্রচুর সংস্থানতে বিষয়টির এত ভাল আচরণের জন্য আমার দীর্ঘদিন ধরে একই বিভ্রান্তি ছিল। অন্যদিকে Y এর শর্তহীন বিতরণ প্রায়শই শর্তসাপেক্ষ বিতরণের জন্য বিশেষত সময়-সিরিজের প্রসঙ্গে একটি মডেল অনুমান করার জন্য পরীক্ষা করা হয়। এর পিছনে কি কোনও তাত্ত্বিক যুক্তি রয়েছে? আমি এটিকে একটি প্রশ্ন হিসাবে জিজ্ঞাসা করার চেষ্টা করেছি তবে আমি মনে করি এটি সঠিকভাবে বাক্যাংশ করতে পারে না: stats.stackexchange.com/questions/74886/…
ক্যাগডাস ওজেন্সেক

@ ক্যাগডাস ওজেগেনসি কেবলমাত্র এটি করতে আমি ভাবতে পারি কারণ এটি আপনার মডেল হওয়ার আগে করা সহজ। সেই লিঙ্কযুক্ত প্রশ্নের আপনার উত্তরটি পোস্ট হওয়ার সময় আমার কাছে ভাল উত্তর বলে মনে হয়েছিল।
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.