উত্তর:
অবশিষ্টাংশের উপর ভিত্তি করে ডায়াগনস্টিকগুলি কেন?
কারণ অনেক অনুমানই এর শর্তাধীন বিতরণ সম্পর্কিত , এর শর্তহীন বিতরণ নয়। এটি ত্রুটিগুলির অনুমানের সমতুল্য, যা আমরা অবশিষ্টাংশ দ্বারা অনুমান করি।
সাধারণ লিনিয়ার রিগ্রেশন-তে সাধারণত কেউ যদি অনুমান করতে সক্ষম হয় যে নির্দিষ্ট অনুমানগুলি পূরণ করা হয় তবে তা যাচাই করতে চায় (যেমন, অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হয়)।
প্রকৃত স্বাভাবিকতা অনুমানটি অবশিষ্টাংশ সম্পর্কে নয় তবে ত্রুটি শর্ত সম্পর্কে। আপনার কাছে যাঁরা রয়েছেন তাদের নিকটতম জিনিসটিই অবশিষ্টাংশ, যার জন্য আমরা সেগুলি পরীক্ষা করে দেখি।
লাগানো মানগুলি সাধারণত বিতরণ করা হয় কিনা তা যাচাই করে অনুমানগুলি পরীক্ষা করা কি যুক্তিসঙ্গত?
না। লাগানো মানগুলির বন্টন এর ধরণের উপর নির্ভর করে । অনুমানগুলি সম্পর্কে এটি আপনাকে মোটেই কিছু বলে না।
উদাহরণস্বরূপ, আমি সিমুলেটেড ডেটাতে কেবল একটি রিগ্রেশন চালিয়েছি, যার জন্য সমস্ত অনুমান সঠিকভাবে নির্দিষ্ট করা হয়েছিল। উদাহরণস্বরূপ ত্রুটির স্বাভাবিকতা সন্তুষ্ট ছিল। আমরা যখন লাগানো মানগুলির স্বাভাবিকতা যাচাই করার চেষ্টা করি তখন কী হয় তা এখানে:
তারা পরিষ্কারভাবে অস্বাভাবিক; আসলে এগুলিকে বিমোডাল লাগছে। কেন? ঠিক আছে, কারণ লাগানো মানগুলির বন্টন প্যাটার্নের উপর নির্ভর করে । ত্রুটিগুলি স্বাভাবিক ছিল, তবে লাগানো মানগুলি যে কোনও কিছু হতে পারে।
আরেকটা জিনিস মানুষ প্রায়ই পরীক্ষা করুন (আরো অনেক কিছু প্রায়ই, আসলে) এর স্বাভাবিক হয় গুলি ... কিন্তু নিঃশর্তভাবে উপর ; আবার এটি এর প্যাটার্নের উপর নির্ভর করে এবং তাই আপনাকে আসল অনুমানগুলি সম্পর্কে বেশি কিছু বলে না। আবার, আমি এমন কিছু ডেটা তৈরি করেছি যেখানে অনুমানগুলি সব ধারণ করে; আমরা যখন শর্তহীন মানগুলির স্বাভাবিকতা যাচাই করার চেষ্টা করি তখন কী হয় তা এখানে :
আবার, আমরা এখানে যে অস্বাভাবিকতা দেখতে পাই তা (y এর স্কিউ হয়) এস এর শর্তযুক্ত স্বাভাবিকতার সাথে সম্পর্কিত নয় ।
আসলে আমি আমার পাশে মুহূর্তে একটি পাঠ্যপুস্তক আছে আলোচনা এই পার্থক্য (শর্তাধীন বিতরণ এবং এর নিঃশর্ত বন্টন মধ্যে ) - যে, এটা একটি প্রাথমিক অধ্যায়ে ব্যাখ্যা দিয়েছে কেন শুধু বিতরণের দিকে তাকিয়ে গুলি নয় ' ডান এবং তারপর বস্তু গুলির নিম্নবর্তী অধ্যায় বারবার চেক বিতরণের দিকে তাকিয়ে স্বাভাবিক ধৃষ্টতা মধ্যে মান প্রভাব বিবেচনা না করে এর অনুমানের উপযুক্ততা (অন্য জিনিস এটা সাধারণত করে মাত্র তাকান হয় মূল্যায়ন করার এই মূল্যায়ন করতে হিস্টোগ্রামগুলি, তবে এটি সম্পূর্ণ অন্য একটি সমস্যা )।
অনুমানগুলি কী কী, আমরা সেগুলি কীভাবে চেক করব এবং কখন সেগুলি করা দরকার?
এর হিসাবে নির্দিষ্ট (ত্রুটি ছাড়া পরিলক্ষিত) চিকিত্সা করা যেতে পারে। আমরা সাধারণত ডায়াগোনস্টিকালি এটি পরীক্ষা করার চেষ্টা করি না (তবে এটি সত্য কিনা আমাদের একটি ভাল ধারণা থাকা উচিত)।
মডেলের এবং মধ্যে সম্পর্ক সঠিকভাবে নির্দিষ্ট করা হয়েছে (যেমন, লিনিয়ার)। যদি আমরা সেরা ফিটিং লিনিয়ার মডেলটি বিয়োগ করি, তবে অবশিষ্টাংশ এবং এর মধ্যকার সম্পর্কের কোনও অবশিষ্ট প্যাটার্ন থাকা উচিত না ।
স্থায়ী ভ্যারিয়েন্স (অর্থাত, উপর নির্ভর করে না । ত্রুটি বিস্তার ধ্রুবক; এটি বিরুদ্ধে অবশিষ্টাংশ বিস্তারের দিকে তাকিয়ে দ্বারা চেক করা যেতে পারে , অথবা কিছু ফাংশন চেক করে বিপরীতে স্কোয়ার অবশিষ্টাংশগুলির মধ্যে এবং গড় পরিবর্তনের জন্য পরীক্ষা করা (যেমন লগ বা স্কোয়ার রুটের মতো ফাংশনগুলি। আর বর্গাকার অবশিষ্টাংশের চতুর্থ মূল ব্যবহার করে)।
শর্তসাপেক্ষে স্বাধীনতা / ত্রুটির স্বাধীনতা। নির্ভরশীলতার বিশেষ ফর্মগুলির জন্য পরীক্ষা করা যেতে পারে (উদাহরণস্বরূপ, সিরিয়াল সম্পর্ক)। যদি আপনি নির্ভরতার ফর্মটি অনুমান করতে না পারেন তবে এটি পরীক্ষা করা একটু কঠিন।
স্বাভাবিকতা ত্রুটির / স্বাভাবিকতার শর্তযুক্ত বিতরণ । উদাহরণস্বরূপ, অবশিষ্টাংশের কিউকিউ প্লট করে পরীক্ষা করা যায়।
(আমি অন্যান্য কিছু অনুমান আছে যা আমি উল্লেখ করি নি, যেমন অ্যাডিটিভ ত্রুটিগুলি, ত্রুটিগুলির শূন্যের অর্থ রয়েছে ইত্যাদি))
আপনি যদি কেবলমাত্র সর্বনিম্ন স্কোয়ার লাইনের ফিট অনুমান করতে আগ্রহী হন এবং মানক ত্রুটিগুলি না বলেন, আপনার এই ধরণের বেশিরভাগ অনুমান করার দরকার নেই। উদাহরণস্বরূপ, ত্রুটির বিতরণ অনুমানকে (পরীক্ষা এবং অন্তরগুলি) প্রভাবিত করে এবং এটি অনুমানের দক্ষতার উপর প্রভাব ফেলতে পারে তবে এলএস লাইনটি এখনও উদাহরণস্বরূপ সেরা লিনিয়ার নিরপেক্ষ; সুতরাং বিতরণটি এত খারাপভাবে স্বাভাবিক না হওয়া পর্যন্ত যে সমস্ত লিনিয়ার অনুমানকগুলি খারাপ, ত্রুটি শর্ত সম্পর্কে অনুমানগুলি ধরে না রাখলে এটি অগত্যা কোনও সমস্যা নয়।