গ্ল্যাম মডেলগুলির জন্য অবশিষ্টাংশ ডায়াগনস্টিক প্লটগুলির ব্যাখ্যা করা?


33

আমি কীভাবে গ্ল্যাম মডেলের অবশিষ্ট প্লটগুলি ব্যাখ্যা করতে পারি তার গাইডলাইন সন্ধান করছি। বিশেষত পোয়েসন, নেতিবাচক দ্বিপদী, দ্বিপদী মডেল। মডেলগুলি "সঠিক" হলে আমরা এই প্লটগুলি থেকে কী আশা করতে পারি? (উদাহরণস্বরূপ, আমরা পূর্বাভাসের মানটি বাড়ার সাথে সাথে বৈচিত্রটি বাড়তে আশা করি, যখন কোনও পইসন মডেল নিয়ে কাজ করার জন্য)

আমি জানি উত্তরগুলি মডেলগুলির উপর নির্ভর করে। যে কোনও রেফারেন্স (বা বিবেচনা করার জন্য সাধারণ বিষয়গুলি) সহায়ক / প্রশংসা করবে।

উত্তর:


16

আমি মনে করি রিগ্রেশন বিশ্লেষণ করার সময় এটি অন্যতম চ্যালেঞ্জিং অংশ। আমি বেশিরভাগ ব্যাখ্যার সাথেও লড়াই করি (বিশেষত দ্বিপদী ডায়াগোনস্টিকগুলি পাগল!)।

আমি এই পোস্টটিতে কেবল হোঁচট খেয়েছি http://www.r-bloggers.com/model- লা ੇডেশন-interpreting-residual-plots / যিনি http://statmaster.sdu.dk/courses/st111/module04/index.html যুক্ত করেছেন # SECTION00020000000000000000

যা আমাকে সবচেয়ে বেশি সাহায্য করে তা হ'ল প্রতিটি ভবিষ্যদ্বাণীক পরামিতি বনাম এবং মডেলটিতে অন্তর্ভুক্ত না করে বনাম অবশিষ্টগুলি প্লট করা। এর অর্থ হ'ল বহুবিধ কারণে যেগুলি আগেই বাদ দেওয়া হয়েছিল। এই বক্সপ্লটগুলির জন্য, শর্তসাপেক্ষ স্ক্যাটারপ্লটস এবং সাধারণ স্ক্রেটারপ্লটগুলি দুর্দান্ত। এটি সম্ভাব্য ত্রুটিগুলি চিহ্নিত করতে সহায়তা করে

"ফরেস্ট অ্যানালিটিক্স উইথ আর" (ইউজারআর সিরিজ) এর মধ্যে মিক্সড এফেক্টস মডেলগুলির (এবং পাশাপাশি গ্ল্যামস) অবশিষ্টাংশগুলি কীভাবে ব্যাখ্যা করতে হয় তার কয়েকটি ভাল ব্যাখ্যা রয়েছে। ভাল পড়া! http://www.springer.com/statistics/life+sciences,+medicine+%26+health/book/978-1-4419-7761-8

কোনও দিন আগে আমি এমন একটি ওয়েবসাইটের কথা ভেবেছিলাম যা অবশিষ্ট অবধি সংগ্রহ করতে পারে যা ব্যবহারকারীরা "ঠিক আছে" এবং "ঠিক আছে না" বলে ভোট দিতে পারে। তবে আমি কখনই সেই ওয়েবসাইটটি পাই নি;)


8

আমি বর্ণিত পদ্ধতিগুলি সুপারিশ করব:

 Buja, A., Cook, D. Hofmann, H., Lawrence, M. Lee, E.-K., Swayne,
 D.F and Wickham, H. (2009) Statistical Inference for exploratory
 data analysis and model diagnostics Phil. Trans. R. Soc. A 2009
 367, 4361-4383 doi: 10.1098/rsta.2009.0120

কয়েকটি আলাদা ধারণা রয়েছে, তবে এগুলি বেশিরভাগই ডেটা সিম্যুলেটে নেমে আসে যেখানে আপনি জানেন যে আসল সম্পর্কটি কী এবং সেই সম্পর্কটি সত্যিকারের ডেটা বিশ্লেষণের ভিত্তিতে। তারপরে আপনি আপনার আসল ডেটা থেকে ডায়াগনস্টিক্সকে সিমুলেটেড ডেটা সেটগুলির ডায়াগনস্টিকের সাথে তুলনা করুন। vis.testআর এর জন্য TeachingDemos প্যাকেজের মধ্যে ফাংশন কাগজে প্রস্তাবনার 1 এর একটি প্রকরণ প্রয়োগ করা হয়। আরও ভাল বোঝার জন্য পুরো কাগজটি (কেবল আমার খুব সংক্ষিপ্ত সংক্ষিপ্তকরণ নয়) পড়ুন।


আমি মনে করি যে প্যাটারগুলি বা অন্যান্য প্লটগুলিতে এলোমেলোভাবে বিচ্যুত হওয়া প্যাটার্নগুলি দেখার জন্য এটি একটি সূক্ষ্ম পরামর্শ, তবে অবশিষ্টাংশগুলি দেখার সময় এটি কেবলমাত্র লক্ষ্য নয়। প্রায়শই আমরা এলোমেলো থেকে নির্দিষ্ট বিচ্যুতিগুলিতে আগ্রহী (উদাঃ হেটেরোসিসেস্টাস্টিটি, মডেলটিতে ভুল বর্ণিত অ-রৈখিকতা, বাদ দেওয়া ভেরিয়েবলস, আউটলিয়ার বা উচ্চ লিভারেজ মান ইত্যাদি)। এলোমেলোভাবে উত্পাদিত ডেটার তুলনাগুলি কীভাবে অবশিষ্টাংশগুলি এলোমেলো নয় এবং প্রতিকার নয় তা সনাক্ত করতে সত্যই সহায়তা করে না।
অ্যান্ডি ডাব্লু

@ অ্যান্ডডাব্লু, আমি মনে করি যে আমরা মূল প্রশ্নটি আলাদাভাবে ব্যাখ্যা করছি। আমার উত্তরটি গবেষককে তাদের আরও কিছু খোঁজার দরকার আছে কিনা, বা অবশিষ্ট প্লটটি যুক্তিসঙ্গত কিনা তা জানিয়ে দিয়ে তা শুরু করে। এটি যুক্তিসঙ্গত মনে না হলে কী করবেন তা হল পরবর্তী পদক্ষেপ এবং আমার উত্তর অতিক্রম করা (যদিও কিছু অতিরিক্ত অনুমান একটি নতুন সিমুলেশন ব্যবহার করে তুলনা করা যেতে পারে)।
গ্রেগ স্নো

5

এই প্রশ্নটি বেশ পুরানো, তবে আমি ভেবেছিলাম যে এটি যুক্ত করা কার্যকর হবে কারণ সাম্প্রতিককালে, আপনি কোনও জিএল (এম) এম এর অবশিষ্টাংশকে একটি মানক স্থানে রূপান্তর করতে DHARMa R প্যাকেজটি ব্যবহার করতে পারেন । একবার এটি হয়ে গেলে, আপনি দৃশ্যমানভাবে পরীক্ষা / পর্যালোচনা করতে পারেন যেমন বিতরণ থেকে বিচ্যুতি, ভবিষ্যদ্বাণীকের উপর অবশিষ্টাংশ নির্ভরতা, ভিন্ন ভিন্ন উপায়ে বা স্বতঃসংশোধন স্বাভাবিকভাবে। পরিশ্রমের উদাহরণগুলির জন্য প্যাকেজ ভিগনেট দেখুন , সিভিতে অন্যান্য প্রশ্নগুলি এখানে এবং এখানে দেখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.