লগ-লিঙ্কযুক্ত গামা জিএলএম বনাম লগ-লিঙ্কযুক্ত গাউশিয়ান জিএলএম বনাম লগ-ট্রান্সফর্মড এলএম


13

আমার ফলাফলগুলি থেকে, এটি প্রদর্শিত হয় যে GLM গামা বেশিরভাগ অনুমানের সাথে মিলিত হয়, তবে এটি কি লগ-রুপান্তরিত এলএমের তুলনায় সার্থক উন্নতি? বেশিরভাগ সাহিত্যে আমি পাইসন বা বোনমিয়াল জিএলএমগুলির সাথে চুক্তি পেয়েছি। আমি জেনারালাইজড লাইনার মডেল এসেসমেন্টস রেন্ডোমাইজেশন ব্যবহার করে খুব কার্যকর বলে নিবন্ধটি পেয়েছি , তবে এটিতে সিদ্ধান্ত নেওয়ার জন্য ব্যবহৃত প্রকৃত প্লটগুলির অভাব রয়েছে। আশা করি অভিজ্ঞতার সাথে কেউ আমাকে সঠিক দিকে নির্দেশ করতে পারেন।

আমি আমার প্রতিক্রিয়া ভেরিয়েবল টি এর বিতরণ মডেল করতে চাই, যার বিতরণটি নীচে প্লট করা হয়েছে। যেহেতু আপনি দেখতে পারেন, এটা ইতিবাচক বক্রতা হল:
বৈধ এক্সএইচটিএমএল

আমার দু'টি শ্রেণীবদ্ধ বিষয় বিবেচনা করতে হবে: মেথ এবং ক্যাসেট পার্ট।
নোট করুন যে এই অধ্যয়নটি মূলত অন্বেষণকারী, কোনও মডেলকে তাত্ত্বিক করে তোলার আগে এবং এর চারপাশে ডিওই করার আগে প্রয়োজনীয়ভাবে পাইলট স্টাডির কাজ করে।

আমার ডায়াগনস্টিক প্লটগুলি সহ আরে নিম্নলিখিত মডেলগুলি রয়েছে:

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

বৈধ এক্সএইচটিএমএল
বৈধ এক্সএইচটিএমএল

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

বৈধ এক্সএইচটিএমএল
বৈধ এক্সএইচটিএমএল

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

বৈধ এক্সএইচটিএমএল
বৈধ এক্সএইচটিএমএল

আমি অবশিষ্টাংশগুলিতে শাপিরো-উইলক্স পরীক্ষার মাধ্যমে নিম্নলিখিত পি-মানগুলিও অর্জন করেছি:

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

আমি এআইসি এবং বিআইসি মানগুলি গণনা করেছি, তবে আমি যদি সঠিক হয় তবে জিএলএম / এলএম-এর বিভিন্ন পরিবারের কারণে তারা আমাকে বেশি কিছু বলেন না।

এছাড়াও, আমি চূড়ান্ত মানগুলি উল্লেখ করেছি, তবে কোনও স্পষ্ট "বিশেষ কারণ" না থাকায় আমি সেগুলি আউটলিয়ার হিসাবে শ্রেণিবদ্ধ করতে পারি না।



1
এটি লক্ষণীয় যে সমস্ত তিনটি মডেলই এই অর্থে গুণক যে একটি রেজিস্ট্রারের বৃদ্ধি সাধারণ প্রতিক্রিয়ার তুলনামূলক পরিবর্তনের সাথে সম্পর্কিত। দুটি লগ-লিনিয়ার জিএলএমগুলির জন্য, "সাধারণ" অর্থ পাটিগণিত মানে, লগ-রুপান্তরিত এলএমের জন্য আমরা জ্যামিতিক উপায়ের বিষয়ে কথা বলছি। সুতরাং, আপনি প্রভাব এবং পূর্বাভাসের যেভাবে ব্যাখ্যা করতে চান তাও মডেল পছন্দের জন্য একটি ড্রাইভিং ফ্যাক্টর, কেবলমাত্র সঠিক অবশিষ্টাংশের প্লট নেই (এগুলি যে কোনও উপায়ে চালিত ডেটা)।
মাইকেল এম

@ মিশেলমায়ার - প্রতিক্রিয়াটির জন্য ধন্যবাদ, খুব সহায়ক। পছন্দটি ব্যাখ্যাটি কীভাবে প্রভাবিত করে আপনি তার উপর খানিকটা প্রসারিত করতে পারেন? বা আমাকে একটি রেফারেন্সের দিক নির্দেশ করুন?
TLJ

@ মার্সিন্থেবক্স- পোস্ট করার আগে আমি এই প্রশ্নটি দেখেছি। খুব সংক্ষিপ্তভাবে আমার প্রশ্নের উত্তর দেয় না।
TLJ

উত্তর:


19

ভাল, বেশ স্পষ্টভাবে গাউসের সাথে লগ-লিনিয়ার ফিট উপযুক্ত নয়; অবশিষ্টাংশে শক্তিশালী ভিন্ন ভিন্নতা আছে। সুতরাং আসুন বিবেচনার বাইরে নেওয়া যাক।

যা অবশিষ্ট আছে তা লগন্যরমাল বনাম গামা।

নোট করুন যে এর হিস্টগ্রামের কোনও সরাসরি ব্যবহার নেই, যেহেতু প্রান্তিক বিতরণটি হ'ল পরিবর্তনের মিশ্রণ হবে (প্রত্যেকটি ভবিষ্যদ্বাণীকারীদের জন্য আলাদা আলাদা মানের মান অনুসারে); এমনকি দুটি মডেলের মধ্যে একটি সঠিক হলেও, এই প্লটটি শর্তযুক্ত বিতরণের মতো দেখতে কিছুই পাবে না।T

উভয় মডেলই এক্ষেত্রে সমানভাবে উপযুক্ত হিসাবে উপস্থিত হয়। এগুলির উভয়েরই গড়ের বর্গক্ষেত্রের সমানুপাতিক রয়েছে, তাই ফিটের বিরুদ্ধে অবশিষ্টাংশগুলিতে ছড়িয়ে দেওয়ার ধরণটি একই।

একটি নিম্ন আউটলেট লগমনরমাল (একটি উচ্চ আউটলেটারের বিপরীতে) এর চেয়ে গামার সাথে কিছুটা ভাল ফিট করে। একটি নির্দিষ্ট গড় এবং বৈকল্পিকভাবে, লগনরমালটি আরও বেশি স্কিউ হয় এবং তার প্রকরণের উচ্চতর সহগ থাকে।

একটি বিষয় মনে রাখবেন যে লগনরমালের প্রত্যাশাটি ; আপনি যদি গড় আগ্রহী হন তবে আপনি কেবল লগ স্কেল ফিট ফিট করতে পারবেন না। প্রকৃতপক্ষে, আপনি যদি গড়টির বিষয়ে আগ্রহী হন তবে গামা লগনরমাল সহ বেশ কয়েকটি সমস্যা এড়িয়ে চলে (যেমন একবার লগনারমেলে মধ্যে প্যারামিটারের অনিশ্চয়তা যুক্ত করলে লগ-টি বিতরণের উপর ভিত্তি করে আপনার ভবিষ্যদ্বাণী থাকে, যা না করে ' t এর একটি অর্থ নেই Pexp(μ)σ2

কিছু সম্পর্কিত আলোচনার জন্য এখানে এবং এখানে দেখুন ।


1
@ Gleb_b এই উত্তরটি আমার বিশ্লেষণের জন্য খুব দরকারী। আমার কিছু প্রশ্ন আছে। (1) প্রথমত, এই 'উভয়ের গড়ের স্কোয়ারের সাথে আনুপাতিক আনুপাতিকতা আছে ...' অবশিষ্টাংশ বনাম লাগানো প্লটের ভিত্তিতে? (২) এবং এটি কি কিউকিউ প্লটের উপর ভিত্তি করে ... একটি নিম্ন আউটলেট কোনও গ্যামার সাথে কিছুটা ভাল ফিট করবে ... নির্দিষ্ট পরিমাণে এবং বৈকল্পিক ভিত্তিতে, ... 'কিউকি প্লটের ভিত্তিতে? (৩) আমি যে বিষয়টি গ্ল্যাম (উদাহরণস্বরূপ গামা, পোয়েসন এবং নেতিবাচক দ্বিপদী) বুঝি তার থেকে অবশিষ্টাংশের স্বাভাবিকতা এবং বৈচিত্র্যের এককত্বের অনুমান নেই। যদি তা হয় তবে কেন প্ল্যাটফর্মের প্ল্যাটফর্ম বনাম লাগানো এবং সাধারণ কিউকিউ প্লট ডায়াগনস্টিকসের জন্য প্রাসঙ্গিক হবে?
তাতামি

2
এটি সম্পূর্ণ নতুন প্রশ্ন হিসাবে যথেষ্ট, বা সত্যই বেশ কয়েকটি (যার বেশিরভাগই ইতিমধ্যে আমাদের সাইটে উত্তর দেওয়া হয়েছে!) - মডেলের ১. অংশ। ২. না, এগুলি বিতরণ সম্পর্কে সাধারণ তথ্য। ৩. সঠিক যে তারা স্বাভাবিক নয়, তবে কিউকিউ প্লটে ব্যবহৃত অবশিষ্টাংশগুলি (অভ্যন্তরীণভাবে স্টাডিটাইজড) ডিভ্যান্সের অবশিষ্টাংশগুলি - বিশেষত গামার ক্ষেত্রে - সাধারণত বিতরণের খুব কাছাকাছি থাকে (আমি একটি উত্তর লিখেছিলাম কেন তা ব্যাখ্যা করে) কিছু পয়েন্ট) এবং অবশ্যই ধ্রুব বৈকল্পিক হওয়া উচিত। স্বাভাবিকতা থেকে কিছু বিচ্যুতি অপ্রত্যাশিত নয় তবে যথেষ্ট বিচ্যুতি ... সিটিডি
Glen_b -Rininstate মনিকা

2
সিটিডি ... স্বাভাবিকতা থেকে (অন্যান্য প্লটগুলি ভাল মনে করে) বন্টনীয় অনুমানের সাথে কোনও সমস্যা নির্দেশ করতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.