জিএলএম আর তে অবশিষ্ট ও নাল ডিভ্যান্সের ব্যাখ্যা করা


47

আর-এ জিএলএম-এ নাল এবং অবশিষ্ট অব্যবস্থাটি কীভাবে ব্যাখ্যা করবেন? মত, আমরা বলি যে ছোট এআইসি আরও ভাল। বিচ্যুতিগুলির জন্যও কি একই রকম এবং দ্রুত ব্যাখ্যা আছে?

নাল বিচ্যুতি: স্বাধীনতার 1077 ডিগ্রিতে 1146.1 অবশিষ্ট অব্যাহতি: স্বাধীনতার 1099 ডিগ্রিতে 4589.4 এআইসি: 11089

উত্তর:


74

এলএল = লগইনকোস্টিলিটি যাক

সংক্ষিপ্তসার (glm.fit) আউটপুট থেকে আপনি যা দেখেন তার একটি দ্রুত সংক্ষিপ্তসার এখানে দেওয়া হয়েছে,

নাল ডিভায়েন্স = 2 (এলএল (স্যাচুরেটেড মডেল) - এলএল (নাল মডেল)) এ ডিএফ = ডিএফ_স্যাট - ডিএফ_ নাল

অবশিষ্ট অব্যবস্থা = 2 (এলএল (স্যাচুরেটেড মডেল) - এলএল (প্রস্তাবিত মডেল)) ডিএফ = ডিএফ_স্যাট - ডিএফ_প্রপোজড

পরিপূর্ণ মডেল একটি মডেল প্রতিটি ডাটা পয়েন্ট অনুমান নিজস্ব প্যারামিটার আছে (যা মানে কি অনুমান করার জন্য পরামিতি এন রয়েছে।)

নাল মডেল , সঠিক "বিপরীত" অনুমান যে আপনি মাত্র 1 পরামিতি অনুমান যার মানে ডাটা পয়েন্টের সব জন্য এক প্যারামিটার হয়, অনুমান।

প্রস্তাবিত মডেল অনুমান যাতে আপনি পি + 1 টি পরামিতি আপনি পি পরামিতি + একটি পথিমধ্যে শব্দটি সঙ্গে আপনার ডাটা পয়েন্টের ব্যাখ্যা করতে পারেন।

যদি আপনার নাল ডিভায়েন্স সত্যিই ছোট হয় তবে এর অর্থ হ'ল নাল মডেলটি ডেটাটি বেশ ভালভাবে ব্যাখ্যা করে। তেমনি আপনার অবশিষ্ট অব্যবস্থা সাথে

আসলে ছোট বলতে কী বোঝায়? আপনার মডেল "ভালো" হলে আপনার বক্রতা স্বাধীন ডিগ্রীগুলির - প্রায় (df_model df_sat) সঙ্গে চি ^ 2 হয়।

আপনি যদি আপনার প্রস্তাবিত মডেলের সাথে নুল মডেলটি তুলনা করতে চান তবে আপনি দেখতে পারেন

(নাল ডিভায়েন্স - অবশিষ্ট ডিভ্যান্স) প্রায় চি ^ 2 এর সাথে df প্রস্তাবিত - df নাল = (এন- (পি + 1)) - (এন -1) = পি

আপনি সরাসরি আর থেকে ফলাফল দিয়েছেন? এগুলি কিছুটা অদ্ভুত বলে মনে হচ্ছে, কারণ সাধারণত আপনার দেখতে পাওয়া উচিত যে নুলের উপরে প্রকাশিত স্বাধীনতার ডিগ্রিগুলি সর্বদা অবশিষ্টাংশে প্রকাশিত স্বাধীনতার ডিগ্রির চেয়ে বেশি। এ কারণেই আবার, নাল ডিভায়েন্স ডিএফ = স্যাচুরেটেড ডিএফ - নুল ডিএফ = এন -1 অবশিষ্ট ডিভ্যান্স ডিএফ = স্যাচুরেটেড ডিএফ - প্রস্তাবিত ডিএফ = এন- (পি + 1)


হ্যাঁ, এটি একটি খুব দরকারী লিখন আপ @ টেরেসাস্ট্যাট, ধন্যবাদ। এটা কতটা শক্ত? আপনি যদি একটি পরিবর্তে বহুজাতিক মডেল সম্পর্কে কথা বলছেন তবে সংজ্ঞাগুলি কি বদলে যাবে GLM?
হ্যাক-আর

@ টেরেসা: হ্যাঁ, এই ফলাফলগুলি আর থেকে এসেছে this কেন এমন হবে? এখানে মডেল নিয়ে কোন সমস্যা?
অঞ্জলি

@ হ্যাক-আর: এইরকম দেরিতে সাড়া পাওয়ার জন্য দুঃখিত, আমি স্ট্যাকেক্সচেঞ্জে নতুন। বহুজাতিক মডেলগুলির জন্য আপনি আর তে গ্ল্যাম ফাংশন ব্যবহার করবেন না এবং আউটপুট আলাদা। আপনি একটি আনুপাতিক প্রতিকূল মডেল বা অর্ডিনাল রিগ্রেশন, ম্লগিট ফাংশনটি দেখতে হবে। মাল্টিনোমিয়াল গ্ল্যামস নিয়ে কিছুটা পড়া ভাল, তাদের কিছুটা আলাদা ধারণা আছে different বিরতির সময় যদি আমি এটিতে পেতে পারি তবে আমি আরও কিছু তথ্য দিয়ে এটি আপডেট করব।
টেরেস্ট্যাট

@ অঞ্জলি, আপনি কেন আর এর মতো ফলাফল পাবেন তা আমি নিশ্চিত নই your আপনার ডেটা / ফলাফলগুলি না দেখে আপনার জানা মুশকিল। সাধারণভাবে, আমি দেখতে পাচ্ছি না কেন মুক্তির অবশিষ্টাংশগুলি নাল ডিএফের চেয়ে বেশি হবে। আপনি কতটি পরামিতি অনুমান করছেন?
টেরেস্ট্যাট

1
@ ব্যবহারকারী 4050 সাধারণভাবে মডেলিংয়ের লক্ষ্যটি আপনার প্রতিক্রিয়া সম্পর্কে সর্বাধিক ব্যাখ্যা করতে খুব কম সংখ্যক পরামিতি ব্যবহার করে দেখা যায়। কয়টি প্যারামিটার ব্যবহার করবেন তা নির্ধারণের জন্য আপনাকে আরও একটি প্যারামিটার যুক্ত করার সুবিধাটি দেখতে হবে। যদি কোনও অতিরিক্ত প্যারামিটার আপনার ছোট মডেল থেকে প্রচুর পরিমাণে (উচ্চ বিচ্যুতি তৈরি করে) ব্যাখ্যা করে তবে আপনার অতিরিক্ত প্যারামিটার প্রয়োজন। কত কি তা প্রমাণ করার জন্য আপনার পরিসংখ্যান তত্ত্বের প্রয়োজন। তত্ত্বটি আমাদের জানান যে বিচ্যুতিটি আপনার দুটি মডেলের মধ্যে পরামিতিগুলির পার্থক্যের সমান স্বাধীনতার ডিগ্রি সহ চি স্কোয়ার। এটা কি পরিষ্কার?
টেরেস্ট্যাট

13

নাল বিচ্যুতি প্রদর্শন করে যে মডেল দ্বারা একটি বিরতি ছাড়া কিছুই ছাড়া প্রতিক্রিয়াটি কতটা ভালভাবে অনুমান করা হয়েছিল।

যখন ভবিষ্যদ্বাণীকারীদের অন্তর্ভুক্ত করা হয় তখন অবশেষের বিচ্যুতিটি মডেল দ্বারা প্রতিক্রিয়াটি কতটা ভালভাবে অনুমান করা যায় তা দেখায়। আপনার উদাহরণ থেকে দেখা যাবে যে 22 ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলি যুক্ত করা হলে বিচ্যুতি 3443 বেড়ে যায় (দ্রষ্টব্য: স্বাধীনতার ডিগ্রি = পর্যবেক্ষণের সংখ্যা - ভবিষ্যদ্বাণীকারীদের সংখ্যা)। বিচ্যুতির এই বৃদ্ধি ফিটের উল্লেখযোগ্য অভাবের প্রমাণ।

নাল অনুমানটি সত্য কিনা তা পরীক্ষা করার জন্য আমরা অবশিষ্টাংশের বিচ্যুতিও ব্যবহার করতে পারি (যেমন লজিস্টিক রিগ্রেশন মডেল তথ্যের জন্য পর্যাপ্ত ফিট সরবরাহ করে)। এটি সম্ভব হয় কারণ বিচ্যুতিটি স্বাধীনতার একটি নির্দিষ্ট ডিগ্রীতে চি-স্কোয়ার মান দ্বারা দেওয়া হয়। তাত্পর্য পরীক্ষা করার জন্য, আমরা নীচে সূত্রটি ব্যবহার করে যুক্ত পি-মানগুলি খুঁজে পেতে পারি:

p-value = 1 - pchisq(deviance, degrees of freedom)

রেসিডুয়াল ডিভেনশন এবং ডিএফের উপরের মানগুলি ব্যবহার করে আপনি প্রায় শূন্যের একটি পি-মান পেয়ে দেখান যে নাল অনুমানকে সমর্থন করার জন্য প্রমাণের উল্লেখযোগ্য অভাব রয়েছে।

> 1 - pchisq(4589.4, 1099)
[1] 0

2
আপনি কীভাবে জানবেন যে পূর্বাভাসীর ভেরিয়েবলগুলির বিচ্যুতি এবং সংখ্যার ভিত্তিতে ভাল / খারাপ ফিটের জন্য কাটা বন্ধ কী (পিচিস্কি ছাড়াই)? এটি কি কেবলমাত্র যদি অবশিষ্ট অবধি> নুল ডিভ্যান্স হয় বা কিছু রেঞ্জ / অনুপাত থাকে?
হ্যাক-আর

3
আপনার উত্তরটি ভুল নয়, তবে ভুল বোঝাবুঝির বিষয়। আসলে এটি ভুল বুঝে গেছে (সিএফ এখানে )। এর আলোকে, আপনি কি আপনার কোডের সাথে অন্তর্ভুক্ত রয়েছে সেই পার্থক্যগুলি পরিষ্কার করতে পারেন?
গুং - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.