সাধারণ লিনিয়ার রিগ্রেশন ফলাফলের রিপোর্টিং: কোন তথ্য অন্তর্ভুক্ত করতে হবে?


11

আমি জেনস্টাতে সবেমাত্র কিছু (খুব) সাধারণ লিনিয়ার রিগ্রেশন করেছি এবং আমার প্রতিবেদনে আউটপুটটির একটি সংক্ষিপ্ত এবং অর্থপূর্ণ সংক্ষিপ্তসারটি অন্তর্ভুক্ত করতে চাই। আমার ঠিক কী বা কতটা তথ্য অন্তর্ভুক্ত করা উচিত তা আমি নিশ্চিত নই।

আমার জেনস্ট্যাট আউটপুট এর প্রধান বিটগুলি দেখতে দেখতে:

Summary of analysis 
Source      d.f.    s.s.       m.s.       v.r.    F pr.
Regression    1   8128935.   8128935.    814.41   <.001
Residual     53    529015.      9981.        
Total        54   8657950.    160332.        

Percentage variance accounted for 93.8
Standard error of observations is estimated to be 99.9.

Estimates of parameters 
Parameter    estimate    s.e.     t(53)   t pr.
Constant      41.5      30.7       1.35   0.182
UKHR_Ref       0.8659    0.0303   28.54   <.001

আমি এই হিসাবে সহজভাবে রিপোর্ট করার ইচ্ছা ছিল:

Adjusted R2 = 0.94 (slope = 0.87, p < 0.001; intercept not significantly different from 0).

তবে একজন সহকর্মী পরামর্শ দিয়েছেন যে আমারও অন্তত অন্তত অন্তর্ভুক্ত করা উচিত root mean squared error(যা আমি এই ক্ষেত্রে বিশ্বাস করি তা পর্যবেক্ষণগুলির স্ট্যান্ডার্ড ত্রুটির সাথে সমান, অর্থাৎ 99.9?)।

আরএমএসই সহ কী আরও অতিরিক্ত দরকারী তথ্য সরবরাহ করে, বা ফিটের সার্থকতা ইতিমধ্যে সামঞ্জস্য-আর 2 মান দ্বারা পর্যাপ্তভাবে ব্যাখ্যা করা হয়েছে?

কত তথ্যের রিপোর্ট করতে হবে তার জন্য কি কঠোর এবং দ্রুত নিয়ম রয়েছে, বা এটি মোটামুটি বিষয়গত?

অনেক ধন্যবাদ!


1
"কতটা তথ্য জানাতে হবে তার জন্য কি কঠোর এবং দ্রুত নিয়ম রয়েছে" - এটি রিগ্রেশন পরে আপনি কী করতে চান তার উপর নির্ভর করে। একমাত্র পারস্পরিক সম্পর্ক সহগ দ্বারা খুশি হতে পারে; তার উপরে ডার্বিন-ওয়াটসন মানের প্রয়োজন হতে পারে এবং অন্য কেউ হ্যাট ম্যাট্রিক্সের তির্যকটি দেখতে চাইতে পারে ... এটি সত্যই নির্ভর করে।
জেএম কোনও

2
কিছু সংস্থার বিধি রয়েছে। উদাহরণস্বরূপ এপিএ নির্দেশিকা দেখুন ।
whuber

উত্তর:


6

একটি সাধারণ লিনিয়ার রিগ্রেশন জন্য, আমি সর্বদা y ভেরিয়েবলের বিপরীতে এক্স ভেরিয়েবলের একটি প্লট তৈরি করবো, রিগ্রেশন লাইনটি প্লটের উপর অতিরিক্ত চাপিয়ে দেওয়া হয় (যখনই এটি সম্ভব হয় ততক্ষণ আপনার ডেটা প্লট করে!)। এটি আপনাকে খুব সহজেই বলে দেবে যে আপনার মডেলটি কতটা ফিট করে এবং 1 টি ভেরিয়েবল রিগ্রেশনের জন্য পড়া সহজ। আপনি ইতিমধ্যে যা পেয়েছেন তাতে এটি যোগ করা সম্ভবত যথেষ্ট হবে, যদিও আপনি কিছু ডায়াগোনস্টিক প্লট (লিভারেজ, রান্নার দূরত্ব, অবশিষ্টাংশ ইত্যাদি) অন্তর্ভুক্ত করতে চাইতে পারেন। এটি নির্ভর করে যে জাইয়ের প্লটটি কতটা ভাল, এবং আপনার লক্ষ্য দর্শকদের এবং আপনার শ্রোতাদের যে কোনও প্রোটোকল আশা করে on

R2 বনাম আরএমএসই

± ± 2 আর 2R2 হিসাবে আপনি সবচেয়ে পর্যবেক্ষণের মধ্যে হতে আশা করবে আপেক্ষিক পরিমাপ, যেহেতু RMSE একটি পরম পরিমাপ বেশি হয় মধ্যে হতে লাগানো লাইন থেকে RMSE, এবং প্রায় সব RMSE। আপনি যদি "ব্যাখ্যামূলক শক্তি" বোঝাতে চান তবে আর vey সম্ভবত আরও ভাল, এবং আপনি যদি "ভবিষ্যদ্বাণীমূলক শক্তি" জানাতে চান তবে আরএমএসই সম্ভবত আরও ভাল।±±2R2


ধন্যবাদ @ প্রোব্যাবিলিটিস্লোগিক। আমি আমার প্রতিবেদনে একটি চক্রান্ত অন্তর্ভুক্ত করেছি এবং এটির মতো মনে হচ্ছে যে আমার মূল বাক্যটি এই ক্ষেত্রে যথেষ্ট হওয়া উচিত। আমি মনে করি ডায়াগনস্টিক প্লটগুলি সহ সম্ভবত এই শ্রোতাদের জন্য অপ্রয়োজনীয়, যদিও আমি স্পষ্টতই সেগুলি নিজেই পরীক্ষা করে দেখেছি এবং সেগুলি যুক্তিসঙ্গত মনে হচ্ছে। আর 2 বনাম আরএমএসই এর ব্যাখ্যার জন্য ধন্যবাদ - এটি খুব সহায়ক।
জেমস

টি-মান (গুলি) এবং ডিএফ (গুলি) সম্পর্কে কী? এগুলি কখন অন্তর্ভুক্ত করা উচিত? এটি শুধুমাত্র জানার উভয় অন্তর্ভুক্ত করা বা তন্ন তন্ন?
বাদামি ন্যাটি

1

আমি β গুণফলের সাথে আরও 95% সিআই, পি মান এবং অ্যাডজাস্টেড রিকোয়ার্ড প্রতিবেদন করতে ব্যবহার করি। উদা:

(β = 1.46, 95% সিআই [1.19, 1.8], পি = 0.001 **, অ্যাডজাস্টেড আর 2 = 0.48)

যদি একাধিক রিগ্রেশন বা ফ্যাক্টর ভেরিয়েবলগুলির সাথে কোনও রিগ্রেশনের প্রতিবেদন করা হয়, তবে আমি সহগ, 95% সিআই, পি মানগুলি এবং তারপরে পৃথকভাবে এফ (স্বাধীনতার অবনতি) পরিসংখ্যান, অ্যাডজাস্টেড আর 2 এবং মডেলের পি মানটি প্রতিবেদন করি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.