আর এবং এসএএস-এ রিজ রিগ্রেশন বাস্তবায়নের মধ্যে পার্থক্য


10

আমি শৈলশিরা রিগ্রেশন বিবরণ পড়া হয়েছে ফলিত লিনিয়ার পরিসংখ্যানগত মডেল , 5 ম এড অধ্যায় 11. শৈলশিরা রিগ্রেশন শরীরের চর্বি ডেটা উপলব্ধ সম্পন্ন হবে এখানে

পাঠ্যপুস্তকটি এসএএস-এর আউটপুটটির সাথে মিলে যায়, যেখানে পিছনে রূপান্তরিত যেমন লাগানো মডেলটিতে দেওয়া হয়:

ওয়াই=-7,3978+ +0,5553এক্স1+ +0,3681এক্স2-0,1917এক্স3

এটি এসএএস থেকে দেখানো হয়েছে:

proc reg data = ch7tab1a outest = temp outstb noprint;
  model y = x1-x3 / ridge = 0.02;
run;
quit;
proc print data = temp;
  where _ridge_ = 0.02 and y = -1;
  var y intercept x1 x2 x3;
run;
Obs     Y    Intercept       X1         X2         X3

 2     -1     -7.40343    0.55535    0.36814    -0.19163
 3     -1      0.00000    0.54633    0.37740    -0.13687

তবে আর খুব আলাদা সহগ দেয়:

data <- read.table("http://www.cst.cmich.edu/users/lee1c/spss/V16_materials/DataSets_v16/BodyFat-TxtFormat.txt", 
                   sep=" ", header=FALSE)
data <- data[,c(1,3,5,7)]
colnames(data)<-c("x1","x2","x3","y")
ridge<-lm.ridge(y ~ ., data, lambda=0.02)   
ridge$coef
coef(ridge)

>   ridge$coef
       x1        x2        x3 
10.126984 -4.682273 -3.527010 
>   coef(ridge)
                   x1         x2         x3 
42.2181995  2.0683914 -0.9177207 -0.9921824 
> 

কেন কেউ আমাকে বুঝতে সাহায্য করতে পারে?


আমি একই ডেটা সেট ব্যবহার করেছি এবং এটি এসপিএসে বিশ্লেষণ করেছি। ফলাফল এসএএস এর অনুরূপ। তবে আমরা যদি বইটির মতো ডেটা মানক করতে পারি তবে সি = 0 এ প্রথম মানটি আর এবং এসপিএস-এ একই রকম (একাধিক লিনিয়ার রিগ্রেশন চালাচ্ছে)। যাইহোক আমরা উপরে উল্লিখিত হিসাবে আরও সরানো যখন ফলাফল একেবারে পৃথক। আমিও একই ডেটার আউটপুটগুলির মধ্যে পার্থক্যের কোনও চিহ্ন পাইনি।
Asad

উত্তর:


6

যদিও রিজ রিগ্রেশন প্রথমে সাধারণ অ্যালগরিদমের মতো দেখায় শয়তান তার বিবরণে থাকে। স্পষ্টতই আসল ভেরিয়েবলগুলি ছোট করে দেওয়া হয়েছে, এবং প্যারামিটার প্যারামিটার নয় যা আপনি মনে করেন এটির মূল বর্ণনা দেওয়া হয়েছে। আর-এর সাহায্যের পৃষ্ঠায় প্রদত্ত রেফারেন্সটি যা সংগ্রহ করেছি তা থেকে রিজ রিগ্রেশন করার কোনও রাজি নেই। সুতরাং ফলাফলের পার্থক্যটি কেবল আর এবং এসএএস দ্বারা ব্যবহৃত বিভিন্ন অ্যালগরিদম দ্বারা ব্যাখ্যা করা যেতে পারে। আশা করি আরও জ্ঞানী কেউ আরও বিস্তারিত উত্তর দিতে পারেন।λlm.ridge

আর এর উত্সটি দেখে আপনি দেখতে পারেন যে কোন ধরণের অ্যালগরিদম প্রয়োগ করা হয় lm.ridge। কেবলমাত্র lm.ridgeআর প্রম্পটে টাইপ করুন ।


আমি এই লিঙ্কটি কীভাবে lm.ridge সহগের গণনা করছে তা বোঝার জন্য সহায়ক বলে মনে করেছি: mail-archive.com/r-help@r-project.org/msg81115.html তবে এখনও আশ্চর্য হয়েছি যে আমি উল্লিখিত পাঠ্য এবং এসএএস-এর পাঠ্য থেকে ফলাফলগুলি কতটা আলাদা? প্রদত্ত, প্রতিটি অনুমান করা হয় যে মূল স্কেল ফিরে।
বি_মিনার

@ ইউজার ২০৪০, এসএএস এবং আর দ্বারা একই ডেটা ব্যবহার করা হয়েছে তা পরীক্ষা করে দেখুন it এটি একই হয়, তবে একমাত্র উপসংহারটি এলো যে অ্যালগরিদমগুলি আলাদা। এসএএস সহায়তা পৃষ্ঠাটি কী বলছে?
এমপিটিকাস

@ ব্যবহারকারী ২০৪০, আমি আপনার ডেটা দিয়ে আর-এ এসএএস রিজ রিগ্রেশনটি প্রতিলিপি করেছি । সুতরাং আমরা নিশ্চিতভাবে জানি যে অ্যালগরিদমগুলি আলাদা।
এমপিটিকাস

1
তুমি আমাকে শুধু মারধর করেছ! :) আমি আপনাকে উল্লেখ করা এসএএস সহায়তা পৃষ্ঠাটি দেখছিলাম। আমি আরএমএসই তুলনা করেছি (কেবলমাত্র নমুনা তথ্য, এখনও কোনও সিভি বা বুটস্ট্র্যাপের সাহায্যে বৈধতা দেয় নি) এবং আর ফলাফলটি উত্তম ছিল o সুতরাং, আপনি কি ভাবেন যে রিজ রিগ্রেশন পূর্বাভাসের জন্য উপযুক্ত এবং গুণফলগুলি ব্যাখ্যা করার জন্য নয় (যেহেতু ফলাফলগুলি পারে অ্যালগোরিদম দ্বারা এত আলাদা হতে হবে)? আমি ইতিমধ্যে জানি যে নিয়মিত রৈখিক মডেল তত্ত্ব (সিআই এর, বিপরীতে ইত্যাদি) বাইরে বেরিয়ে আসে (বুটস্ট্র্যাপিং কাছাকাছি হয়ে যায় তবে পক্ষপাতের কারণে বিভ্রান্তিকর হতে পারে)।
বি_মিনার

0

Lm.ridge ব্যবহার করে স্কেলিং ভেক্টরও তৈরি হয় (সমস্ত আউটপুট দেখতে হেড (মডেল) চেষ্টা করুন)। আর-এ পূর্বাভাসিত মানগুলি পেতে যেটি আপনি এসএএস-তে দেখেন সেগুলি সহগকে নিয়ে যান এবং স্কেলার ভেক্টর দ্বারা বিভক্ত হয়।


2
আমি যে ফলাফল পেতে চাই না, আপনি দয়া করে বর্ণনা করতে পারেন?
বি_মিনার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.