ধরা যাক আমার কাছে নিম্নলিখিত তথ্য রয়েছে এবং আমি একটি রিগ্রেশন মডেল চালাচ্ছি:
df=data.frame(income=c(5,3,47,8,6,5),
won=c(0,0,1,1,1,0),
age=c(18,18,23,50,19,39),
home=c(0,0,1,0,0,1))
একদিকে, আয়ের পূর্বাভাস দেওয়ার জন্য আমি একটি রৈখিক মডেল চালাই:
md1 = lm(income ~ age + home + home, data=df)
দ্বিতীয়ত, আমি জিতে থাকা ভেরিয়েবলটি সম্পর্কে ভবিষ্যদ্বাণী করতে একটি লগিট মডেল চালাই:
md2 = glm(factor(won) ~ age + home, data=df, family=binomial(link="logit"))
উভয় মডেলের জন্যই আমি অবাক হয়েছি কীভাবে আমি ভবিষ্যদ্বাণী প্রতিক্রিয়া বিভাগ, লাগানো মান এবং মডেলটির পূর্বাভাস দেওয়া মান সহ কোনও টেবিল বা ডেটা ফ্রেম তৈরি করতে পারি।
লিনিয়ার মডেলটির জন্য, এরকম কিছু:
age fitted_income predicted_income
18 3 5
23 3 3
50 4 2
19 5 5
39 6 4
home fitted_income predicted_income
0 5 6
1 3 9
অথবা সম্ভবত এটি প্রতিটি ডাটা পয়েন্টের জন্য হওয়া উচিত। সুতরাং x_i ডেটা পয়েন্টের জন্য, লাগানো এবং পূর্বাভাসের মানগুলি:
id age fitted_income predicted_income
1 18 3 5
2 23 3 3
3 50 4 2
4 19 5 5
5 39 6 4
একটি পরিসংখ্যানগত দৃষ্টিকোণ থেকে, এই ধরনের উদ্যোগ গ্রহণ দরকারী? কেন অথবা কেন নয়?
কীভাবে এটি আর এ করা যায়? (নামগুলি দেখেন (এমডি 1) এবং মডেলটি থেকে আমি কী টানতে পারি তা খুঁজে পেয়েছি তবে এর আগেও এগিয়ে যায়নি)
ধন্যবাদ!
residualsকমান্ডের মাধ্যমে পাওয়া যায় R। cbindতাদের সাথে মূল ডেটাফ্রেমে যোগ দিতে ব্যবহার করুন ।