আমি লাসো রিগ্রেশন সহ যেখানে আমার আগ্রহের ফলাফলটি দ্বিধাহীন তা ব্যবহার glmnet
করে ধকল শুরু করছি । আমি নীচে একটি ছোট মক ডেটা ফ্রেম তৈরি করেছি:
age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7)
gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0)
bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88)
m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1)
p_edu <- c(0, 2, 2, 2, 2, 3, 2, 0, 0)
f_color <- c("blue", "blue", "yellow", "red", "red", "yellow", "yellow",
"red", "yellow")
asthma <- c(1, 1, 0, 1, 0, 0, 0, 1, 1)
# df is a data frame for further use!
df <- data.frame(age, gender, bmi_p, m_edu, p_edu, f_color, asthma)
উপরের ডেটাসেটের কলামগুলি (ভেরিয়েবলগুলি) নিম্নরূপ:
age
(বছর বয়সের সন্তানের বয়স) - অবিচ্ছিন্নgender
- বাইনারি (1 = পুরুষ; 0 = মহিলা)bmi_p
(বিএমআই পারসেন্টাইল) - অবিচ্ছিন্নm_edu
(মা সর্বোচ্চ শিক্ষার স্তর) - অর্ডিনাল (উচ্চ বিদ্যালয়ের চেয়ে 0 = কম; 1 = উচ্চ বিদ্যালয়ের ডিপ্লোমা; 2 = ব্যাচেলর ডিগ্রি; 3 = স্নাতকোত্তর ডিগ্রি)p_edu
(পিতা সর্বোচ্চ শিক্ষার স্তর) - অর্ডিনাল (এম_ইডু হিসাবে একই)f_color
(প্রিয় প্রাথমিক রঙ) - নামমাত্র ("নীল", "লাল", বা "হলুদ")asthma
(শিশু হাঁপানির স্থিতি) - বাইনারি (1 = হাঁপানি; 0 = হাঁপানি)
এই উদাহরণে লক্ষ্য 6 সম্ভাব্য predictor ভেরিয়েবল (তালিকা থেকে একটি মডেল পূর্বাভাসের শিশু হাঁপানি অবস্থা তৈরি করতে Lasso ব্যবহার করতে হয় age
, gender
, bmi_p
, m_edu
, p_edu
, এবং f_color
)। স্পষ্টতই নমুনার আকার এখানে একটি সমস্যা, তবে আমি glmnet
ফলাফলটি বাইনারি হওয়ার সময় কাঠামোর মধ্যে বিভিন্ন ধরণের ভেরিয়েবলগুলি (যেমন, ধারাবাহিক, নিয়মিত, নামমাত্র এবং বাইনারি) কীভাবে পরিচালনা করব সে সম্পর্কে আরও অন্তর্দৃষ্টি অর্জনের প্রত্যাশা করছি ( ; 0 = হাঁপানি নেই)।
যেমন, কেউ R
হাঁপানির অবস্থা সম্পর্কে ভবিষ্যদ্বাণী করতে উপরের ডেটা সহ লাসো ব্যবহার করে এই মক উদাহরণটির ব্যাখ্যা সহ একটি নমুনা স্ক্রিপ্ট সরবরাহ করতে ইচ্ছুক হবে ? যদিও খুব বেসিক, আমি জানি আমি এবং সম্ভবত সিভিতে থাকা আরও অনেকেই এর প্রশংসা করবে!
glmnet
বাইনারি ফলাফলের সাথে ক্রিয়াকলাপের একটি উদাহরণ দেখতে চাই ।
dput
কোনও আসল আর অবজেক্টের হিসাবে ডেটা পোস্ট করেন তবে আপনি আরও ভাগ্য পেতে পারেন ; পাঠকদের উপরে ফ্রস্টিং তৈরি করার পাশাপাশি আপনাকে একটি কেক বেক করবেন না! আপনি যদি আরে যথাযথ ডেটা ফ্রেম তৈরি করেন, বলুনfoo
, তারপরে প্রশ্নটির আউটপুটটি সম্পাদনা করুনdput(foo)
।