আমার কাছে 9 অবিচ্ছিন্ন স্বতন্ত্র ভেরিয়েবলগুলি সহ একটি ডেটাসেট রয়েছে। আমি একক শতাংশ (নির্ভরশীল) ভেরিয়েবলের সাথে কোনও মডেল ফিট করতে এই ভেরিয়েবলগুলির মধ্যে নির্বাচন করার চেষ্টা করছি Score
। দুর্ভাগ্যক্রমে, আমি জানি যে বেশ কয়েকটি ভেরিয়েবলের মধ্যে গুরুতর সহপাঠ্যতা থাকবে।
আমি stepAIC()
ভেরিয়েবল নির্বাচনের জন্য ফাংশনটি ব্যবহার করার চেষ্টা করেছি , তবে সেই পদ্ধতিটি, অদ্ভুতভাবে, সমীকরণের মধ্যে ভেরিয়েবলগুলি তালিকাভুক্ত করার ক্রমটি সংবেদনশীল বলে মনে হচ্ছে ...
এখানে আমার আর কোড (কারণ এটি শতাংশের ডেটা, আমি স্কোরের জন্য লগইট ট্রান্সফর্মেশন ব্যবহার করি):
library(MASS)
library(car)
data.tst = read.table("data.txt",header=T)
data.lm = lm(logit(Score) ~ Var1 + Var2 + Var3 + Var4 + Var5 + Var6 + Var7 +
Var8 + Var9, data = data.tst)
step = stepAIC(data.lm, direction="both")
summary(step)
কিছু কারণে, আমি খুঁজে পেয়েছি যে সমীকরণের শুরুতে তালিকাভুক্ত ভেরিয়েবলগুলি stepAIC()
ফাংশন দ্বারা নির্বাচিত হয়ে যায় এবং ফলাফলটি তালিকা দ্বারা উদাহরণস্বরূপ, Var9
প্রথমে (টিলড অনুসরণ করে) পরিচালনা করা যেতে পারে ulated
এখানে কোনও মডেল ফিট করার আরও কার্যকর (এবং কম বিতর্কিত) উপায় কী? আমি লিনিয়ার রিগ্রেশন ব্যবহারের পক্ষে আসলে নির্ধারিত নই: কেবলমাত্র 9 টি ভেরিয়েবলের মধ্যে কোনটি ভেরিয়েবলের মধ্যে সত্যতা পরিবর্তিত করে তা বুঝতে সক্ষম হ'ল কেবলমাত্র আমি চাই Score
। অগ্রাধিকার হিসাবে, এটি এমন কিছু পদ্ধতি হবে যা এই 9 টি ভেরিয়েবলগুলিকে একত্রিত করার জন্য শক্তিশালী সম্ভাবনা গ্রহণ করে।
Score
" তা বুঝতে সক্ষম হ'ল এটি আমার এই বাক্য যা আমি অতিরিক্ত মাত্রায় দৃষ্টি নিবদ্ধ করেছিলাম। দৃ strong় সহপাঠের উপস্থিতিতে লাসো কমপক্ষে ওপি'র মন্তব্যের আরও কঠোর ব্যাখ্যায় সেটিকে সাহায্য করবে না।