সম্পূর্ণ প্রকাশ: এটি হোমওয়ার্ক। আমি ডেটাসেটের লিঙ্কটি অন্তর্ভুক্ত করেছি ( http://www.bertelsen.ca/R/logistic-regression.sav )
আমার লক্ষ্য এই ডেটা সেটে loanণ খেলাপিদের পূর্বাভাস সর্বাধিক করা।
আমি এখনও অবধি প্রতিটি মডেল নিয়ে এসেছি, 90% নন-খেলাপিদের পূর্বাভাস দেওয়া হয়, তবে <40% ডিফল্টরা শ্রেণিবিন্যাস দক্ষতা সামগ্রিকভাবে ~ 80% করে তোলে। সুতরাং, আমি ভাবছি যদি ভেরিয়েবলগুলির মধ্যে মিথস্ক্রিয়া প্রভাব থাকে? লজিস্টিক রিগ্রেশনের মধ্যে, প্রতিটি সম্ভাব্য সংমিশ্রণের পরীক্ষা করা ছাড়াও কি কোনও সম্ভাব্য মিথস্ক্রিয়া প্রভাব চিহ্নিত করার উপায় আছে? বা বিকল্পভাবে খেলাপিদের শ্রেণিবিন্যাসের দক্ষতা বাড়াতে একটি উপায়।
আমি আটকে আছি, কোনও প্রস্তাবনা আপনার শব্দের পছন্দ, আর-কোড বা এসপিএসএস সিনট্যাক্সে সহায়ক হবে।
আমার প্রাথমিক ভেরিয়েবলগুলি নিম্নলিখিত হিস্টোগ্রাম এবং স্ক্রেটারপ্লোটে বর্ণিত হয়েছে (দ্বিধাত্বক ভেরিয়েবল বাদে)
প্রাথমিক ভেরিয়েবলের বর্ণনা:
age: Age in years
employ: Years with current employer
address: Years at current address
income: Household income in thousands
debtinc: Debt to income ratio (x100)
creddebt: Credit card debt in thousands
othdebt: Other debt in thousands
default: Previously defaulted (dichotomous, yes/no, 0/1)
ed: Level of education (No HS, HS, Some College, College, Post-grad)
অতিরিক্ত ভেরিয়েবলগুলি উপরের কেবলমাত্র রূপান্তর। আমি অবিচ্ছিন্ন কয়েকটি ভেরিয়েবলকে শ্রেণিবদ্ধ ভেরিয়েবলগুলিতে রূপান্তরিত করে মডেলটিতে প্রয়োগ করার চেষ্টা করেছি, সেখানে কোনও ভাগ্য নেই।
আপনি যদি এটি আর-তে পপ করতে চান তবে দ্রুত, এটি এখানে:
## R Code
df <- read.spss(file="http://www.bertelsen.ca/R/logistic-regression.sav", use.value.labels=T, to.data.frame=T)