এই সিদ্ধান্তের প্রয়োজনীয়তার জন্য আমি তাত্ক্ষণিকভাবে ভাবতে পারি, তা হ'ল কোনও রিগ্রেশনে ক্রমাগত বা শ্রেণিবদ্ধ হিসাবে কোনও পরিবর্তনকে অন্তর্ভুক্ত করার বিষয়ে সিদ্ধান্ত নেওয়া।
প্রথমে, কখনও কখনও আপনার কোনও পছন্দ থাকে না: চরিত্রের ভেরিয়েবল বা উপাদানগুলি (যেখানে ডেটা সরবরাহকারী কেউ আপনার পক্ষে সিদ্ধান্ত নিয়েছে) স্পষ্টতই শ্রেণিবদ্ধ হয়।
x1
- 1.52.5x
x1<-sample(c(-1.5, 2.5), 1000)
length(unique(x1)) #absolute number of different variables
length(unique(x1))/length(x1) #relative
x2<-runif(1000)
length(unique(x2)) #absolute number of different variables
length(unique(x2))/length(x2) #relative
আমি বলতে চাই যে একটি ভেরিয়েবলের কেবল ৫% অনন্য মান রয়েছে তাকে নিরাপদে পৃথক বলা যেতে পারে (তবে, যেমনটি উল্লেখ করা হয়েছে: এটি বিষয়গত)। তবে: এটি এটি আপনার মডেলগুলিতে শ্রেণিবদ্ধ পরিবর্তনশীল হিসাবে অন্তর্ভুক্ত করার জন্য একটি ভাল প্রার্থী করে না: আপনার যদি 1000000 পর্যবেক্ষণ এবং 5% অনন্য মান রয়েছে তবে এটি 50000 'বিভাগ' ছেড়ে দেয়: আপনি যদি এটিকে শ্রেণিবদ্ধ হিসাবে অন্তর্ভুক্ত করেন তবে আপনি ' স্বাধীনতা অনেক ডিগ্রী একটি নরক ব্যয় করতে যাচ্ছেন।
আমার ধারণা এই কলটি আরও বেশি বিষয়গত এবং এটি নমুনার আকার এবং পছন্দের পদ্ধতির উপর অনেক বেশি নির্ভর করে। আরও প্রসঙ্গ না থাকলে এখানে গাইডলাইন দেওয়া শক্ত।
x
0
1
2
ই[ ওয়াই] = β0+ + β11 এক্স1+ + β12 এক্স2
এক্সআমিx = = iই[ ওয়াই] = β0+ + β1এক্স
ই[ ওয়াই] = β0+ + β1এক্স1+ + 2 β1এক্স2
χ2