চি-স্কোয়ার পরীক্ষাটি দুটি ভেরিয়েবলের নির্ভরতা নির্ধারণের জন্য স্বাধীনতার একটি পরিসংখ্যানগত পরীক্ষা। এটি সংখ্যার সহগের সাথে মিলগুলি ভাগ করে, আর। তবে চি-স্কোয়ার পরীক্ষাটি কেবল শ্রেণিবদ্ধ বা নামমাত্র ডেটার ক্ষেত্রেই প্রযোজ্য যখন R² কেবলমাত্র সংখ্যার ডেটাতে প্রযোজ্য।
সংজ্ঞা থেকে, চি-স্কোয়ারের বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে আমরা সহজেই চি-স্কোয়ার কৌশল প্রয়োগ করতে পারি। ধরুন আপনার কাছে একটি টার্গেট ভেরিয়েবল (অর্থাত্ ক্লাস লেবেল) এবং কিছু অন্যান্য বৈশিষ্ট্য (বৈশিষ্ট্য ভেরিয়েবল) রয়েছে যা ডেটার প্রতিটি নমুনা বর্ণনা করে। এখন, আমরা প্রতিটি বৈশিষ্ট্য ভেরিয়েবল এবং লক্ষ্য ভেরিয়েবলের মধ্যে চি-বর্গ পরিসংখ্যান গণনা করি এবং ভেরিয়েবল এবং লক্ষ্যটির মধ্যে একটি সম্পর্কের অস্তিত্ব পর্যবেক্ষণ করি। যদি লক্ষ্য ভেরিয়েবলটি বৈশিষ্ট্য ভেরিয়েবলের থেকে পৃথক হয় তবে আমরা সেই বৈশিষ্ট্যটি পরিবর্তনশীলটিকে বাতিল করতে পারি। যদি তারা নির্ভরশীল হয় তবে বৈশিষ্ট্যটির পরিবর্তনশীলটি খুব গুরুত্বপূর্ণ।
গাণিতিক বিবরণগুলি এখানে বর্ণিত হয়েছে: http://nlp.stanford.edu/IR-book/html/htmledition/feature-selectionchi2-feature-selection-1.html
অবিচ্ছিন্ন ভেরিয়েবলের জন্য, চি-স্কোয়ারটি ভেরিয়েবলগুলি "বিনিং" এর পরে প্রয়োগ করা যেতে পারে।
আর এর একটি উদাহরণ, নির্লজ্জভাবে FSelector থেকে অনুলিপি করা
# Use HouseVotes84 data from mlbench package
library(mlbench)# For data
library(FSelector)#For method
data(HouseVotes84)
#Calculate the chi square statistics
weights<- chi.squared(Class~., HouseVotes84)
# Print the results
print(weights)
# Select top five variables
subset<- cutoff.k(weights, 5)
# Print the final formula that can be used in classification
f<- as.simple.formula(subset, "Class")
print(f)
বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে এত কিছু সম্পর্কিত নয় তবে নীচের ভিডিওটিতে চিজকারের বিষয়ে বিস্তারিত আলোচনা করা হয়েছে https://www.youtube.com/watch?time_continue=5&v=IrZOKSGShC8