চি-স্কোয়ার বৈশিষ্ট্য নির্বাচনটি ঠিক কীভাবে কাজ করে?


15

আমি জানি যে প্রতিটি বৈশিষ্ট্য-শ্রেণীর জুটির জন্য চি-বর্গ পরিসংখ্যানের মান গণনা করা হয় এবং একটি প্রান্তিকের তুলনায় তুলনা করা হয়।

যদিও আমি কিছুটা বিভ্রান্ত। তাহলে আছে বৈশিষ্ট্য এবং মি ক্লাস থাকে, তবে কেউ কীভাবে आकस्मिक সারণী তৈরি করতে পারে? কোনটি কী বৈশিষ্ট্যগুলি রাখা উচিত এবং কোনটি মুছে ফেলা হবে তা কীভাবে সিদ্ধান্ত নেওয়া যায়?

যে কোনও স্পষ্টতা অনেক প্রশংসা করা হবে। আগাম ধন্যবাদ


1
এই কারও সম্পর্কে কোন চিন্তা / পয়েন্টার?
ব্যবহারকারী721975

উত্তর:


5

চি-স্কোয়ার পরীক্ষাটি দুটি ভেরিয়েবলের নির্ভরতা নির্ধারণের জন্য স্বাধীনতার একটি পরিসংখ্যানগত পরীক্ষা। এটি সংখ্যার সহগের সাথে মিলগুলি ভাগ করে, আর। তবে চি-স্কোয়ার পরীক্ষাটি কেবল শ্রেণিবদ্ধ বা নামমাত্র ডেটার ক্ষেত্রেই প্রযোজ্য যখন R² কেবলমাত্র সংখ্যার ডেটাতে প্রযোজ্য।

সংজ্ঞা থেকে, চি-স্কোয়ারের বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে আমরা সহজেই চি-স্কোয়ার কৌশল প্রয়োগ করতে পারি। ধরুন আপনার কাছে একটি টার্গেট ভেরিয়েবল (অর্থাত্ ক্লাস লেবেল) এবং কিছু অন্যান্য বৈশিষ্ট্য (বৈশিষ্ট্য ভেরিয়েবল) রয়েছে যা ডেটার প্রতিটি নমুনা বর্ণনা করে। এখন, আমরা প্রতিটি বৈশিষ্ট্য ভেরিয়েবল এবং লক্ষ্য ভেরিয়েবলের মধ্যে চি-বর্গ পরিসংখ্যান গণনা করি এবং ভেরিয়েবল এবং লক্ষ্যটির মধ্যে একটি সম্পর্কের অস্তিত্ব পর্যবেক্ষণ করি। যদি লক্ষ্য ভেরিয়েবলটি বৈশিষ্ট্য ভেরিয়েবলের থেকে পৃথক হয় তবে আমরা সেই বৈশিষ্ট্যটি পরিবর্তনশীলটিকে বাতিল করতে পারি। যদি তারা নির্ভরশীল হয় তবে বৈশিষ্ট্যটির পরিবর্তনশীলটি খুব গুরুত্বপূর্ণ।

গাণিতিক বিবরণগুলি এখানে বর্ণিত হয়েছে: http://nlp.stanford.edu/IR-book/html/htmledition/feature-selectionchi2-feature-selection-1.html

অবিচ্ছিন্ন ভেরিয়েবলের জন্য, চি-স্কোয়ারটি ভেরিয়েবলগুলি "বিনিং" এর পরে প্রয়োগ করা যেতে পারে।

আর এর একটি উদাহরণ, নির্লজ্জভাবে FSelector থেকে অনুলিপি করা

# Use HouseVotes84 data from  mlbench package
library(mlbench)# For data
library(FSelector)#For method
data(HouseVotes84)

#Calculate the chi square statistics 
weights<- chi.squared(Class~., HouseVotes84)

# Print the results 
print(weights)

# Select top five variables
subset<- cutoff.k(weights, 5)

# Print the final formula that can be used in classification
f<- as.simple.formula(subset, "Class")
print(f)

বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে এত কিছু সম্পর্কিত নয় তবে নীচের ভিডিওটিতে চিজকারের বিষয়ে বিস্তারিত আলোচনা করা হয়েছে https://www.youtube.com/watch?time_continue=5&v=IrZOKSGShC8

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.