আমি যে পদ্ধতিটি ব্যবহার করি তা হল শ্যাডো ম্যাট্রিক্স, যেখানে ডেটাসেটে সূচক ভেরিয়েবল থাকে যেখানে মান উপস্থিত থাকলে 1 প্রদান করা হয় এবং যদি তা না হয় তবে 0 হয়। একে অপরের সাথে সম্পর্কিত এবং মূল ডেটা নির্ধারণ করতে সাহায্য করতে পারে ভেরিয়েবলগুলি একসাথে (এমএআর) অনুপস্থিত বা না (এমসিএআর) অনুপস্থিত কিনা। R
উদাহরণস্বরূপ ব্যবহার করে (রবার্ট কাবাকফের লেখা "আর ইন অ্যাকশন" বইটি থেকে ধার করা):
#Load dataset
data(sleep, package = "VIM")
x <- as.data.frame(abs(is.na(sleep)))
#Elements of x are 1 if a value in the sleep data is missing and 0 if non-missing.
head(sleep)
head(x)
#Extracting variables that have some missing values.
y <- x[which(sapply(x, sd) > 0)]
cor(y)
#We see that variables Dream and NonD tend to be missing together. To a lesser extent, this is also true with Sleep and NonD, as well as Sleep and Dream.
#Now, looking at the relationship between the presence of missing values in each variable and the observed values in other variables:
cor(sleep, y, use="pairwise.complete.obs")
#NonD is more likely to be missing as Exp, BodyWgt, and Gest increases, suggesting that the missingness for NonD is likely MAR rather than MCAR.