আমি আর- prcomp()
তে একটি পিসিএ (মূল উপাদান বিশ্লেষণ) সম্পাদন করতে ফাংশনটি ব্যবহার করেছি However তবে, সেই ফাংশনে একটি বাগ রয়েছে যাতে na.action
প্যারামিটারটি কাজ করে না। আমি স্ট্যাকওভারফ্লোতে সহায়তা চেয়েছি ; সেখানে দুইজন ব্যবহারকারী NA
মূল্যবোধের সাথে আচরণ করার দুটি পৃথক উপায়ে প্রস্তাব করেছিলেন । যাইহোক, উভয় সমাধানের সাথে সমস্যাটি হ'ল যখন কোনও NA
মান থাকে, তখন সেই সারিটি বাদ পড়ে যায় এবং পিসিএ বিশ্লেষণে বিবেচনা করা হয় না। আমার আসল ডেটা সেটটি 100 x 100 এর ম্যাট্রিক্স এবং এটিতে একটি একক NA
মান রয়েছে বলেই আমি একটি সম্পূর্ণ সারিটি হারাতে চাই না ।
নিম্নলিখিত উদাহরণটি দেখায় যে prcomp()
ফাংশনটি 5 সারিটির জন্য কোনও মূল উপাদানকে ফেরত দেয় না কারণ এতে একটি NA
মান রয়েছে ।
d <- data.frame(V1 = sample(1:100, 10), V2 = sample(1:100, 10),
V3 = sample(1:100, 10))
result <- prcomp(d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x # $
d$V1[5] <- NA # $
result <- prcomp(~V1+V2, data=d, center = TRUE, scale = TRUE, na.action = na.omit)
result$x
আমি ভাবছিলাম যে আমি NA
যখন একটি নির্দিষ্ট সংখ্যার মানগুলিতে সেট করতে পারি center
এবং scale
সেট করা থাকে TRUE
যাতে prcomp()
ফাংশনটি কাজ করে এবং এতে থাকা সারিগুলি সরিয়ে না দেয় NA
, তবে পিসিএ বিশ্লেষণের ফলাফলকেও প্রভাবিত করে না।
আমি NA
মানগুলি একটি একক কলাম জুড়ে মধ্যমানের মানটি বা খুব কাছাকাছি মানের সাথে প্রতিস্থাপন করার কথা ভেবেছিলাম However তবে, আমি নিশ্চিত নই যে এটি পিসিএ বিশ্লেষণকে কীভাবে প্রভাবিত করে।
কেউ কি এই সমস্যা সমাধানের ভাল উপায় সম্পর্কে চিন্তা করতে পারেন?
NA
মূল্যবোধগুলির অর্থ কী তা বোঝানো : "নিখোঁজ হওয়া" এর কারণ কী?