আমি অনুমান করি উত্তরটি হ্যাঁ হওয়া উচিত, তবে আমি এখনও অনুভব করি যে কিছু ঠিক নেই। সাহিত্যে কিছু সাধারণ ফলাফল হওয়া উচিত, কেউ কি আমাকে সহায়তা করতে পারে?
আমি অনুমান করি উত্তরটি হ্যাঁ হওয়া উচিত, তবে আমি এখনও অনুভব করি যে কিছু ঠিক নেই। সাহিত্যে কিছু সাধারণ ফলাফল হওয়া উচিত, কেউ কি আমাকে সহায়তা করতে পারে?
উত্তর:
না।
, ওয়াই এবং জেড = এক্স + ওয়াই তিনটি ভেরিয়েবল বিবেচনা করুন । তাদের সহভেদাংক ম্যাট্রিক্স, এম , একটি ভেক্টর যেহেতু ইতিবাচক নির্দিষ্ট নয় z- র ( = ( 1 , 1 , - 1 ) ' , যার জন্য) z- র ' এম z- র ইতিবাচক নয়।
জনসংখ্যার কোভারিয়েন্স ম্যাট্রিকগুলি ইতিবাচক আধা-নির্দিষ্ট are
(সম্পত্তি 2 এখানে দেখুন ।)
একইভাবে সম্পূর্ণ নমুনা (নিখোঁজ মূল্য) এর কোভেরিয়েন্স ম্যাট্রিক্সের ক্ষেত্রে প্রযোজ্য হওয়া উচিত, যেহেতু এগুলিকে পৃথক জনগোষ্ঠীর সম্প্রদায়ের রূপ হিসাবেও দেখা যেতে পারে।
তবে ভাসমান পয়েন্টের সংখ্যাগত গণনাগুলির অনর্থকতার কারণে, এমনকি বীজগণিতভাবে ইতিবাচক সুনির্দিষ্ট ক্ষেত্রেও মাঝে মধ্যে গণনা করা যেতে পারে এমনকি ইতিবাচক অর্ধ-নির্দিষ্ট নয়; অ্যালগরিদমের ভাল পছন্দ এটিতে সহায়তা করতে পারে।
আরও সাধারণভাবে, নমুনা কোভেরিয়েন্স ম্যাট্রিকগুলি - কিছু ভেরিয়েবলগুলিতে তারা কীভাবে অনুপস্থিত মানগুলি নিয়ে কাজ করে - তার উপর নির্ভর করে - এমনকি তত্ত্বেও এটি ইতিবাচক অর্ধ-নির্দিষ্ট হতে পারে বা নাও হতে পারে। উদাহরণস্বরূপ, যদি জোড়াযুক্ত মুছে ফেলা ব্যবহার করা হয় তবে ইতিবাচক আধা-নির্দিষ্টতার কোনও গ্যারান্টি নেই। তদতিরিক্ত, সঞ্চিত সংখ্যাসূচক ত্রুটি নমুনা কোভেরিয়েন্স ম্যাট্রিক্সের কারণ হতে পারে যা ব্যর্থ হওয়ার পক্ষে কল্পনাশালী ইতিবাচক অর্ধ-নির্দিষ্ট হওয়া উচিত।
তাই ভালো:
x <- rnorm(30)
y <- rnorm(30) - x/10 # it doesn't matter for this if x and y are correlated or not
z <- x+y
M <- cov(data.frame(x=x,y=y,z=z))
z <- rbind(1,1,-1)
t(z)%*%M%*%z
[,1]
[1,] -1.110223e-16
এটি প্রথম উদাহরণে আমি চেষ্টা করেছিলাম (আমার সম্ভবত একটি বীজ সরবরাহ করা উচিত তবে এটি এত বিরল নয় যে আপনি একটি পাওয়ার আগে আপনাকে অনেকগুলি উদাহরণ চেষ্টা করতে হবে)।
বীজগণিতভাবে শূন্য হওয়া সত্ত্বেও ফলাফলটি নেতিবাচক প্রকাশ পেয়েছিল । বিভিন্ন সংখ্যার সেট একটি ধনাত্মক সংখ্যা বা একটি "সঠিক" শূন্য পেতে পারে।
-
মধ্যযুগীয় নিখোঁজ হওয়ার উদাহরণ জুটিযুক্ত মুছে ফেলার মাধ্যমে ইতিবাচক অর্ধসীমা নির্ধারণের ক্ষতির দিকে:
z <- x + y + rnorm(30)/50 # same x and y as before.
xyz1 <- data.frame(x=x,y=y,z=z) # high correlation but definitely of full rank
xyz1$x[sample(1:30,5)] <- NA # make 5 x's missing
xyz1$y[sample(1:30,5)] <- NA # make 5 y's missing
xyz1$z[sample(1:30,5)] <- NA # make 5 z's missing
cov(xyz1,use="pairwise") # the individual pairwise covars are fine ...
x y z
x 1.2107760 -0.2552947 1.255868
y -0.2552947 1.2728156 1.037446
z 1.2558683 1.0374456 2.367978
chol(cov(xyz1,use="pairwise")) # ... but leave the matrix not positive semi-definite
Error in chol.default(cov(xyz1, use = "pairwise")) :
the leading minor of order 3 is not positive definite
chol(cov(xyz1,use="complete")) # but deleting even more rows leaves it PSD
x y z
x 0.8760209 -0.2253484 0.64303448
y 0.0000000 1.1088741 1.11270078
z 0.0000000 0.0000000 0.01345364