ও'রিলির "মেশিন লার্নিং ফর হ্যাকারস" বলেছে যে প্রতিটি মূল উপাদান বৈচিত্রের শতাংশকে উপস্থাপন করে। আমি নীচের পৃষ্ঠার প্রাসঙ্গিক অংশটি উদ্ধৃত করেছি (অধ্যায় 8, পি .207)। অন্য বিশেষজ্ঞের সাথে কথা বললে, তারা সম্মত হয় যে এটি শতাংশ।
তবে 24 টি উপাদান 133.2095% এর সমষ্টি। যথোপযুক্ত সৃষ্টিকর্তা?
নিজেদের পিসিএ ব্যবহার করতে পারি তা নিশ্চিত করে আমরা কীভাবে আর-তে এটি করব? আবার এটি এমন এক জায়গা যেখানে আর জ্বলজ্বল করে: সম্পূর্ণ পিসিএ কোডের একটি লাইনে করা যায়। আমরা পিসিএ চালাতে প্রিনম্পম্প ফাংশনটি ব্যবহার করি:
pca <- princomp(date.stock.matrix[,2:ncol(date.stock.matrix)])আমরা যদি আর-তে কেবল পিসিএ টাইপ করি, আমরা মূল উপাদানগুলির একটি দ্রুত সংক্ষিপ্তসার দেখতে পাব:
Call: princomp(x = date.stock.matrix[, 2:ncol(date.stock.matrix)]) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 Comp.7 29.1001249 20.4403404 12.6726924 11.4636450 8.4963820 8.1969345 5.5438308 Comp.8 Comp.9 Comp.10 Comp.11 Comp.12 Comp.13 Comp.14 5.1300931 4.7786752 4.2575099 3.3050931 2.6197715 2.4986181 2.1746125 Comp.15 Comp.16 Comp.17 Comp.18 Comp.19 Comp.20 Comp.21 1.9469475 1.8706240 1.6984043 1.6344116 1.2327471 1.1280913 0.9877634 Comp.22 Comp.23 Comp.24 0.8583681 0.7390626 0.4347983 24 variables and 2366 observations.এই সংক্ষিপ্তসারে, স্ট্যান্ডার্ড বিচ্যুতিগুলি আমাদের জানায় যে ডেটা সেটে বিভিন্ন বৈকল্পিকতার জন্য বিভিন্ন মূল উপাদানগুলির দ্বারা দায়বদ্ধ। প্রথম উপাদান, কমপ্লে 1 নামে পরিচিত, বৈকল্পিকতার 29% এর জন্য রয়েছে, যখন পরের উপাদানটি 20% হিসাবে থাকে। শেষ অবধি, শেষ উপাদানটি, কম্প .২৪, ভেরিয়েন্সের 1% এর চেয়ে কম পরিমাণে রয়েছে। এটি সুপারিশ করে যে আমরা প্রথম প্রধান উপাদানটি দেখে আমাদের ডেটা সম্পর্কে অনেক কিছু শিখতে পারি।
[কোড এবং ডেটা গিথুবে পাওয়া যাবে ]]
Rনিজেই সফ্টওয়্যারটি উল্লেখ করার জন্য "বাগ" নিয়েছিলাম । সেই ত্রুটিটি খুঁজে পাওয়া একটি ভাল ক্যাচ ছিল (আমি আশা করি পিসিএ দিয়ে আসলে কী চলছে তা খুঁজে বের করার জন্য আপনি এটি লাভজনক পেয়েছেন)!
Standard deviationsকিছুটা বন্ধ। যেহেতু স্ট্যান্ডার্ড বিচ্যুতি প্রকৃতপক্ষে স্ট্যান্ডার্ড বিচ্যুতি, তাই প্রতিটি উপাদানগুলি কতটা বৈকল্পিকতা উপস্থাপন করে তা দেখতে আমাদের অবশ্যই তাদের বর্গাকার করতে হবে। প্রথম উপাদানটি সম্পূর্ণ শতাংশ উপস্থাপন করবে।