ধরে নিচ্ছি আমার কাছে মাত্রাগুলির সাথে একটি ডেটা সেট রয়েছে (যেমন ) যাতে প্রতিটি মাত্রা iid (বিকল্পভাবে, প্রতিটি মাত্রা ) এবং এর থেকে একে অপরকে.
এখন আমি এই ডেটাসেট থেকে একটি এলোমেলো বস্তু আঁক এবং নিকটতম প্রতিবেশী এবং এই সেটটিতে পিসিএ গণনা করি। কেউ যা আশা করতে পারে তার বিপরীতে, ইগেনভ্যালুগুলি সমস্ত এক নয়। 20 টি মাত্রার ইউনিফর্মে, একটি সাধারণ ফলাফল এর মতো দেখায়:
0.11952316626613427, 0.1151758808663646, 0.11170020254046743, 0.1019390988585198,
0.0924502502204256, 0.08716272453538032, 0.0782945015348525, 0.06965903935713605,
0.06346159593226684, 0.054527131148532824, 0.05346303562884964, 0.04348400728546128,
0.042304834600062985, 0.03229641081461124, 0.031532033468325706, 0.0266801529298156,
0.020332085835946957, 0.01825531821510237, 0.01483790669963606, 0.0068195084468626625
স্বাভাবিক বিতরণ ডেটার জন্য, ফলাফল, একেবারে অনুরূপ বলে মনে অন্তত যখন তাদের মোট যোগফল থেকে rescaling ( বন্টন পরিষ্কারভাবে প্রথম স্থানে একটি উচ্চ ভ্যারিয়েন্স আছে)।
আমি ভাবছি যদি এমন আচরণের পূর্বাভাস দেয় এমন কোনও ফলাফল হয়? আমি পরীক্ষার সন্ধান করছি যদি ইগেনভ্যালুগুলির ধারাবাহিকটি কিছুটা নিয়মিত হয় এবং কতগুলি ইগন্যাল্যুয়াস প্রত্যাশিত হয় এবং কোনটি প্রত্যাশিত মানগুলির তুলনায় উল্লেখযোগ্যভাবে পৃথক হয়।
প্রদত্ত (ছোট) নমুনা আকারের , যদি দুটি ভেরিয়েবলের জন্য একটি সংযোগের সহগটি উল্লেখযোগ্য হয় তবে এর ফলস্বরূপ? এমনকি আইড ভেরিয়েবলের কম জন্য মাঝে মাঝে একটি অ -0 ফলাফল থাকতে পারে ।