আমার একটি ম্যাট্রিক্স রয়েছে, যেখানে হল জিনের সংখ্যা এবং রোগীর সংখ্যা। এই জাতীয় ডেটা নিয়ে যার সাথে কাজ করেছেন যে কেউ জানেন যে সর্বদা চেয়ে বড় । বৈশিষ্ট্য নির্বাচন ব্যবহার করে আমি আরও বেশি যুক্তিসঙ্গত সংখ্যায় নামিয়েছি, তবে এখনও চেয়ে বেশি ।
আমি রোগীদের জেনেটিক প্রোফাইলের উপর ভিত্তি করে মিলের মিলটি গণনা করতে চাই; আমি ইউক্যালিডিয়ান দূরত্বটি ব্যবহার করতে পারি, তবে মহালানোবিস আরও উপযুক্ত বলে মনে হচ্ছে কারণ এটি ভেরিয়েবলগুলির মধ্যে পারস্পরিক সম্পর্কের জন্য অ্যাকাউন্ট করে। সমস্যা (এই পোস্টে উল্লিখিত হিসাবে ) হ'ল মহালানোবিসের দূরত্ব, বিশেষত কোভেরিয়েন্স ম্যাট্রিক্স যখন কাজ করে না তখন । আমি যখন আর এ মহালানোবিস দূরত্ব চালাচ্ছি তখন আমার ত্রুটিটি হ'ল:
Error in solve.default(cov, ...) : system is computationally
singular: reciprocal condition number = 2.81408e-21
এখন পর্যন্ত এটি সমাধান করার চেষ্টা করার জন্য, আমি পিসিএ ব্যবহার করেছি এবং জিনগুলি ব্যবহার করার পরিবর্তে আমি উপাদানগুলি ব্যবহার করি এবং এটি মনে হয় যে আমাকে মহালানোবিসের দূরত্ব গণনা করতে দেয়; 5 টি উপাদান প্রায় 80% বৈকল্পিকের প্রতিনিধিত্ব করে, তাই এখন ।
আমার প্রশ্নগুলি: আমি কী রোগীদের মধ্যে মহালানোবিস দূরত্বটি অর্থবহভাবে পেতে পিসিএ ব্যবহার করতে পারি, বা এটি অনুপযুক্ত? এমন কি বিকল্প দূরত্বের মেট্রিকগুলি রয়েছে যখন যখন কাজ করে এবং ভেরিয়েবলের মধ্যেও অনেক বেশি পারস্পরিক সম্পর্ক রয়েছে ?
PCA
কাজের মতো পরিবর্তনশীল হ্রাস প্রযুক্তিগুলি কীভাবে দেওয়া হয়েছে তা প্রদত্ত , আমি আউটপুটগুলিতে কোনও দূরত্বের মেট্রিক ব্যবহার করতে পারি কিনা তা সম্পর্কে আমি আগ্রহী।
PCA
পরিবর্তনশীল সম্পর্কযুক্তরূপে ভাঙতে পারে, যদি না আপনি একটি oblique ঘূর্ণন ভালো কিছু ব্যবহার করুন। আমিও নিশ্চিত নই যে বৈষম্যের অংশীকরণPCA
কীভাবে অনুরূপ রোগীদের মধ্যে মহালানোবিসের দূরত্বকে প্রভাবিত করবে।