বৈশিষ্ট্য নির্বাচনের জন্য কার্নেল পিসিএ ব্যবহার করা সম্ভব?


9

পিসিএ যেমন ব্যবহৃত হয় তেমনিভাবে লেটেন্ট সিমেেন্টিক ইনডেক্সিং (এলএসআই) এর জন্য কার্নেল অধ্যক্ষ উপাদান বিশ্লেষণ (কেপিসিএ) ব্যবহার করা কি সম্ভব?

আমি prcompপিসিএ ফাংশনটি ব্যবহার করে আর এ এলএসআই করি এবং প্রথম থেকে সর্বোচ্চ লোডিং সহ বৈশিষ্ট্যগুলি বের করিউপাদান। এর মাধ্যমে আমি উপাদানটির সর্বোত্তম বর্ণনা করার বৈশিষ্ট্যগুলি পেয়েছি।

আমি kpcaফাংশনটি ব্যবহার করার চেষ্টা করেছি ( kernlibপ্যাকেজ থেকে ) তবে কীভাবে প্রধান উপাদানগুলিতে বৈশিষ্ট্যগুলির ওজন অ্যাক্সেস করতে পারি তা দেখতে পাচ্ছি না। কার্নেল পদ্ধতি ব্যবহার করার পরে কি এটি সামগ্রিকভাবে সম্ভব?


আপনি princomp ফাংশন চেষ্টা করেছেন?
মারিয়ানা সফটমার

উত্তর:


6

আমি মনে করি আপনার প্রশ্নের উত্তর নেতিবাচক: এটি সম্ভব নয়।

বৈশিষ্ট্য নির্বাচনের জন্য স্ট্যান্ডার্ড পিসিএ ব্যবহার করা যেতে পারে, কারণ প্রতিটি মূল উপাদানটি মূল বৈশিষ্ট্যগুলির একটি রৈখিক সংমিশ্রণ, এবং তাই কোনটি দেখতে পাবেন যে কোন মূল বৈশিষ্ট্য সর্বাধিক বিশিষ্ট মূল উপাদানগুলিতে সর্বাধিক অবদান রাখে, উদাহরণস্বরূপ এখানে দেখুন: মূল উপাদান বিশ্লেষণ (পিসিএ) ব্যবহার করে বৈশিষ্ট্য নির্বাচন

কিন্তু কার্নেল পিসিএতে প্রতিটি মূল উপাদান লক্ষ্য জায়গার বৈশিষ্ট্যগুলির একটি লিনিয়ার সংমিশ্রণ এবং উদাহরণস্বরূপ গাউসিয়ান কার্নেল (যা প্রায়শই ব্যবহৃত হয়) লক্ষ্য স্থান অসীম মাত্রিক। সুতরাং কেপিসিএর জন্য "লোডিংস" ধারণাটি আসলেই বোঝা যায় না, এবং প্রকৃতপক্ষে, কার্নেল প্রধান উপাদানগুলি সরাসরি গণনা করা হয়, মূল অক্ষগুলির গণনা বাইপাস করে (যা স্ট্যান্ডার্ড পিসিএর জন্য আর দ্বারা দেওয়া হয় prcomp$rotation), ধন্যবাদ হিসাবে পরিচিত হিসাবে কার্নেল কৌতুক । উদাহরণস্বরূপ এখানে দেখুন: লিনিয়ার কার্নেল সহ কার্নেল পিসিএ কি আদর্শ পিসিএর সমান? বিস্তারিত জানার জন্য.

সুতরাং না, এটি সম্ভব নয়। কমপক্ষে কোনও সহজ উপায় নেই।


2
(+1) আমার মনে হয় এসভিএমগুলির সাথে সাদৃশ্য সহ আরও ব্যাখ্যা করা সহজ, যেখানে লিনিয়ার স্পেসে আপনি প্রতিটি পরিবর্তনশীলকে পৃথক পৃথক হাইপারপ্লেনের জন্য যে পরিমাণ ওজন গণনা করতে পারেন (কার্নাল স্পেসে কমপক্ষে বৈশিষ্ট্য নির্বাচনের জন্য ব্যবহারযোগ্য একটি গুরুত্ব পরিমাপ) খুব জটিল বা সম্পূর্ণ অসম্ভব কাজ। একই যুক্তি এখানে।
ফায়ারব্যাগ

2

নিম্নলিখিত উদাহরণ (কর্নলব রেফারেন্স ম্যানুয়াল থেকে নেওয়া) আপনাকে কীভাবে কার্নেল পিসিএর বিভিন্ন উপাদান অ্যাক্সেস করবেন তা দেখায়:

data(iris)
test <- sample(1:50,20)
kpc <- kpca(~.,data=iris[-test,-5],kernel="rbfdot",kpar=list(sigma=0.2),features=2)

pcv(kpc)        # returns the principal component vectors
eig(kpc)        # returns the eigenvalues
rotated(kpc)    # returns the data projected in the (kernel) pca space
kernelf(kpc)    # returns the kernel used when kpca was performed

এটা কি তোমার প্রশ্নের উত্তর?


আমি ঘোরাতে চেষ্টা করেছি (কেপিসিএ) ভেবেছিলাম এটি প্রম্পম্প $ রোটেশনের সমান; যা হ'ল (ফর্ম আর হেল্প (প্রম্পম্প)): "আবর্তন: পরিবর্তনশীল লোডিংয়ের ম্যাট্রিক্স (অর্থাত্ একটি ম্যাট্রিক্স যার কলামগুলিতে ইগেনভেেক্টর রয়েছে)"। তবে তা হয় না। তবে প্রশ্নটি খুব সাধারণ বোঝানো হয়েছে কারণ আমি নিশ্চিত নই যে এলএসএ / এলএসআই আদৌ অ-রৈখিক মাত্রিক হ্রাস ব্যবহার করে সম্ভব কিনা।
ব্যবহারকারী3683

দুঃখিত, তবে আমি প্রশ্নটি মিস করছি; আপনি কেন মনে করেন যে এলএসএ / এলএসআইতে অ-রৈখিক মাত্রিক হ্রাস সম্ভব নয়?
লালাস

1
কারণ মাত্রার কোনও লিনিয়ার সংমিশ্রণ নেই তবে কার্নেল ফাংশনের উপর নির্ভর করে। একটি (অ-রৈখিক) মূল উপাদানটির জন্য একটি মাত্রার ওজন নির্ধারণ করা কি এই সেটিংয়ে সম্ভব?
user3683

2
(-1) এটি একটি দরকারী কোড স্নিপেট হতে পারে, তবে আমি মনে করি না এটি একেবারে মূল প্রশ্নের উত্তর দেয়।
অ্যামিবা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.