এসভিএম থেকে পরিবর্তনশীল গুরুত্ব


32

কীভাবে এসভিএম ব্যবহার করে ভেরিয়েবল (অ্যাট্রিবিউট) গুরুত্ব পাবেন?

উত্তর:


19

আপনি যদি ওজন ভেক্টরটিতে l-1 পেনাল্টি ব্যবহার করেন তবে অপ্রাসঙ্গিক বৈশিষ্ট্যের সাথে সংশ্লিষ্ট ওজনগুলি স্বয়ংক্রিয়ভাবে শূন্যে সেট হয়ে যাওয়ার কারণে এটি স্বয়ংক্রিয় বৈশিষ্ট্য নির্বাচন করে। এই কাগজ দেখুন । প্রতিটি অ-শূন্য ওজনের পরিপূর্ণতা (পরম) তাত্পর্যপূর্ণ বৈশিষ্ট্যের গুরুত্ব সম্পর্কে ধারণা দিতে পারে।

এছাড়াও এই কাগজটি দেখুন যা বৈশিষ্ট্য নির্বাচনকে গাইড করার জন্য এসভিএমগুলি থেকে প্রাপ্ত মানদণ্ড ব্যবহার করে।


1
এই এলগোসের কোনও একটি কি আর বা অন্য সফ্টওয়্যার এ প্রয়োগ করা হয়েছে?
জর্জ ডোনটাস

5
হ্যাঁ, আর পেনালাইজড এসভিএম প্যাকেজটি একবার দেখুন। আগ্রহের অন্যান্য প্যাকেজগুলি হ'ল: দন্ডিত, ইলাস্টিকনেট, পিপিএল, লারস বা আরও সাধারণভাবে: cran.r-project.org/web/views/MachineLearning.html
chl

7

ইসাবেল গায়ন, আন্দ্রে এলিসিফ, "পরিবর্তনশীল এবং বৈশিষ্ট্য নির্বাচনের একটি ভূমিকা", জেএমএলআর, 3 (মার্চ): 1157-1182, 2003. http://jMLr.csail.mit.edu/papers/v3/guyon03a.html

এটি পড়া ভাল, এটি পদ্ধতির এবং সমস্যাগুলির একটি ভাল ওভারভিউ দেবে। একটি জিনিস আমি যুক্ত করব বৈশিষ্ট্য নির্বাচন অগত্যা ভবিষ্যদ্বাণীপূর্ণ কর্মক্ষমতা উন্নত করে না, এবং সহজেই এটি আরও খারাপ করে তুলতে পারে (বৈশিষ্ট্য নির্বাচনের মানদণ্ডের চেয়ে বেশি মানিয়ে নেওয়া সহজ)। (বিশেষত রৈখিক) এসভিএমগুলির অন্যতম সুবিধা হ'ল তারা প্রচুর সংখ্যক বৈশিষ্ট্য (আপনি নিয়মিতকরণের প্যারামিটারটি সঠিকভাবে টিউন করে) দিয়ে ভালভাবে কাজ করেন, তাই আপনার কেবলমাত্র ভবিষ্যদ্বাণীতে আগ্রহী হলে প্রায়শই প্রয়োজন হয় না।


2
আমি এমনকি আই । গিয়োন এবং সহকর্মীদের কাছ থেকে জে.এম.পি / অ্যানব্লুএক্সও পুরো বইটি সুপারিশ করবজেএমপি / বিডব্লিউ 3 এইচআর 4 , হাসটি এট এল এর ইএসএল বইটি এই 'হট' বিষয়টিকে ঘিরে আকর্ষণীয় আলোচনা সরবরাহ করে।
chl

আমি আপনার দাবির সাথে একমত নই; এফএস কিছু বিতর্কিত তথ্যের জন্য এটি নিজের কাছে আকর্ষণীয় যে এটি সরবরাহ করে (মার্কার / এসএনপি নির্বাচন একটি উদাহরণ এটি যখন বিশ্লেষণের মূল লক্ষ্য হয়)। বৈশিষ্ট্য নির্বাচন ওভারফিট অবশ্যই একটি সমস্যা, তবে এটি বাদ দেওয়ার পদ্ধতি রয়েছে।

আমি এ কথাটি বলছিলাম যে এফএস অগত্যা ভবিষ্যদ্বাণীপূর্ণ গুরুত্বকে উন্নত করে না এবং এটি আরও খারাপ করতে পারে। যদি তথ্যবহুল বৈশিষ্ট্যগুলি সন্ধানের স্বতন্ত্র গুরুত্ব থাকে তবে অবশ্যই এফএস ব্যবহার করা উচিত তবে বৈশিষ্ট্য নির্বাচনের মানদণ্ড ঘটনাকারীদের (যা সহজেই ঘটবে) অতিরিক্ত-ফিট করে যদি ভবিষ্যদ্বাণীমূলক পারফরম্যান্স আপস করা হয়। মাইক্রো-অ্যারে বিশ্লেষণের মতো কাজের জন্য, আমি পূর্বাভাসগুলির জন্য (ব্যাগড) রিজ রিগ্রেশন এবং মূল বৈশিষ্ট্যগুলি (জীববিজ্ঞান বোঝার জন্য) সনাক্তকরণের জন্য লাসোর মতো কিছু ব্যবহার করব। একই মডেল দুটি করার দরকার নেই।
ডিকরান মার্সুপিয়াল

1

আপনি যদি আর ব্যবহার করেন তবে ভেরিয়েবলের গুরুত্ব রিমাইনার প্যাকেজে ইম্পোর্ট্যান্স পদ্ধতিতে গণনা করা যেতে পারে। এটি আমার নমুনা কোড:

library(rminer)
M <- fit(y~., data=train, model="svm", kpar=list(sigma=0.10), C=2)
svm.imp <- Importance(M, data=train)

বিস্তারিতভাবে নীচের লিঙ্কটি দেখুন https://cran.r-project.org/web/packages/rminer/rminer.pdf


2
এই উত্তরটি অসম্পূর্ণ। এটি প্যাকেজের পরিবর্তনশীল গুরুত্বটি কী কী যোগাযোগের চেষ্টা করছে তা বর্ণনা করে না।
ম্যাথু ড্রুরি

আমি নমুনা কোড যুক্ত করেছি
তাকশী কানেদা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.