সমর্থন ভেক্টর মেশিনগুলির জন্য বৈশিষ্ট্য নির্বাচন


9

আমার প্রশ্নটি তিনগুণ

"কার্নেলাইজড" সমর্থন ভেক্টর মেশিনের প্রসঙ্গে

  1. পরিবর্তনশীল / বৈশিষ্ট্য নির্বাচন কি পছন্দসই - বিশেষত যেহেতু আমরা পরামিতি সি নিয়মিত করি অতিমাত্রায় আটকাতে প্রতিরোধ করতে এবং একটি এসভিএমের সাথে কার্নেলগুলি প্রবর্তনের পিছনের মূল উদ্দেশ্যটি সমস্যার মাত্রিকতা বৃদ্ধি করা, এমন ক্ষেত্রে পরামিতি হ্রাস দ্বারা মাত্রাগুলি হ্রাস করা বিপরীতমুখী বলে মনে হয়
  2. যদি প্রথম প্রশ্নের উত্তর "না" হয়, তবে, কোন অবস্থাতে উত্তরটি মনে রাখা উচিত তা কী পরিবর্তিত হবে?
  3. পাইথনের সাইকিট-লার্ন লাইব্রেরিতে এসভিএমগুলির জন্য বৈশিষ্ট্য হ্রাস আনার চেষ্টা করা হয়েছে এমন কোনও ভাল পদ্ধতি আছে - আমি সিলেক্টএফপিআর পদ্ধতিটি চেষ্টা করেছি এবং বিভিন্ন পদ্ধতির অভিজ্ঞতা সম্পন্ন লোকদের সন্ধান করছি।

1
আপনার প্রাথমিক বৈশিষ্ট্যগুলি সুপার উচ্চমানের সাথে শুরু না হওয়া অবধি বৈশিষ্ট্য নির্বাচন সর্বদা সহায়তা করে। স্ক্লেয়ারান বিভিন্ন বৈশিষ্ট্য নির্বাচন লাইব্রেরি সরবরাহ করে ( scikit-learn.org/stable/modules/feचर_selection.html ) আমি নিজেই আরএফই এর আংশিক।
ডেভিড

1
আপনি আপনার প্রসঙ্গটি উল্লেখ করেন নি - নোট করুন যে এটি যদি কোনও ব্যবসায়িক প্রসঙ্গে থাকে তবে মডেলটিতে থাকা প্রতিটি বৈশিষ্ট্যের কোনও স্তরে রক্ষণাবেক্ষণের প্রয়োজন হয় - আপনার আরও পরিবর্তনশীল থাকলে আক্ষরিক অর্থ ব্যয় জড়িত থাকে, এই অর্থে যে এর জন্য প্রয়োজন, উদাহরণস্বরূপ, আরও ডেটা সংগ্রহের প্রচেষ্টা, ডিবিএ সময় এবং প্রোগ্রামিং সময়। এই বিবেচনাটি স্পষ্টতই প্রযোজ্য না যদি এটি কোনও কাগল কমপ বা অনুরূপ, এবং ডেটাসেটে উপলভ্য 200 টি অতিরিক্ত বৈশিষ্ট্য ব্যবহার করে আপনি অর্থের মধ্যে রয়েছেন 0.01% বিকাশ।
রবার্ট ডি গ্রাফ

উত্তর:


3

ব্যক্তিগতভাবে, আমি বৈশিষ্ট্য নির্বাচনকে দুটি ভাগে ভাগ করতে চাই:

  • নিষ্ক্রিয় বৈশিষ্ট্য নির্বাচন
  • তত্ত্বাবধান বৈশিষ্ট্য নির্বাচন

নিরীক্ষণযোগ্য বৈশিষ্ট্য নির্বাচন হ'ল ক্লাস্টারিং বা পিসিএ এর মতো জিনিস যেখানে আপনি বৈশিষ্ট্যগুলির সর্বনিম্ন অপ্রয়োজনীয় পরিসীমা নির্বাচন করেন (বা সামান্য অতিরিক্ত অপ্রয়োজনীয় বৈশিষ্ট্য তৈরি করুন)। তত্ত্বাবধানযুক্ত বৈশিষ্ট্য নির্বাচন লাসোর মতো জিনিস যেখানে আপনি সবচেয়ে ভবিষ্যদ্বাণীপূর্ণ শক্তি সহ বৈশিষ্ট্যগুলি নির্বাচন করেন।

আমি ব্যক্তিগতভাবে সাধারণত আমি যা পছন্দ করি তদারকি বৈশিষ্ট্য নির্বাচন পছন্দ। সুতরাং, লিনিয়ার রিগ্রেশন ব্যবহার করার সময়, আমি লাসোর উপর ভিত্তি করে বৈশিষ্ট্যগুলি নির্বাচন করব। স্নায়বিক নেটওয়ার্কগুলিতে বিরলতা প্ররোচিত করতে অনুরূপ পদ্ধতি বিদ্যমান।

তবে প্রকৃতপক্ষে, আমি দেখতে পাচ্ছি না যে আমি কার্নেলগুলি ব্যবহার করে কোনও পদ্ধতিতে এটি করতে যাচ্ছি, সুতরাং আপনি যেটিকে আমি নিষ্ক্রিয় বৈশিষ্ট্য নির্বাচন বলি তা ব্যবহার করে আপনি সম্ভবত আরও ভাল।

সম্পাদনা: আপনি নিয়মিতকরণ সম্পর্কেও জিজ্ঞাসা করেছিলেন। আমি নিয়মিতকরণকে বেশিরভাগ ক্ষেত্রেই সহায়তা হিসাবে দেখছি কারণ আমরা সীমাবদ্ধ নমুনাগুলি নিয়ে কাজ করি এবং তাই প্রশিক্ষণ এবং পরীক্ষার বিতরণ সবসময় কিছুটা পৃথক হয় এবং আপনি চান যে আপনার মডেলটি অতিরিক্ত সাজে না। আমি নিশ্চিত নই যে এটি বৈশিষ্ট্যগুলি নির্বাচন করা এড়ানোর প্রয়োজনটিকে সরিয়ে দেয় (যদি আপনার সত্যিকারের অনেক বেশি থাকে)। আমি মনে করি যে বৈশিষ্ট্যগুলি নির্বাচন করা (বা সেগুলির একটি ছোট উপসেট তৈরি করা) আপনার করা বৈশিষ্ট্যগুলি আরও দৃust়তর করে তোলে এবং মডেলটিকে বোকামি সম্পর্কিত সম্পর্কগুলি থেকে শিখতে সহায়তা করে helps সুতরাং, নিয়মিতকরণ সহায়তা করে, তবে নিশ্চিত নয় যে এটি একটি সম্পূর্ণ বিকল্প। তবে আমি এ সম্পর্কে পুরোপুরি ভাবিনি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.