ননপ্যারমেট্রিক রিগ্রেশনের জন্য বৈশিষ্ট্য নির্বাচনের সেরা পদ্ধতি


10

এখানে একটি নবাগত প্রশ্ন। আমি বর্তমানে আর-তে এনপি প্যাকেজটি ব্যবহার করে একটি ননপ্যারমেট্রিক রিগ্রেশন করছি I আমার features টি বৈশিষ্ট্য রয়েছে এবং একটি ব্রুট ফোর্স পদ্ধতির ব্যবহার করে আমি সেরাটি চিহ্নিত করেছি But তবে, শীঘ্রই আমার কাছে আরও 7 টিরও বেশি বৈশিষ্ট্য থাকবে!

আমার প্রশ্নটি হ'ল ননপ্যারমেট্রিক রিগ্রেশনের জন্য বৈশিষ্ট্য নির্বাচনের বর্তমান সেরা পদ্ধতিগুলি কী। এবং যদি কোন প্যাকেজ পদ্ধতি প্রয়োগ করে। ধন্যবাদ.


1
"আরও অনেক" 100 বলতে কী বোঝ? 1000? 10000? 100000?
রবিন গিরার্ড

সম্ভবত আমার 100 টি বৈশিষ্ট্য ক্রমের সাথে থাকবে। তবে সেরা বৈশিষ্ট্যটির উপসেটটি নিয়ে সিদ্ধান্ত নিতে আমার কাছে কয়েক মিনিট রয়েছে।
jmmcnew

1
আপনি কি লাসো বা ইলাস্টিক নেট চেষ্টা করেছেন? প্যাকেজ: লাসো, গ্ল্যামনেট। সেই পদ্ধতিগুলি চলতে চলতে কিছু বৈকল্পিকগুলি "নির্বাচন" করতে পারে।
Deps_stats

উত্তর:


3

সর্বাধিক প্রাসঙ্গিক ভেরিয়েবলগুলির সনাক্তকরণ বিশ্লেষণের মূল লক্ষ্য না হলে প্রায়শই কোনও বৈশিষ্ট্য নির্বাচন না করা এবং ওভার-ফিটিং প্রতিরোধের জন্য নিয়মিতকরণ না করা ভাল। বৈশিষ্ট্য নির্বাচন একটি জটিল পদ্ধতি এবং স্বাধীনতার অনেক ডিগ্রি রয়েছে বলে বৈশিষ্ট্য নির্বাচনের মানদণ্ডকে অতিরিক্ত মানিয়ে নেওয়া খুব সহজ। লাসো এবং ইলাস্টিক নেট একটি ভাল সমঝোতা, সরাসরি বৈশিষ্ট্য নির্বাচনের পরিবর্তে নিয়মিতকরণের মাধ্যমে স্পারসিটি অর্জন করে, তাই তারা নির্দিষ্ট-ওভার-ফিটনেসের প্রবণতা কম থাকে।


0

লাসো আসলেই খুব ভাল। কিছুই না দিয়ে শুরু করা এবং 'ইউজফুলনেস' (ক্রস-বৈধকরণের মাধ্যমে) অনুসারে একে একে যুক্ত করার মতো সাধারণ জিনিসগুলি অনুশীলনেও বেশ ভাল কাজ করে। এটিকে কখনও কখনও স্টেজওয়ালা ফিডফওয়ার্ড নির্বাচন বলা হয়।

নোট করুন যে শ্রেণীবিন্যাস / রিগ্রেশনের ধরণের ক্ষেত্রে সাবসেট নির্বাচন সমস্যা মোটামুটি স্বতন্ত্র। এটি কেবল যে ননপ্যারামেট্রিক পদ্ধতিগুলি ধীর হতে পারে এবং তাই নির্বাচনের আরও বুদ্ধিমান পদ্ধতি প্রয়োজন require

টি.হাস্টির 'স্ট্যাটিস্টিকাল লার্নিংয়ের উপাদান' বইটি একটি সুন্দর ওভারভিউ দিয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.