(ধরে নিচ্ছেন আপনি তদারকি শিক্ষার বিষয়ে কথা বলছেন)
সম্পর্কযুক্ত বৈশিষ্ট্যগুলি সর্বদা আপনার মডেলকে খারাপ করে না, তবে তারা সর্বদা এটির উন্নতিও করে না।
তিনটি মূল কারণ রয়েছে যা আপনি সম্পর্কিত বৈশিষ্ট্যগুলি মুছে ফেলবেন:
- শেখার অ্যালগরিদমকে আরও দ্রুত করুন
মাত্রিকতার অভিশাপের কারণে, কম বৈশিষ্ট্যগুলি সাধারণত গতির ক্ষেত্রে উচ্চ উন্নতি বোঝায়।
গতি যদি কোনও সমস্যা না হয় তবে সম্ভবত এই বৈশিষ্ট্যগুলি এখনই সরিয়ে ফেলবেন না (পরবর্তী পয়েন্টটি দেখুন)
কীওয়ার্ডটি ক্ষতিকারক হচ্ছে। আপনার যদি পারস্পরিক সম্পর্কযুক্ত বৈশিষ্ট্য থাকে তবে সেগুলি লক্ষ্যের সাথেও সম্পর্কিত হয়, আপনি সেগুলি রাখতে চান। একটি ভাল অনুমান করার জন্য আপনি বৈশিষ্ট্যগুলি ইঙ্গিত হিসাবে দেখতে পারেন, যদি আপনার কাছে দুটি ইঙ্গিত থাকে যা মূলত একই হয় তবে সেগুলি ভাল ইঙ্গিতগুলি থাকে তবে সেগুলি রাখা বুদ্ধিমানের কাজ।
নায়েভ বেয়েসের মতো কিছু অ্যালগরিদম আসলে "ইতিবাচক" পারস্পরিক সম্পর্কযুক্ত বৈশিষ্ট্য থেকে সরাসরি উপকৃত হয়। এবং এলোমেলো বনের মতো অন্যরা তাদের থেকে পরোক্ষভাবে উপকৃত হতে পারে।
এ, বি এবং সি এর তিনটি বৈশিষ্ট্য রয়েছে তা কল্পনা করুন এ এবং বি লক্ষ্য এবং একে অপরের সাথে অত্যন্ত সংযুক্ত, এবং সি একেবারেই নয়। আপনি যদি 3 টি বৈশিষ্ট্যের মধ্যে নমুনা করেন তবে আপনার কাছে একটি "ভাল" বৈশিষ্ট্য পাওয়ার 2/3 সুযোগ রয়েছে, আপনি যদি উদাহরণস্বরূপ বি কে সরিয়ে থাকেন তবে এই সুযোগটি 1/2 এ নেমে আসে
অবশ্যই, যদি বৈশিষ্ট্যগুলি সংযুক্ত থাকে তবে প্রথমে সুপার তথ্য না থাকলে, অ্যালগরিদম খুব বেশি ক্ষতিগ্রস্থ হতে পারে না।
গল্পটির নৈতিকতা, গতির কারণে এই বৈশিষ্ট্যগুলি সরিয়ে ফেলা প্রয়োজনীয় হতে পারে তবে মনে রাখবেন যে আপনি আপনার অ্যালগরিদমটিকে প্রক্রিয়াটিতে আরও খারাপ করে দিতে পারেন। এছাড়াও, সিদ্ধান্ত গাছের মতো কিছু অ্যালগরিদমে এগুলিতে এমবেড করা বৈশিষ্ট্যযুক্ত বৈশিষ্ট্য রয়েছে।
এর সাথে মোকাবিলা করার একটি ভাল উপায় হ'ল বৈশিষ্ট্য নির্বাচনের জন্য একটি মোড়ক পদ্ধতি ব্যবহার করা। এটি অনর্থক বৈশিষ্ট্যগুলি কেবল তখনই সরিয়ে ফেলবে যদি তারা সরাসরি কার্য সম্পাদনে অবদান না দেয়। এগুলি যদি নিষ্পল বেয়েসের মতো কার্যকর হয় তবে সেগুলি রাখা হবে। (যদিও মনে রাখবেন যে মোড়কের পদ্ধতিগুলি ব্যয়বহুল এবং অত্যধিক মানসিক চাপের দিকে নিয়ে যেতে পারে)
- আপনার মডেলটির ব্যাখ্যাযোগ্যতা
যদি আপনার মডেলটি ব্যাখ্যার প্রয়োজন হয়, আপনি এটিকে আরও সহজ করতে বাধ্য হতে পারেন be ওসামের রেজারটিও মনে আছে তা নিশ্চিত করে নিন। যদি আপনার মডেলটি কম বৈশিষ্ট্য সহ "এত বেশি" খারাপ না হয়, তবে আপনার সম্ভবত কম বৈশিষ্ট্য ব্যবহার করা উচিত।