এলোমেলো বন মডেল থেকে কোন ভবিষ্যদ্বাণী ব্যাখ্যা করার উপায় আছে?


11

বলুন যে আমি একটি এলোমেলো বনের উপর ভিত্তি করে একটি ভবিষ্যদ্বাণীপূর্ণ শ্রেণিবদ্ধকরণ মডেল পেয়েছি (আর এ র্যান্ডমফোরস্ট প্যাকেজটি ব্যবহার করে)। আমি এটি সেট আপ করতে চাই যাতে শেষ-ব্যবহারকারীরা কোনও ভবিষ্যদ্বাণী উত্পন্ন করতে কোনও আইটেম নির্দিষ্ট করতে পারে এবং এটি একটি শ্রেণিবিন্যাসের সম্ভাবনা তৈরি করে'll এখনও পর্যন্ত, কোনও সমস্যা নেই।

তবে পরিবর্তনশীল গুরুত্বের গ্রাফের মতো কিছু আউটপুট করতে সক্ষম হতে দরকারী / শীতল হতে পারে তবে নির্দিষ্ট আইটেমটির পূর্বাভাস দেওয়ার জন্য, প্রশিক্ষণের জন্য নয়। কিছুটা এইরকম:

আইটেম এক্সটিকে একটি কুকুর হিসাবে পূর্বাভাস দেওয়া হয়েছে (%৩% সম্ভবত)
কারণ:
পাগুলি = ৪
শ্বাস = খারাপ
ফার = স্বল্প
খাবার = বাজে

আপনি পয়েন্ট পেতে। প্রশিক্ষিত এলোমেলো বন থেকে এই তথ্য আহরণের কোনও মানক, বা কমপক্ষে যুক্তিযুক্ত, উপায় আছে কি? যদি তা হয় তবে কারও কি এমন কোড রয়েছে যা র্যান্ডমফোরস্ট প্যাকেজটির জন্য এটি করবে?


কিছু জটিলতা ... আপনি লেগসের পরিবর্তনশীল সিদ্ধান্তের অংশের কতবার গণনা করতে পারবেন তা ভাবতে পারেন। তবে আপনি কি কেবল সেই গাছগুলির জন্যই ব্যবহার করবেন যা সংখ্যাগরিষ্ঠ উত্তর বা তাদের সকলের পূর্বাভাস দিয়েছে? নাকি পার্থক্য?
হারলান

এবং সমস্ত mভবিষ্যদ্বাণীকারীকে এক এক করে পরিবর্তন করা এবং বনটি কীভাবে ভিন্নভাবে ভবিষ্যদ্বাণী করে তা সর্বাধিক ব্যয়বহুল বলে মনে হচ্ছে looking আরও ভাল উপায় আছে।
হারলান

আমার প্রথম চিন্তাটি ভাবছিলাম যে আপনি কী করতে চান তা প্রশিক্ষণের ডেটারের পরিবর্তনশীল গুরুত্ব থেকে কীভাবে আলাদা? আপনি কি বলতে চেয়েছেন যে অন্যান্য মানগুলি যেমন ছিল তেমন দেওয়া হয়, পা = 4 বনাম পা = 2 বা পা = 0 এর পূর্বাভাসের সংবেদনশীলতা কী ছিল? আপনি কি এলোমেলোভাবে প্যাকেজের আংশিক প্লট ফাংশনটি দেখেছেন?
বি_মিনার

পরিবর্তনশীল গুরুত্ব সাধারণত পুরো প্রশিক্ষণ সেট (বা ধরে নেওয়া জনসংখ্যা, বা কিছু) উপর শর্তসাপেক্ষে সংজ্ঞায়িত করা হয়। তবে আমি যা চাই তা হ'ল একক পূর্বাভাসযুক্ত আইটেমটির পরিবর্তনশীল গুরুত্ব । এমন কোনও ক্ষেত্রে কল্পনা করুন যেখানে বনটি খুব একচেটিয়া সিদ্ধান্তের গাছ নিয়ে গঠিত। টেস্ট ইনস্ট্যান্স 1 টি 1 বা খুব কয়েকটি সিদ্ধান্ত নোড দ্বারা ব্যাখ্যা করা যেতে পারে, অন্যদিকে টেস্ট ইনস্ট্যান্স 2 সিদ্ধান্ত নোডগুলির একটি আরও বড় সেট দ্বারা ব্যাখ্যা করা যেতে পারে। আমি এর একটি খুব সাধারণ মানব-ব্যাখ্যাযোগ্য সংস্করণ চাই, স্থির সিদ্ধান্তের মতো, শীর্ষস্থানীয় 5 যার মধ্যে আমি সরবরাহ করতে পারি। একটি একক সিদ্ধান্তের গাছের জন্য, আমি কেবল সেগুলি বন্ধ করে দেব।
হারলান

উত্তর:


3

প্রথম ধারণাটি কেবল পরিবর্তনশীল গুরুত্ব থেকে নকআউট আউট কৌশলটি নকল করা এবং প্রতিটি পরীক্ষার সাথে কীভাবে মিশ্রণটি বুনিয়াদকে শ্রেণিবিন্যাসের (ওওবিতে এবং স্পষ্টত কিছু পুনরাবৃত্তির সাথে) বনাঞ্চলের আস্থা হ্রাস পাবে তা পরীক্ষা করে দেখানো হয়। এর জন্য কিছু কোডিং দরকার, তবে অবশ্যই এটি অর্জনযোগ্য।

যাইহোক, আমি এটি কেবল একটি খারাপ ধারণা বলে মনে করি - ফলাফলটি সম্ভবত জাহান্নামের মতো হবে (বস্তুর উপরে গড়ের প্রভাব স্থিতিশীল না করে), শোরগোল (অবিশ্বাস্য বস্তুর জন্য ননসেন্সের গুণাবলী বড় প্রভাব ফেলতে পারে) এবং কঠিন ব্যাখ্যা করুন (দু'একটি বেশি গুণাবলী সমবায় সংক্রান্ত নিয়মগুলি সম্ভবত প্রতিটি অবদানকারী বৈশিষ্ট্যের এলোমেলোভাবে প্রভাব ফেলবে)।

আপনাকে নেতিবাচক উত্তর না রেখেই, আমি বরং নৈকট্য ম্যাট্রিক্স এবং এটি যে সম্ভাব্য প্রত্নতাত্ত্বিক প্রকাশ হতে পারে তা দেখার চেষ্টা করব - এটি অনেক বেশি স্থিতিশীল এবং সোজা বলে মনে হচ্ছে।


সমবায় সংক্রান্ত নিয়ম / পারস্পরিক সম্পর্কযুক্ত ভবিষ্যদ্বাণীকারী বিষয়টি একটি দুর্দান্ত সমালোচনা। এই কাজটি করার জন্য, আরএফটিকে ভবিষ্যদ্বাণীকারীদের কোনও উপসর্গের দিকে ফোকাস দেওয়ার জন্য কোনও ধরণের প্রাক-হ্রাসযোগ্য ভেরিয়েবলগুলির সেটকে প্রশিক্ষিত করা বা কোনও ধরণের শাস্তি কৌশল অন্তর্ভুক্ত করার প্রয়োজন হতে পারে।
হারলান

0

আমি চুন কাঠামো দিয়ে চেষ্টা করবে ।

এটি অনেক মডেল (এলোমেলো বন সহ) সহ কাজ করে। এটি স্থানীয় ব্যাখ্যার জন্য (যা একটি একক ভবিষ্যদ্বাণী ব্যাখ্যা করার জন্য) বা বিশ্বব্যাপী ব্যাখ্যার জন্য (এটি একটি সম্পূর্ণ মডেল ব্যাখ্যা করার জন্য) ব্যবহার করা যেতে পারে ।

অ্যাসট্রাক্ট থেকে উদ্ধৃতি দেওয়া

এই কাজের মধ্যে, আমরা LIME, একটি উপন্যাস ব্যাখ্যা কৌশল প্রস্তাব করি যা কোনও শ্রেণিবদ্ধের পূর্বাভাসের চারপাশে স্থানীয়ভাবে একটি ব্যাখ্যাযোগ্য মডেল শিখিয়ে ব্যাখ্যাযোগ্য এবং বিশ্বস্ত উপায়ে ব্যাখ্যা করে any প্রতিনিধি পৃথক পূর্বাভাস এবং তাদের ব্যাখ্যাগুলিকে একটি অপ্রয়োজনীয় উপায়ে উপস্থাপন করে মডেলগুলি ব্যাখ্যা করার একটি পদ্ধতিও প্রস্তাব করি, কাজটি সাবমোডুলার অপ্টিমাইজেশন সমস্যা হিসাবে ফ্রেম করে।

এটিতে আর এবং পাইথন উভয়েরই প্যাকেজ রয়েছে এবং এটি গুগল করা থাকলে অনেকগুলি উদাহরণ রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.