এলোমেলো বন শ্রেণিবদ্ধকরণের জন্য আমি কীভাবে শ্রেণিবদ্ধ ডেটা ফিট করতে পারি?


12

র‌্যান্ডম ফরেস্ট অ্যালগরিদম প্রয়োগ করে আমার প্রশিক্ষণের ডেটাসেটের যথার্থতা খুঁজে পাওয়া দরকার। তবে আমার ডেটা সেটের ধরণটি উভয় শ্রেণিবদ্ধ এবং সংখ্যাসূচক। আমি যখন এই ডেটা ফিট করার চেষ্টা করেছি, তখন আমি একটি ত্রুটি পেয়েছি।

'ইনপুটটিতে NaN, অনন্ত বা dtype (' float32 ')' এর চেয়ে খুব বড় একটি মান রয়েছে।

সমস্যা হতে পারে বস্তুর ডেটা ধরণের জন্য। আরএফ প্রয়োগের জন্য রূপান্তর না করে আমি কীভাবে শ্রেণিবদ্ধ ডেটা ফিট করতে পারি?

আমার কোড এখানে।

স্ক্রিনশট

স্ক্রিনশট

স্ক্রিনশট


আপনি যদি কোনও গাছের মডেল ব্যবহার করেন তবে আপনাকে ওয়ান_ও পরিচালনা করার দরকার নেই, কারণ এটি অন্যান্য পদ্ধতির মতো দূরত্ব পরিমাপ করছে না।
জুন ইয়াং

1
জুনিয়ং, সাইকিট-শিখার জন্য বর্তমানে এনকোডিং বিভাগগুলি প্রয়োজন।
বেন রেইনিজার

উত্তর:


11

আপনাকে বিভাগীয় বৈশিষ্ট্যগুলিকে সংখ্যাসূচক বৈশিষ্ট্যে রূপান্তর করতে হবে। একটি সাধারণ পদ্ধতি হ'ল এক হট এনকোডিং ব্যবহার করা, তবে এটি অবশ্যই একমাত্র বিকল্প নয়। আপনার যদি উচ্চ সংখ্যার শ্রেণিবদ্ধ স্তরগুলির সাথে একটি ভেরিয়েবল থাকে তবে আপনার স্তরগুলির সংমিশ্রণ বা হ্যাশিং ট্রিকটি ব্যবহার করা উচিত। স্কলারন বেশ কয়েকটি পদ্ধতির সাথে সজ্জিত হয় ("আরও দেখুন" বিভাগটি দেখুন): ওয়ান হট এনকোডার এবং হ্যাশিং ট্রিক

আপনি যদি স্কলার্নে প্রতিশ্রুতিবদ্ধ না হন তবে h2o এলোমেলো বন বাস্তবায়ন সরাসরি শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি পরিচালনা করে।


0

আমি জানি যতদূর এই ধরণের ত্রুটি পাওয়ার জন্য কিছু সমস্যা রয়েছে। প্রথমটি হ'ল, আমার ডেটাসেটগুলিতে অতিরিক্ত স্থান রয়েছে যা ত্রুটি দেখাচ্ছে কেন, 'ইনপুটটিতে এনএএন মান থাকে; দ্বিতীয়ত, পাইথন কোনও ধরণের বস্তুর মান নিয়ে কাজ করতে সক্ষম হয় না। আমাদের এই বস্তুর মানকে সংখ্যাসূচক মানতে রূপান্তর করতে হবে। বস্তুকে সংখ্যায় রূপান্তর করার জন্য দুটি ধরণের এনকোডিং প্রক্রিয়া বিদ্যমান: লেবেল এনকোডার এবং একটি হট এনকোডার। যেখানে লেবেল এনকোডার এনকোড অবজেক্টের মান 0 থেকে n_class-1 এবং এক হট এনকোডার এনকোড মান 0 থেকে 1 এর মধ্যে হয় আমার কাজের ক্ষেত্রে, কোনও ধরণের শ্রেণিবদ্ধকরণ পদ্ধতির জন্য আমার ডেটা ফিট করার আগে আমি মান রূপান্তর করার জন্য লেবেল এনকোডার ব্যবহার করি এবং রূপান্তর করার আগে আমি নিশ্চিত করেছিলাম যে আমার ডেটা সেটে কোনও ফাঁকা জায়গা নেই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.