কেবলমাত্র এক শ্রেণির জন্য শ্রেণিবদ্ধকারী


10

একটি সাধারণ শ্রেণিবিন্যাসে, আমাদের দুটি শ্রেণি রয়েছে: শ্রেণি -0 এবং শ্রেণী -1। কিছু ডেটাতে আমার কাছে কেবল ক্লাস -1 এর মান রয়েছে, সুতরাং ক্লাস -0 এর জন্য কোনওটিই নয়। এখন আমি ক্লাস -১ এর জন্য ডেটা মডেল করার জন্য একটি মডেল তৈরি করার কথা ভাবছি। সুতরাং, যখন নতুন ডেটা আসে, এই মডেলটি নতুন ডেটাতে প্রয়োগ করা হয় এবং একটি সম্ভাব্যতা খুঁজে পাওয়া যায় যা বলছে যে এই নতুন ডেটা এই মডেলটির সাথে কতটা সম্ভব able তারপরে একটি প্রান্তিকের সাথে তুলনা করে, আমি অনুপযুক্ত ডেটা ফিল্টার করতে পারি।

আমার প্রশ্নগুলি হ'ল:

  • এই জাতীয় সমস্যাগুলি নিয়ে কাজ করার জন্য এটি কি ভাল উপায়?
  • এই ক্ষেত্রে একটি র‌্যান্ডমফোরস্ট শ্রেণিবদ্ধ ব্যবহার করা যেতে পারে? ক্লাস -0 এর জন্য কি আমার কী কৃত্রিম ডেটা যুক্ত করা দরকার যা আমি আশা করি শ্রেণিবদ্ধকে গোলমাল হিসাবে দেখায়?
  • অন্য কোনও ধারণা এই সমস্যার জন্য সাহায্য করতে পারে?

উত্তর:


9

এটি কিছু পদ্ধতির ব্যবহার সম্ভব এবং এটি অবশ্যই একটি বৈধ পন্থা। যদিও এলোমেলো বন এটি করতে পারে তা আমি নিশ্চিত নই।

কৃত্রিম ডেটা তৈরির অর্থ অতিরিক্ত অনুমান করা, আপনার যদি তা না করেন তবে তা করবেন না।

আপনি যে কৌশলটি দেখতে চাইতে পারেন তা হ'ল তথাকথিত এক-শ্রেণীর এসভিএম। এটি ঠিক আপনি যা খুঁজছেন তা করে: এটি এমন একটি মডেল তৈরির চেষ্টা করে যা প্রশিক্ষণ পয়েন্টগুলি গ্রহণ করে এবং অন্যান্য বিতরণ থেকে পয়েন্টগুলি প্রত্যাখ্যান করে।

এক-শ্রেণীর এসভিএম সম্পর্কিত কিছু উল্লেখ:

  1. শেলকোফ, বার্নহার্ড, ইত্যাদি। "একটি উচ্চ-মাত্রিক বিতরণের সমর্থন অনুমান করা।" নিউরাল গণনা 13.7 (2001): 1443-1471। এই কাগজ পদ্ধতির প্রবর্তন।

  2. ট্যাক্স, ডেভিড এমজে, এবং রবার্ট পিডব্লিউ ডুইন। "ভেক্টর ডেটা বিবরণ সমর্থন করুন।" মেশিন লার্নিং 54.1 (2004): 45-66। একই জিনিসটি করার একটি ভিন্ন উপায়, সম্ভবত আরও স্বজ্ঞাত।

এই উভয় পদ্ধতিরই সমতুল্য দেখানো হয়েছে। প্রথমটি একটি হাইপারপ্লেনের অনুমান করে যা সর্বাধিক দূরত্ব সহ বৈশিষ্ট্য স্পেসে সমস্ত প্রশিক্ষণ ডেটা উত্স থেকে পৃথক করে। দ্বিতীয়টি অনুশীলন জায়গাগুলি সহ বৈশিষ্ট্য জায়গার সর্বনিম্ন ব্যাসার্ধ সহ একটি হাইপারস্পিয়ার অনুমান করে।

এক শ্রেণীর এসভিএম অনেকগুলি এসভিএম প্যাকেজগুলিতে পাওয়া যায়, যার মধ্যে লাইবসভিএম , সাইকিট-লার্ন (পাইথন) এবং কার্নলব (আর) রয়েছে।


3
: - ট্যাক্স এর পিএইচডি থিসিস "এক শ্রেণীর শ্রেণীবিন্যাস পাল্টা উদাহরণ অনুপস্থিতিতে ধারণা-লার্নিং" পাওয়া যায় homepage.tudelft.nl/n9d04/thesis.pdf
cbeleites এসএক্স অসন্তুষ্ট

সংক্ষিপ্ত এবং নির্ভুল! (+1) "এই দুটি পদ্ধতিরই সমতুল্য হিসাবে দেখানো হয়েছে।" - আপনি কি এর জন্য একটি রেফারেন্স / প্রশংসা উল্লেখ করতে পারেন? এটি শিক্ষাগত। Google.de/…
বোর্ন

6

আমাকে আরও কিছু সম্ভাবনা যুক্ত করুন:

সাধারণ ধারণাটি হ'ল শ্রেণি থেকে দূরত্বে একটি প্রান্ত স্থাপন করা আপনাকে কোনও সিদ্ধান্ত নিতে সক্ষম করে যে কোনও নমুনা সেই শ্রেণীর অন্তর্ভুক্ত কিনা এবং অন্য শ্রেণি আছে কিনা তা নির্বিশেষে।

  • মহালানোবিস-দূরত্ব => কিউডিএ
  • সিমকা (ক্লাস অ্যানালজিগুলির সফট ইন্ডিপেন্ডেন্ট মডেলিং) পিসিএ স্কোর স্পেসে দূরত্ব ব্যবহার করে।
    কেমোমেট্রিক সাহিত্যে সিমসিএ প্রচলিত (যদিও খুব কমই সত্যই এটি একটি শ্রেণির উপায়ে সেট আপ করা হয়েছিল)।
  • (এসভিএমগুলি ইতিমধ্যে @ মার্ক ক্লেসেনের উত্তরে চিকিত্সা করা হয়েছে)

রিচার্ড জি। ব্রেকেটন: কেমোমেট্রিক্স ফর প্যাটার্ন রিকগনিশন (উইলি, ২০০৯) এর এক-শ্রেণীর শ্রেণিবিন্যাস সম্পর্কে একটি সম্পূর্ণ অধ্যায় রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.