শ্রেণিবদ্ধ বৈশিষ্ট্যগুলির সাথে কোনও এসভিএমের সাথে কীভাবে ডিল করবেন


18

আমার 35 টি মাত্রার (বৈশিষ্ট্য) স্থান রয়েছে। আমার বিশ্লেষণ সমস্যাটি একটি সাধারণ শ্রেণিবিন্যাস।

35 টি মাত্রার মধ্যে 25 টিরও বেশি শ্রেণিবদ্ধ এবং প্রতিটি বৈশিষ্ট্য 50+রও বেশি ধরণের মান গ্রহণ করে।

সেই পরিস্থিতিতে, একটি ডামি ভেরিয়েবল প্রবর্তন করাও আমার পক্ষে কার্যকর হবে না।

আমি কীভাবে একটি স্পেসে একটি এসভিএম চালাতে পারি যার মধ্যে প্রচুর শ্রেণীবদ্ধ বৈশিষ্ট্য রয়েছে?

উত্তর:


22
  1. আপনি যদি নিশ্চিত হন যে শ্রেণীবদ্ধ বৈশিষ্ট্যটি আসলে অর্ডিনাল, তবে কেবল এটি সংখ্যাসূচক হিসাবে বিবেচনা করুন।
  2. যদি তা না হয় তবে এটির সংখ্যাগত বৈশিষ্ট্যে পরিণত করতে কিছু কোডিং ট্রিক ব্যবহার করুন। লিবসভিএম এর লেখকের পরামর্শ অনুসারে, কেউ কেবল 1-অফ-কে কোডিং ব্যবহার করতে পারেন। উদাহরণস্বরূপ, থেকে একটি 1-মাত্রিক বিভাগ অ্যাট্রিবিউট গ্রহণ মান অনুমান । কেবল এটিকে ত্রি-মাত্রিক সংখ্যায় পরিণত করুন যেমন , , । অবশ্যই, এটি আপনার সমস্যায় উল্লেখযোগ্যভাবে অতিরিক্ত মাত্রা ব্যয় করবে, তবে আমি মনে করি এটি আধুনিক এসভিএম সলভারের জন্য কোনও গুরুতর সমস্যা নয় (আপনি গ্রহণ করেন লিনিয়ার টাইপ বা কার্নেল ধরণের কোনও বিষয় নয়)।{একজন,বি,সি}একজন=(1,0,0)বি=(0,1,0)সি=(0,0,1)

+1 এটি আমিও বলতে যাচ্ছিলাম! একপাশে, আমি আরও যোগ করেছি যে পুনরাবৃত্তাকার পার্টিশনটি কখনও কখনও ক্রমাগত-মূল্যবান বৈশিষ্ট্যগুলিতে বিচ্ছিন্ন করার জন্য কোথায় সর্বনিম্ন মূল্যবান বৈশিষ্ট্যগুলি কাটা যায় তা সনাক্ত করতে ব্যবহৃত হয়।
কাইল

মজাদার! "পুনরাবৃত্তির বিভাজন" আমার কাছে একটি (বাইনারি) গাছ শোনাচ্ছে। এই দুটি ধারণার মধ্যে কোন পার্থক্য আছে? তদ্ব্যতীত, এসভিএম ইতিমধ্যে নিরবিচ্ছিন্ন বৈশিষ্ট্য মোকাবেলা করতে সক্ষম, কেন আমরা এটিকে বিন্যাসে পরিণত করব (আবার, শ্রেণিবদ্ধ তথ্য)?
pengsun.thu

3
এ-লে স্তরের শ্রেণিবদ্ধ ভেরিয়েবলের জন্য কি কে -১ ডামি ভেরিয়েবলগুলি তৈরি করা যথেষ্ট নয়? উদাহরণস্বরূপ এ = (1,0,0), বি = (0,1,0) এখানে, এড়ানো (0,0,1)?
আউটিলার

ফলোআপ প্রশ্ন: ডামিড 0-1 ডেটার অতিরিক্ত কোনও স্কেলিংয়ের প্রয়োজন নেই?
আযাও
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.