এসভিএম (সমর্থন ভেক্টর মেশিন) এর জন্য শ্রেণিবদ্ধ এবং অবিচ্ছিন্ন ডেটা মেশানো কি ঠিক আছে?


14

আমার মতো একটি ডেটাসেট আছে

+--------+------+-------------------+
| income | year |        use        |
+--------+------+-------------------+
|  46328 | 1989 | COMMERCIAL EXEMPT |
|  75469 | 1998 | CONDOMINIUM       |
|  49250 | 1950 | SINGLE FAMILY     |
|  82354 | 2001 | SINGLE FAMILY     |
|  88281 | 1985 | SHOP & HOUSE      |
+--------+------+-------------------+

আমি এটি একটি এলআইবিএসভিএম ফর্ম্যাট ভেক্টর স্পেসে এম্বেড করেছি

+1 1:46328 2:1989 3:1
-1 1:75469 2:1998 4:1
+1 1:49250 2:1950 5:1
-1 1:82354 2:2001 5:1
+1 1:88281 2:1985 6:1

বৈশিষ্ট্য সূচকগুলি:

  • 1 হ'ল "আয়"
  • 2 "বছর"
  • 3 হ'ল "ব্যবহার / বাণিজ্যিক ছাড়"
  • 4 হ'ল "ব্যবহার / কর্ডমিনিয়াম"
  • 5 হ'ল "ব্যবহার / একক পরিবার"
  • 6 হ'ল "ব্যবহার / শপ এবং হাউস"

একটানা (বছর, আয়) এবং শ্রেণিবদ্ধ (ব্যবহার) ডেটার মিশ্রণ সহ কোনও সমর্থন ভেক্টর মেশিন (এসভিএম) প্রশিক্ষণ দেওয়া কি ঠিক আছে?


3
আপনার "এসভিএম" বানান কমপক্ষে একবার করা উচিত।
পিটার ফ্লুম - মনিকা পুনরায়

1
আপনি যে তথ্য স্কেল নিশ্চিত করুন!
প্যাট্রিক ক্যালডন

উত্তর:


7

হ্যাঁ! তবে আপনি যেভাবে বলতে চাইছেন সেভাবে নয়। আমার গবেষণায় আমি প্রায়শই পুনরাবৃত্ত বিভাজনের মতো অ্যালগরিদম ব্যবহার করে ক্রমাগত মূল্যবানদের থেকে শ্রেণীবদ্ধ বৈশিষ্ট্যগুলি তৈরি করি । আমি সাধারণত ভেক্টর মেশিনগুলির এসভিএমএলাইট প্রয়োগের সাথে এই পদ্ধতির ব্যবহার করি তবে আমি এটি লিবিএসভিএমের সাথেও ব্যবহার করেছি। আপনার অবশ্যই নিশ্চিত হওয়া দরকার যে প্রশিক্ষণ এবং শ্রেণিবিন্যাসের সময় আপনি আপনার বৈশিষ্ট্য ভেক্টরের একটি নির্দিষ্ট জায়গায় আপনার বিভাজনযুক্ত শ্রেণীবদ্ধ বৈশিষ্ট্যগুলি নির্ধারিত করেছেন, অন্যথায় আপনার মডেলটি ভঙ্গুরতার সাথে শেষ হতে চলেছে।

সম্পাদনা: এটি বলার অপেক্ষা রাখে না যে, আমি যখন এটি সম্পন্ন করেছি তখন আমি পুনরাবৃত্তির পার্টিশনের আউটপুটটির সাথে সম্পর্কিত বাইনারি মানগুলিতে ভেক্টরের প্রথম এন উপাদানগুলি অর্পণ করি। বাইনারি বৈশিষ্ট্য মডেলিংয়ে, আপনার কেবল 0 এবং 1 এর একটি দৈত্য ভেক্টর রয়েছে, তাই মডেলটির কাছে সমস্ত কিছুই একই রকম দেখাচ্ছে, আপনি ভিন্ন ভিন্ন বৈশিষ্ট্যগুলি কোথায় তা স্পষ্টভাবে নির্দেশ না করে। এটি সম্ভবত অত্যধিক নির্দিষ্ট, যেমন আমি কল্পনা করেছি যে বেশিরভাগ এসভিএম বাস্তবায়নগুলি এটি তাদের নিজস্বভাবে করবে, তবে, আপনি যদি নিজের প্রোগ্রাম করতে চান, তবে এটি ভাববার মতো কিছু হতে পারে!


1
ধন্যবাদ কাইল, আপনি কি আরও কিছু নির্দিষ্ট হতে পারেন? "আপনার পার্টিশনযুক্ত শ্রেণিবদ্ধ বৈশিষ্ট্যগুলি নির্দিষ্ট জায়গায় নির্ধারণ করুন" এর অর্থ কী?
Seamus Abshere

@ সিমাসআবাসে কোনও সমস্যা নেই! আমি আমার উত্তর সম্পাদনা!
কাইল

আমার মনে হচ্ছে আমি শুনেছি যে আপনি যে কথা বলছেন সেগুলি libsvm কি করে - কোন চিন্তা?
Seamus Abshere

@ সিমাসআবাসে আমি কল্পনা করেছি আপনি ঠিক বলেছেন, তবে আমি নিশ্চিতভাবে জানি না। এখন যেহেতু আমি এটি সম্পর্কে চিন্তা করি, আমি নিশ্চিত নই যে এটি অন্য কোনও উপায়ে কীভাবে কাজ করতে পারে।
কাইল

@ কাইলের উত্তরে উত্সাহিত হয়ে , আমি একটি রুবি গ্রন্থাগার ( ভেক্টর এম্বেড) লিখেছিলাম যা এই রূপান্তরটি (এম্বেডিং) স্বয়ংক্রিয়ভাবে করে, উভয় শ্রেণিবদ্ধ (মারমুর 32 হ্যাশ ব্যবহার করে) এবং অবিচ্ছিন্ন ডেটার জন্য। এটি libsvm- ফর্ম্যাট করা ফাইলগুলি আউটপুট করে।
Seamus Abshere
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.