রৈখিক পৃথকতার জন্য পরীক্ষা


20

উচ্চ মাত্রায় একটি দ্বি-শ্রেণীর ডেটাসেটের রৈখিক পৃথককরণের পরীক্ষা করার কোনও উপায় আছে কি? আমার বৈশিষ্ট্যটির ভেক্টরগুলি 40-দীর্ঘ।

আমি জানি যে আমি সর্বদা লজিস্টিক রিগ্রেশন পরীক্ষাগুলি চালাতে পারি এবং হিট্রেট বনাম মিথ্যা বিপদাশঙ্কার হার নির্ধারণ করতে পারি যে এই সিদ্ধান্তটি নির্ধারণ করতে যে দুটি শ্রেণিই রৈখিকভাবে পৃথকযোগ্য কিনা তবে ইতিমধ্যে এটির জন্য কোনও মানক পদ্ধতি রয়েছে কিনা তা জানা ভাল হবে।



এটি পৃথকীকরণের প্লট করতে দরকারী: x = বিবিধ শ্রেণীবদ্ধ পয়েন্ট সাধারণ থেকে পৃথকীকরণ-বিমান, y = ক্রমবর্ধমান ক্ষতি (x)। (একটি নমুনা চক্রান্ত জন্য, ট্যাগ svm এবং তথ্য-কল্পনা সঙ্গে একটি নতুন প্রশ্ন চেষ্টা করুন।)
ডেনিস

3 ক্লাস সমস্যা সম্পর্কে কি? 3+ শ্রেণির সমস্ত সমস্যা কি অ-রৈখিক?
রোজি

উত্তর:


3

ভাল, সমর্থন ভেক্টর মেশিনগুলি (এসভিএম) সম্ভবত আপনি যা খুঁজছেন are উদাহরণস্বরূপ, লিনিয়ার আরবিএফ কার্নেল সহ এসভিএম, একটি উচ্চতর মাত্রিক স্থানের জন্য মানচিত্র বৈশিষ্ট্যযুক্ত এবং একটি লিনিয়ার হাইপারপ্লেন দ্বারা ক্লাসগুলি বিভক্ত করার চেষ্টা করে। ধারণাটি চিত্রিত করার জন্য এটি একটি দুর্দান্ত শর্ট এসভিএম ভিডিও is

আপনি বৈশিষ্ট্য নির্বাচনের (মোড়ক মডেল) অনুসন্ধানের পদ্ধতিতে এসভিএমকে জড়িয়ে রাখতে পারেন এবং দেখার চেষ্টা করতে পারেন যে আপনার কোনও বৈশিষ্ট্য আপনার ক্লাসকে রৈখিকভাবে পৃথক করতে পারে কিনা।

এলআইবিএসভিএম , এমএসভিএমপ্যাক এবং সাইকিট - লার্ন এসভিএম সহ এসভিএম ব্যবহারের জন্য অনেক আকর্ষণীয় সরঞ্জাম রয়েছে ।


1
+1 টি। এটি প্রায় যেন নিক যেমন এসভিএম এর বর্ণনা দিচ্ছিল, তাদের কথা শুনেনি। আর, আপনি ব্যবহার করতে পারে (রহস্যজনকভাবে নামক) e1071প্যাকেজ এর svmসঙ্গে kernel="linear"এবং বনাম প্রকৃত ভবিষ্যদ্বাণী দিকে তাকাও।
ওয়েন 15

1
আমি এসভিএম সম্পর্কে জানি। কেবলমাত্র আমি জানতাম না যে আমি প্রতিটি নমুনাকে শ্রেণিবদ্ধ না করেই লিনিয়ার পৃথকীকরণের পরীক্ষার জন্য তাদের ব্যবহার করতে পারি ।
নিক

4
@ ওয়াইন: নিক আসলে এসভিএমগুলির জন্য জিজ্ঞাসা করছে না। এটি আমার সমস্যার সমাধান কেন নয় তা আমি আমার উত্তরে বুঝিয়েছি।
রাফেল

2
একটি " লিনিয়ার আরবিএফ কার্নেল " বিদ্যমান নেই।
মার্ক ক্লিসেন

অবশ্যই ! যা বোঝানো হয়েছিল তা হ'ল একটি আরবিএফ কার্নেল যা তথ্যকে একটি রৈখিক পৃথকযোগ্য স্থানে ম্যাপ করে।
soufanom

17

গুণগতভাবে দুটি পয়েন্টের লাইনারি পৃথকযোগ্য কিনা তা স্থির করার সবচেয়ে কার্যকর উপায় লিনিয়ার প্রোগ্রামিং প্রয়োগ করে । জিএলটিকে সেই লক্ষ্যে নিখুঁত এবং প্রতিটি উচ্চ স্তরের ভাষা এর জন্য একটি ইন্টারফেস দেয় - আর , পাইথন, অক্টেভ, জুলিয়া ইত্যাদি G

এসভিএম ব্যবহারের পরামর্শ দেওয়া উত্তরের প্রতি সম্মান সহ :

SVMs ব্যবহার দুটি কারণে লিনিয়ার পৃথকীকরণ যাচাই করার জন্য একটি সর্বোত্তম সমাধান:

  1. এসভিএমগুলি নরম-মার্জিন শ্রেণিবদ্ধ হয়। এর অর্থ একটি লিনিয়ার কার্নেল এসভিএম কোনও পৃথক পৃথক বিমানের জন্য স্থির হতে পারে যা সত্যই সম্ভব হলেও এটি পুরোপুরি আলাদা হয় না। আপনি যদি ত্রুটি হারটি 0 টি করে যাচ্ছেন তা পরীক্ষা করে দেখুন এবং আপনি মিথ্যাভাবে উপসংহারে পৌঁছে যাবেন যে দুটি সেট রৈখিকভাবে পৃথক নয়। এই সমস্যাটি খুব উচ্চ মূল্যের সহগ সি বাছাই করে কমাতে পারে - তবে এটি নিজেই খুব উচ্চ গুণগত খরচে আসে।

  2. এসভিএমগুলি সর্বাধিক-মার্জিন শ্রেণিবদ্ধ হয়। তার অর্থ অ্যালগরিদম যতদূর সম্ভব উভয় থেকে দূরে থাকার চেষ্টা করার সময় দুটি পৃথক পৃথককারী একটি পৃথককারী বিমান আবিষ্কার করার চেষ্টা করবে। আবার এটি একটি বৈশিষ্ট্য যা অযৌক্তিকভাবে গণ্য প্রচেষ্টা বৃদ্ধি করে কারণ এটি এমন কিছু গণনা করে যা লিনিয়ার পৃথকীকরণের প্রশ্নের উত্তর দেওয়ার জন্য প্রাসঙ্গিক নয়।


ধরা যাক আপনার A এবং B পয়েন্টের একটি সেট রয়েছে:

এখানে চিত্র বর্ণনা লিখুন

তারপরে আপনাকে নিম্নলিখিত শর্তগুলির জন্য 0 টি হ্রাস করতে হবে:

(নীচের একটিটি একটি ম্যাট্রিক্স, উপরে থেকে পয়েন্টের সেট নয়)

এখানে চিত্র বর্ণনা লিখুন

"মিনিমাইজিং 0" এর কার্যকরভাবে অর্থ হল যে আপনাকে আসলে কোনও উদ্দেশ্যমূলক ফাংশনটি অনুকূল করতে হবে না কারণ সেটগুলি রৈখিকভাবে পৃথকযোগ্য কিনা তা খুঁজে বের করার প্রয়োজন নেই।

শেষ পর্যন্ত ( এখানে চিত্র বর্ণনা লিখুন) পৃথককারী বিমানটিকে সংজ্ঞায়িত করছে।


এখানে চিত্র বর্ণনা লিখুন

যদি আপনি আর বা গণিত বিস্তারিত ওয়ার্কিং উদাহরণে আগ্রহী, তারপর পরীক্ষা এই বাইরে।


3
এসভিএমগুলি নরম-মার্জিন শ্রেণিবদ্ধ হয় ... আপনি যখন হার্ড মার্জিন এসভিএম ব্যবহার করেন তখন বাদে। এটি বলেছিল, এসভিএমগুলি ব্যবহার করা একটি কামান দিয়ে একটি ফ্লাইয়ের শুটিংয়ের মতো হবে।
মার্ক ক্লেসেন

এটি সঠিক - যদিও এসভিএম গ্রন্থাগারগুলির অনেকগুলি (বা সম্ভবত সর্বাধিক সংখ্যাগরিষ্ঠ) এই পছন্দটি দেয় না
রাফেল

2
সি

0

লিনিয়ার পারসেপ্ট্রন যদি কোনও উপস্থিত থাকে তবে এর সমাধান সন্ধানের নিশ্চয়তা রয়েছে। এই পদ্ধতির বৃহত মাত্রা জন্য দক্ষ নয়। গুণগতভাবে দুটি সেট পয়েন্টের লাইনগতভাবে পৃথকযোগ্য কিনা তা সিদ্ধান্ত নেওয়ার সবচেয়ে কার্যকর উপায় হ'ল @ রাফেল দ্বারা উল্লিখিত লিনিয়ার প্রোগ্রামিং প্রয়োগ করে।

একটি দ্রুত সমাধান হ'ল একটি উপলব্ধি সমাধান করা। মতলব-এ পেরসেপ্ট্রন ব্যবহার করে সমাধান করার উদাহরণ সহ একটি কোড এখানে

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.