কীভাবে ডেটা রৈখিকভাবে পৃথকযোগ্য কিনা তা কীভাবে জানবেন?


21

ডেটাতে অনেকগুলি বৈশিষ্ট্য রয়েছে (উদাহরণস্বরূপ 100) এবং উদাহরণগুলির সংখ্যা 100,000 এর মতো। তথ্য বিরল। আমি লজিস্টিক রিগ্রেশন বা এসএমএম ব্যবহার করে ডেটা ফিট করতে চাই। বৈশিষ্ট্যগুলি রৈখিক বা অ-রৈখিক কিনা তা আমি কীভাবে জানতে পারি যাতে আমি লিনিয়ার না থাকলে কার্নেল ট্রিকটি ব্যবহার করতে পারি?

উত্তর:


22

তথ্যগুলি লৈখিকভাবে পৃথকযোগ্য কিনা তা খুঁজে বের করার বিভিন্ন পদ্ধতি রয়েছে, সেগুলির কয়েকটি এই পত্রিকায় হাইলাইট করা হয়েছে (1)। ডেটাসেটে দুটি শ্রেণীর অনুমান সহ, তারা লিনিয়ারে পৃথকযোগ্য কিনা তা আবিষ্কার করার জন্য নিম্নলিখিত কয়েকটি পদ্ধতি রয়েছে:

  1. লিনিয়ার প্রোগ্রামিং: লিনিয়ার পৃথকীকরণকে সন্তুষ্ট করে এমন সীমাবদ্ধতার সাথে জড়িত একটি উদ্দেশ্যমূলক ফাংশন সংজ্ঞায়িত করে। আপনি এখানে বাস্তবায়ন সম্পর্কে বিস্তারিত জানতে পারেন ।
  2. পারসেপ্ট্রন পদ্ধতি: ডেটা রৈখিকভাবে পৃথকভাবে পৃথক করা যায় তবে পার্সেপট্রনকে রূপান্তর করার নিশ্চয়তা দেওয়া হয়।
  3. চতুষ্কোণ প্রোগ্রামিং: এসভিএম হিসাবে চতুর্ভুজ প্রোগ্রামিং অপ্টিমাইজেশন উদ্দেশ্য ফাংশন বাধা সঙ্গে সংজ্ঞায়িত করা যেতে পারে।
  4. গুণগত জ্যামিতি: যদি কেউ দুটি বিচ্ছিন্ন উত্তল হাল খুঁজে পায় তবে ডেটা লাইনারি পৃথকযোগ্য
  5. ক্লাস্টারিং পদ্ধতি: যদি কেউ কিছু ক্লাস্টারিং পদ্ধতি যেমন কে-মানে ব্যবহার করে 100% এর ক্লাস্টার বিশুদ্ধতা সহ দুটি ক্লাস্টার খুঁজে পেতে পারে, তবে ডেটাটি লাইনারি পৃথকযোগ্য।

    (1): এলিজন্ডো, ডি।, "রৈখিক পৃথকীকরণের সমস্যা: কিছু পরীক্ষার পদ্ধতি", নিউরাল নেটওয়ার্কগুলিতে, আইইইই ট্রানজেকশনস, খণ্ড.17, নং 2, পিপি 3303044, মার্চ 2006 দোই: 10.1109 / টিএনএন। 2005.860871


1
দয়া করে একটি রেফারেন্স দিন (লিঙ্কগুলি পচে যেতে পারে) এবং কী কী পদ্ধতিগুলি আচ্ছাদন করা হয়েছে তার অন্তত একটি বিশদ ব্যাখ্যা দিন।
Scortchi - পুনর্বহাল মনিকা

2
ধন্যবাদ। ভাল উত্তর (+1)। আর প্যাকেজ safeBinaryRegressionলিনিয়ার প্রোগ্রামিং পদ্ধতির প্রয়োগ করে।
Scortchi - পুনর্বহাল মনিকা

কোনটি (এলপি পদ্ধতির) সহজেই জ্যামিতিকভাবে ব্যাখ্যা করা হয়, গণনাগতভাবে দক্ষ এবং সাধারণত উপলব্ধ (যেমন এলপি রুটিনগুলি হয়)।
ব্যবহারকারী 60

3

আমি ধরে নিয়েছি যে আপনি একটি 2-শ্রেণির শ্রেণিবদ্ধকরণ সমস্যা সম্পর্কে কথা বলব। এক্ষেত্রে একটি লাইন রয়েছে যা আপনার দুটি ক্লাসকে পৃথক করে এবং কোনও ধ্রুপদী অ্যালগরিদম যখন এটি রূপান্তরিত হয় তখন এটি সন্ধান করতে সক্ষম হওয়া উচিত।

অনুশীলনে, আপনাকে একই তথ্যতে প্রশিক্ষণ দিতে হবে এবং পরীক্ষা করতে হবে। যদি এরকম লাইন থাকে তবে আপনার 100% নির্ভুলতা বা 100% এউসি হওয়া উচিত। যদি এই ধরনের লাইন না থাকে তবে একই ডেটাতে প্রশিক্ষণ এবং পরীক্ষার ফলে কমপক্ষে কিছু ত্রুটি ঘটবে। ত্রুটিগুলির ভলিউমের উপর ভিত্তি করে এটি একটি অ-লিনিয়ার শ্রেণিবদ্ধকারী চেষ্টা করার উপযুক্ত বা নাও পারে।


1

minw,b ||w||2
s.t i,(wxi+b)yi1

mins,b s
s.t i,(wxi+b)yi1s
s0

ssi


+1 এটি আর প্যাকেজে প্রয়োগ করা পদ্ধতির পিছনে জ্যামিতিক safeBinaryRegression
স্বজ্ঞাত

-2

আপনি লজিস্টিক রিগ্রেশন চেষ্টা করে দেখুন এবং এটি কীভাবে কাজ করে তা দেখুন। যদি এটি কার্যকর না হয়, এমন অনেকগুলি কার্নেল রয়েছে যা আপনি চেষ্টা করতে পারেন এবং এটি এখনও কার্যকর না হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.