ভিসি-মাত্রা গণনা কিভাবে?


12

আমি মেশিন লার্নিং অধ্যয়ন করছি এবং আমি ভিসি-ডাইমেনশন কীভাবে গণনা করব তা জানতে চাই।

উদাহরণ স্বরূপ:

(এক্স)={1যদি একটিএক্স0আর  , পরামিতি সঙ্গে(একটি,)আর2

এর ভিসি-ডাইমেনশন কী?

উত্তর:


10

ভিসি মাত্রা বাইনারি শ্রেণিবদ্ধের সক্ষমতা জন্য অনুমান। আপনি একটি সেট যদি জানতে পারেন পয়েন্ট, যাতে এটি ক্লাসিফায়ার দ্বারা টুটা করা যেতে পারে (অর্থাত শ্রেণীভুক্ত সব সম্ভব 2 এন labelings সঠিকভাবে) এবং আপনার পরিস্থিতির করতে পারবে না এটি কোনো সেট এন + + 1 কোন সেট অর্থাত পয়েন্ট অর্জন করে নিজেদের ভাঙা যেতে পারে ( n + 1 পয়েন্টে কমপক্ষে একটি লেবেলিংয়ের অর্ডার রয়েছে যাতে শ্রেণিবদ্ধকারী সমস্ত পয়েন্ট সঠিকভাবে আলাদা করতে না পারে), তারপরে ভিসি মাত্রা এন হয়এন2এনএন+ +1এন+ +1n

আপনার ক্ষেত্রে, প্রথমে এবং x 2 দুটি পয়েন্ট বিবেচনা করুন , যেমন x 1 < x 2 । তারপরে সেখানে 2 2 = 4 সম্ভাব্য লেবেল রয়েছেx1x2x1<x222=4

  1. , x 2 : 1এক্স1:1এক্স2:1
  2. , x 2 : 0এক্স1:0এক্স2:0
  3. , x 2 : 0এক্স1:1এক্স2:0
  4. , x 2 : 1এক্স1:0এক্স2:1

সকল labelings ক্লাসিফায়ার মাধ্যমে অর্জন করা সম্ভব পরামিতি সেটিং দ্বারা একটি < আর যেমন যেএকটি<আর

  1. a<x1<এক্স2<
  2. x1<x2<a<b
  3. a<x1<b<x2
  4. x1<a<x2<b

যথাক্রমে। (প্রকৃতপক্ষে, ব্লগ ধরে নেওয়া যেতে পারে তবে একটি সেট ছিন্নবিচ্ছিন্ন হতে পারে এটি যথেষ্ট।x1<x2

এখন, তিনটি নির্বিচারে (!) পয়েন্ট বিবেচনা করুন , এক্স 2 , এক্স 3 এবং ওলগ x 1 < x 2 < x 3 ধরে নিন , তবে আপনি লেবেলিং (1,0,1) অর্জন করতে পারবেন না। উপরের 3 টি ক্ষেত্রে, x 1 : 1 এবং x 2 : 0 লেবেলগুলি একটি < x 1 < বি < x 2 বোঝায় । কোনটি বোঝা এক্স 3 > খ এবং সেইজন্য লেবেল এক্স 3x1এক্স2এক্স3এক্স1<এক্স2<এক্স3এক্স1এক্স2একটি<এক্স1<<এক্স2এক্স3এক্স3 0 হতে হবে। সুতরাং, শ্রেণিবদ্ধকারী তিনটি পয়েন্টের কোনও সেটকে ছিন্নভিন্ন করতে পারে না এবং তাই ভিসি মাত্রা 2 হয়।

-

সম্ভবত এটি আরও কার্যকর শ্রেণিবদ্ধের সাথে পরিষ্কার হয়ে যায়। হাইপারপ্লেন বিবেচনা করা যাক (অর্থাত 2D তে লাইনগুলি)।

তিনটি পয়েন্টের একটি সেট সন্ধান করা সহজ যেগুলি তাদের লেবেল করা হোক না কেন সঠিকভাবে শ্রেণিবদ্ধ করা যেতে পারে:

এখানে চিত্র বর্ণনা লিখুন

সমস্ত সম্ভাব্য লেবেলগুলির জন্য আমরা একটি হাইপারপ্লেন খুঁজে পেতে পারি যা সেগুলি পুরোপুরি আলাদা করে দেয়।23=8

তবে আমরা 4 টি পয়েন্টের কোনও সেট খুঁজে পাই না যাতে আমরা সমস্ত সম্ভাব্য লেবেলগুলি সঠিকভাবে শ্রেণিবদ্ধ করতে পারি । একটি আনুষ্ঠানিক প্রমাণের পরিবর্তে, আমি একটি চাক্ষুষ যুক্তি উপস্থাপন করার চেষ্টা করি:24=16

এখনই ধরুন, 4 পয়েন্ট 4 টি পাশ দিয়ে একটি চিত্র তৈরি করে। তারপরে এমন হাইপারপ্লেনের সন্ধান করা অসম্ভব যা আমরা একই লেবেলের সাথে বিপরীত কোণগুলিকে লেবেল করে: পয়েন্টগুলি সঠিকভাবে পৃথক করতে পারে:

যদি তারা 4 টির সাথে একটি চিত্র তৈরি করে না, তবে দুটি "সীমানা কেস" রয়েছে: "বহিরাগত" পয়েন্টগুলি অবশ্যই একটি ত্রিভুজ গঠন করবে বা সমস্তগুলি একটি সরলরেখা তৈরি করবে। ত্রিভুজের ক্ষেত্রে এটি সহজেই দেখা যায় যে "অভ্যন্তরীণ" বিন্দু (বা দুটি কোণার মধ্যবর্তী বিন্দু) অন্যদের থেকে আলাদা লেবেলযুক্ত লেবেলটি অর্জন করা যায় না:

লাইন বিভাগের ক্ষেত্রে, একই ধারণা প্রযোজ্য। শেষের পয়েন্টগুলি অন্য পয়েন্টগুলির তুলনায় আলাদাভাবে লেবেল করা থাকলে সেগুলি হাইপারপ্লেন দ্বারা পৃথক করা যাবে না।

যেহেতু আমরা 2 ডি তে 4 পয়েন্টের সমস্ত সম্ভাব্য গঠনগুলি আবৃত করেছি, তাই আমরা সিদ্ধান্তে পৌঁছাতে পারি যে সেখানে 4 পয়েন্ট নেই যা ছিন্নভিন্ন হতে পারে। সুতরাং, ভিসি মাত্রা 3 হতে হবে।


1
> তবে ফাংশনটি x1 = 0, x2 = 0, x3 = 0 অর্জন করতে পারে। এটি সমস্ত লেবেল অর্জন করা প্রয়োজন?
声 孙

আমি এখানে একই জাতীয় প্রশ্ন জিজ্ঞাসা করেছি datas विज्ञान.stackexchange.com/Qestions/39064/… যা লিনিয়ার হাইপোথিসিস ফাংশনের প্রসঙ্গে। আপনি কি উত্তর দিতে সাহায্য করতে পারেন?
সুহেল গুপ্ত 11

3

শ্রেণিবদ্ধের ভিসি মাত্রা নিম্নলিখিত উপায়ে নির্ধারিত হয়:

VC = 1
found = False
while True:
    for point_distribution in all possible point distributions of VC+1 points:
        allcorrect = True
        for classdist in every way the classes could be assigned to the classes:
            adjust classifier
            if classifier can't classify everything correct:
                allcorrect = False
                break
        if allcorrect:
            VC += 1
            continue
    break

সুতরাং কেবলমাত্র তিনটি পয়েন্ট রাখার একটি উপায় থাকতে পারে যাতে এই পয়েন্ট-প্লেসমেন্টের মধ্যে সমস্ত সম্ভাব্য বন্টনকে সঠিক উপায়ে শ্রেণিবদ্ধ করা যায়।

আপনি যদি তিনটি পয়েন্ট একটি লাইনে না রাখেন তবে উপলব্ধি এটি সঠিক হয়ে যায়। তবে আপনি কীভাবে পয়েন্টগুলি স্থাপন করেন তা বিবেচনা করে 4 পয়েন্টের সমস্ত সম্ভাব্য শ্রেণিকরণের বিতরণকে শ্রেণিবদ্ধ করার কোনও উপায় নেই

আপনার উদাহরণ

আর । প্রতিটি শ্রেণিবদ্ধের কমপক্ষে মাত্রা 1 থাকে।

ভিসি-মাত্রা 2: এটি চারটি পরিস্থিতিকে সঠিকভাবে শ্রেণিবদ্ধ করতে পারে।

  1. পয়েন্ট: 0 এবং 42
  2. ডিস্ট্রিবিউশন:
    • একটি=1337,=3141 এটি সঠিকভাবে শ্রেণিবদ্ধ করে
    • একটি=40,=1337 এটিকে সঠিকভাবে শ্রেণিবদ্ধ করে
    • একটি=-1,=1 এটিকে সঠিকভাবে শ্রেণিবদ্ধ করে
    • একটি=-1,=1337

ভিসি-মাত্রা 3: না, এটি কাজ করে না। ক্লাসগুলি কল্পনা করুন trueএবং পছন্দ করা falseহচ্ছেTrue False True । আপনার শ্রেণিবদ্ধকারী এটি মোকাবেলা করতে পারে না। অতএব এটির ভিসি-ডাইমেনশন 2 রয়েছে।

প্রমাণ

এক্স1,এক্স2,এক্স3আরএক্স1<এক্স2<এক্স3। সুতরাং শ্রেণিবদ্ধকে শ্রেণিবদ্ধ করতে সক্ষম হতে হবে

শ্রেণী (এক্স1) = সত্য, শ্রেণি (এক্স2) = মিথ্যা, শ্রেণি (এক্স3) = সত্য

ভিসি মাত্রা 3 সঠিকভাবে এক্স1 সত্য হিসাবে শ্রেণিবদ্ধ করা,

একটিএক্স1
দরকার. জন্যএক্স2 মিথ্যা হতে,
এক্স2<একটি অথবা <এক্স2
দরকার. যেমনএকটিএক্স1 এবং এক্স1<এক্স2, ক্যর <এক্স2। সুতরাং পরিস্থিতি বর্তমানে:
একটিএক্স1<এক্স2<এক্স3
জন্য এক্স3 সত্য হিসাবে শ্রেণিবদ্ধ করা,
একটিএক্স3
দরকার. তবে অন্যান্য সীমাবদ্ধতা ইতিমধ্যে প্রয়োজনীয়<এক্স3। সুতরাং এই শ্রেণিবদ্ধের সাথে কোনও 3 পয়েন্টের সমস্ত শ্রেণিবিন্যাসকে সঠিকভাবে শ্রেণিবদ্ধ করা সম্ভব নয়। অতএব এটিতে ভিসি মাত্রা 3 নেই।

1
ধ্রুবক শ্রেণিবদ্ধের ভিসি মাত্রা 0 থাকে (যদিও কেউ তর্ক করতে পারে তবে এটি প্রথম স্থানে শ্রেণিবদ্ধী হিসাবে বিবেচনা করা উচিত নয়)
ওডাব্লু_

1
হ্যাঁ সঠিক. তবে হ্যাঁ, আমি এমন কোনও সিস্টেমকে কল করব না যা কোনও মেশিন লার্নিং প্রসঙ্গে কোনও শ্রেণিবদ্ধে ডেটার সাথে খাপ খাইয়ে নিতে পারে না।
মার্টিন থোমা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.