এসভিএমের মতো বিচ্ছিন্ন শ্রেণিবদ্ধদের জন্য আরওসি বক্ররেখা: আমরা এখনও এটিকে একটি "বক্ররেখা" বলি কেন? এটি কেবল একটি "পয়েন্ট" নয়?


25

আলোচনায়: বাইনারি শ্রেণিবদ্ধকরণের জন্য কীভাবে একটি রক বক্ররেখা উত্পন্ন করা যায় , আমি মনে করি যে বিভ্রান্তিটি ছিল যে একটি "বাইনারি শ্রেণিবদ্ধ" (যা কোনও শ্রেণিবদ্ধকারী যা 2 শ্রেণি পৃথক করে) ইয়াংয়ের জন্য যা "বিযুক্ত শ্রেণিবদ্ধ" বলা হয় (যা উত্পাদন করে পৃথক আউটপুট 0/1 কোনও এসভিএম এর মতো) এবং এএনএন বা বয়েস শ্রেণিবদ্ধের মতো ক্রমাগত আউটপুটগুলি নয় ... ইত্যাদি, সুতরাং আরওসি কীভাবে "বাইনারি অবিচ্ছিন্ন শ্রেণিবদ্ধ" জন্য পরিকল্পনা করা হয়েছিল তা নিয়ে আলোচনা হয়েছিল এবং উত্তরটি হ'ল আউটপুটগুলি বাছাই করা হয় আউটপুটগুলি অবিচ্ছিন্ন হওয়ার কারণে তাদের স্কোর দ্বারা এবং আরওসি বক্ররেখাতে প্রতিটি পয়েন্ট উত্পাদন করতে একটি প্রান্তিক ব্যবহার করা হয়।

আমার প্রশ্নটি "বাইনারি বিচ্ছিন্ন শ্রেণিবদ্ধ", যেমন এসভিএম এর জন্য, আউটপুট মানগুলি 0 বা 1 হয় So সুতরাং আরওসিটি কেবল একটি পয়েন্ট তৈরি করে বক্ররেখা নয়। আমি এখনও বিভ্রান্ত হয়েছি কেন আমরা এখনও এটিকে বক্ররেখা বলি? !! আমরা এখনও থ্রেশহোল্ড সম্পর্কে কথা বলতে পারি? কীভাবে বিশেষ করে এসভিএম-এ থ্রেশহোল্ড ব্যবহার করা যায়? কীভাবে একজন এউসি গণনা করতে পারে ?, এখানে ক্রস-বৈধকরণ কোনও ভূমিকা পালন করে?


10
একটি এসভিএম একটি বাস্তব সিদ্ধান্তের মান দেয়, অর্থাত্ স্পেসে পৃথক পৃথক হাইপারপ্লেনের স্বাক্ষরিত দূরত্ব। শ্রেণিবিন্যাসে এই সিদ্ধান্তের মানটির স্বাক্ষরের উপর ভিত্তি করে লেবেলটি দেওয়া হয়। যেমন, SVMs না আউটপুট মাত্র একটি বাইনারি মান চেয়ে, তাদের আউটপুট মাত্র শ্রেণীবিভাগে একটি পরবর্তী প্রক্রিয়াকরণের পদক্ষেপ হিসেবে binarized করা হয়।
মার্ক ক্লেসেন

উত্তর:


15
  • হ্যাঁ, এমন পরিস্থিতি রয়েছে যেখানে সাধারণ রিসিভার অপারেটিং কার্ভ পাওয়া যায় না এবং কেবল একটি পয়েন্ট বিদ্যমান।

  • এসভিএমগুলি সেট আপ করা যায় যাতে তারা শ্রেণীর সদস্যতার সম্ভাবনাগুলি আউটপুট করে। এগুলি হ'ল স্বাভাবিক মান যার জন্য একটি প্রাপক অপারেটিং কার্ভ উত্পাদন করতে একটি প্রান্তিক বৈচিত্র্যযুক্ত হবে ।
    যে আপনার জন্য খুঁজছেন?

  • আরওসি-র পদক্ষেপগুলি সাধারণত কোভেরিয়টে বিভিন্ন প্রকারের পরিবর্তনের সাথে সামান্য সংখ্যক পরীক্ষার ক্ষেত্রে ঘটে থাকে (বিশেষত, আপনি যদি আপনার পৃথক চৌম্বকটি বেছে নেন তবে একই পয়েন্টগুলি সমাপ্ত করবেন যাতে প্রতিটি নতুন পয়েন্টের জন্য কেবলমাত্র একটি নমুনা পরিবর্তিত হয়) এর অ্যাসাইনমেন্ট)।

  • নিয়মিতভাবে মডেলটির অন্যান্য (হাইপার) পরামিতিগুলির পৃথকীকরণের ফলে নির্দিষ্টতা / সংবেদনশীল জুটির সেট তৈরি হয় যা এফপিআর; টিপিআর সমন্বয় ব্যবস্থাতে অন্যান্য বক্ররেখা দেয়।
    অবশ্যই একটি বক্ররেখার ব্যাখ্যার উপর নির্ভর করে কোন পরিবর্তনটি বক্ররেখা উত্পন্ন করেছিল।

আইরিস ডেটা সেটটির "ভার্সিকালার" শ্রেণীর জন্য এখানে একটি সাধারণ আরওসি (অর্থাত্ আউটপুট হিসাবে সম্ভাব্যতার জন্য অনুরোধ করা) রয়েছে:

  • এফপিআর; টিপিআর (γ = 1, সি = 1, সম্ভাবনার প্রান্তিকতা):
    রকপাখি

একই ধরণের সমন্বয় ব্যবস্থা, তবে টিউনিং প্যারামিটারগুলির ফাংশন হিসাবে টিপিআর এবং এফপিআর γ এবং সি:

  • এফপিআর; টিপিআর (γ, সি = 1, সম্ভাবনার প্রান্তিকতা = 0.5):
    গ্রীক বর্ণমালার তৃতীয় বর্ণ

  • এফপিআর; টিপিআর (γ = 1, সি, সম্ভাবনার প্রান্তিকতা = 0.5):
    মূল্য

এই প্লটগুলির একটি অর্থ রয়েছে, তবে অর্থটি সাধারণ আরওসি থেকে স্থিরভাবে পৃথক!

আমার ব্যবহৃত আর কোডটি এখানে:

svmperf <- function (cost = 1, gamma = 1) {
    model <- svm (Species ~ ., data = iris, probability=TRUE, 
                  cost = cost, gamma = gamma)
    pred <- predict (model, iris, probability=TRUE, decision.values=TRUE)
    prob.versicolor <- attr (pred, "probabilities")[, "versicolor"]

    roc.pred <- prediction (prob.versicolor, iris$Species == "versicolor")
    perf <- performance (roc.pred, "tpr", "fpr")

    data.frame (fpr = perf@x.values [[1]], tpr = perf@y.values [[1]], 
                threshold = perf@alpha.values [[1]], 
                cost = cost, gamma = gamma)
}

df <- data.frame ()
for (cost in -10:10)
  df <- rbind (df, svmperf (cost = 2^cost))
head (df)
plot (df$fpr, df$tpr)

cost.df <- split (df, df$cost)

cost.df <- sapply (cost.df, function (x) {
    i <- approx (x$threshold, seq (nrow (x)), 0.5, method="constant")$y 
    x [i,]
})

cost.df <- as.data.frame (t (cost.df))
plot (cost.df$fpr, cost.df$tpr, type = "l", xlim = 0:1, ylim = 0:1)
points (cost.df$fpr, cost.df$tpr, pch = 20, 
        col = rev(rainbow(nrow (cost.df),start=0, end=4/6)))

df <- data.frame ()
for (gamma in -10:10)
  df <- rbind (df, svmperf (gamma = 2^gamma))
head (df)
plot (df$fpr, df$tpr)

gamma.df <- split (df, df$gamma)

gamma.df <- sapply (gamma.df, function (x) {
     i <- approx (x$threshold, seq (nrow (x)), 0.5, method="constant")$y
     x [i,]
})

gamma.df <- as.data.frame (t (gamma.df))
plot (gamma.df$fpr, gamma.df$tpr, type = "l", xlim = 0:1, ylim = 0:1, lty = 2)
points (gamma.df$fpr, gamma.df$tpr, pch = 20, 
        col = rev(rainbow(nrow (gamma.df),start=0, end=4/6)))

roc.df <- subset (df, cost == 1 & gamma == 1)
plot (roc.df$fpr, roc.df$tpr, type = "l", xlim = 0:1, ylim = 0:1)
points (roc.df$fpr, roc.df$tpr, pch = 20, 
        col = rev(rainbow(nrow (roc.df),start=0, end=4/6)))

1
এটি খুব স্পষ্ট, ধন্যবাদ। আমার এই ধারণা ছিল যে বি বি পরিবর্তিত হ'ল হাইপারপ্লেনটি সরানো এবং এভাবে আলাদা (টিপিআর, এফপিআর) থাকার মতো! তবে এসভিএম শ্রেণিবদ্ধের সাথে, পক্ষপাতিত্ব বি শিখেছে, সুতরাং এটি সেরা পরামিতি বলে মনে হচ্ছে? না ?, যদি এটি হয় তবে আরওসি বিশ্লেষণ করার দরকার নেই ?, না?
আবদেলহক মাহমুদী

@ আবদেলহাকমাহমৌদি: আমার ধারণা মডেলটি শিখেছে যে পরামিতিগুলি আপনি পরিবর্তিত হতে চান তা নয়। তবে আপনার যেমন সম্ভাব্যতা আউটপুট থাকতে পারে (আমি কোডটি খনন করিনি, সুতরাং আমি জানি না যে সম্ভাবনা এসভিএম সত্যই "হার্ড" এর সমতুল্য কিনা) কেন এটি ব্যবহার করবেন না? এটি একটি খুব সাধারণ ফলাফল যা থেকে আরওসি উত্পন্ন হয়। আর এর এসএমএম ফাংশন হ'ল বহুল ব্যবহৃত লিবসভিএম এর একটি ইন্টারফেস, সুতরাং এটি করতে আপনি আর ব্যবহারের মধ্যে সীমাবদ্ধ নন।
সিবেলাইটস মনিকে

these plots do have a meaning- এই প্লটগুলির অর্থ কী?
গুলজার

8

Y^Y^=চিহ্ন(Wটিএক্স+ +)W

Y^={0যদি  Wটিএক্স+ +<01অন্যভাবে

ηη

Y^={0যদি  Wটিএক্স+ +<η1অন্যভাবে

η

Wη

>>> from sklearn.svm import SVC
>>> model = SVC(kernel='linear', C=0.001, probability=False, class_weight='balanced')
>>> model.fit(X, y)
>>> # The coefficients w are given by
>>> w = list(model.coef_)
>>> # The intercept b is given by
>>> b = model.intercept_[0]
>>> y_hat = X.apply(lambda s: np.sum(np.array(s)*np.array(w))+b, axis=1)
>>> y_hat = (y_hat > eta).astype(float)

3

আরওসি বক্ররেখা প্লটগুলির নির্দিষ্টতা বনাম সংবেদনশীলতা যা কোনও কোভারিয়েটের (যা অবিরত বা বিচ্ছিন্ন হতে পারে) প্রান্তিকের সাথে পরিবর্তিত হয়। আমি মনে করি আপনি প্রতিক্রিয়ার সাথে কোভেরিয়েটকে বিভ্রান্ত করছেন এবং সম্ভবত কোনও আরওসি বক্রতা কী তা সম্পূর্ণরূপে বুঝতে পারেন না। এটি অবশ্যই একটি বাঁকানো বিষয় যদি কোভেরিয়াট অবিচ্ছিন্ন থাকে এবং আমরা ক্রমাগত পরিবর্তিত কোভারিয়টের জন্য একটি প্রান্তের দিকে তাকাই। যদি কোভারিয়েটটি পৃথক হয় তবে আপনি এখনও প্লট করতে পারেন এটি একটি ক্রমাগত প্রান্তিকের কাজ হিসাবে। তারপরে বাঁকটি উঁচু স্তরের চৌম্বক স্থানে উপরে (বা নীচে) সমতল হবে যা কোভেরিয়ারেটের পৃথক মানের সাথে মিল রয়েছে। সুতরাং এটি এসভিএম এবং অন্য কোনও বিযুক্ত শ্রেণিবদ্ধের জন্য প্রযোজ্য।

AUC সম্পর্কিত যেহেতু আমাদের এখনও একটি আরওসি রয়েছে (আনুমানিক একটি) আমরা এখনও এর অধীনে অঞ্চলটি গণনা করতে পারি। আমি নিশ্চিত নই যে ক্রস-বৈধতা সম্পর্কে আপনার প্রশ্নটি আপনার মনে ছিল। শ্রেণিবদ্ধকরণ সমস্যার প্রসঙ্গে শ্রেণিবদ্ধকারীর জন্য ত্রুটি হারের পক্ষপাতহীন বা প্রায় পক্ষপাতহীন অনুমান পেতে ক্রস-বৈধকরণ ব্যবহার করা হয়। সুতরাং এটি কীভাবে আমরা আরওসি-র পয়েন্টগুলি অনুমান করতে প্রবেশ করতে পারি।


1
ঠিক আছে, এসএমএম শ্রেণিবদ্ধের জন্য প্রান্তিক কী হতে পারে?
আবদেলহক মাহমুদী

আমি জানি না। কোভেরিয়েটস কি? আপনার যদি একটি সমবায়ু থাকে তবে কোনও মান একটি প্রান্তিক হতে পারে। আপনার যদি একাধিক কোভারিয়েট হয় শ্রেণিবদ্ধের পারফরম্যান্স একক প্রান্তিকের চেয়ে বেশ কয়েকটি মানের পছন্দের উপর নির্ভর করে তবে এটি এখনও covariates এর স্পেসে পরিবর্তিত হয়।
মাইকেল আর চেরনিক

উদাহরণস্বরূপ, লিনিয়ার এসভিএমগুলি পৃথক পৃথক হাইপারপ্লেনের উপর ভিত্তি করে যা নির্বাচিত সি মানের উপর নির্ভর করে (কম সি আরও প্রশিক্ষণের ত্রুটিগুলি সহ্য করে), সি মানগুলির একটি সেট থ্রেশহোল্ডগুলির সেট হতে পারে?
আবদেলহক মাহমুদী

হ্যাঁ এবং সি মানগুলি কি কোভেরিয়েটের লিনিয়ার সংমিশ্রণ নয়?
মাইকেল আর চেরনিক

2
হাইপারপ্লেন জটিলতা এবং প্রশিক্ষণের ত্রুটির মধ্যে বাণিজ্য-বন্ধকে নিয়ন্ত্রণ করতে সি হল পেনাল্টি ফ্যাক্টর। অন্য একটি বিকল্প হ'ল দ্বার হিসাবে পক্ষপাত বি এর ব্যবহার হতে পারে যেহেতু খ বৈশিষ্ট্যের স্থানের কেন্দ্র থেকে পৃথকীকরণের হাইপারপ্লেনের দূরত্ব। সুতরাং বি পরিবর্তিত বি হাইপারপ্লেনকে সরানোর মতো এবং এইভাবে আলাদা আলাদা টিপি এবং এফপি রাখার মতো! এটা আমার বোঝাপড়া!
আবদেলহক মাহমুদী
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.