প্লাটের স্কেলিং কেন ব্যবহার করবেন?


17

তত্ত্বাবধানে পড়াশোনার সম্ভাব্যতায় আত্মবিশ্বাসের স্তরটি ক্যালব্রেট করার জন্য (কোনও এসভিএম বা সিদ্ধান্তের গাছের ওভারস্প্যাম্পলড ডেটা ব্যবহার করে আত্মবিশ্বাসের মানচিত্রের জন্য বলুন) একটি পদ্ধতি হ'ল প্লাটের স্কেলিং (উদাহরণস্বরূপ, বুস্টিংয়ের কাছ থেকে ক্যালিব্রেটেড সম্ভাব্যতা অর্জন ) use

মূলত একজন মানচিত্রে লজিস্টিক রিগ্রেশন ব্যবহার করে থেকে [ 0 ; 1 ] । নির্ভরশীল পরিবর্তনশীল হ'ল সত্য লেবেল এবং ভবিষ্যদ্বাণীকারী আনসিলিবিটেড মডেল থেকে আত্মবিশ্বাস। আমি যা বুঝতে পারি না তা 1 বা 0 ব্যতীত টার্গেট ভেরিয়েবলের ব্যবহার The পদ্ধতিটি একটি নতুন "লেবেল" তৈরি করার জন্য আহ্বান জানিয়েছে:[-;][0;1]

সিগময়েড ট্রেনের সেটটিতে অতিমাত্রায় এড়াতে, একটি নমুনা ছাড়াই মডেল ব্যবহার করা হয়। থাকে তাহলে ইতিবাচক উদাহরণ এবং এন - ট্রেন সেট ঋণাত্মক উদাহরণ, প্রতিটি প্রশিক্ষণ উদাহরণস্বরূপ প্ল্যাট ক্রমাঙ্কন লক্ষ্য মান ব্যবহার Y + + এবং Y - (পরিবর্তে 1 এবং 0, যথাক্রমে), যেখানে Y + + = এন + + + + 1এন+ +Ny+y-

y+=N++1N++2;y=1N+2

আমি যা বুঝতে পারি না তা হল এই নতুন টার্গেটটি কীভাবে কার্যকর। লজিস্টিক রিগ্রেশন কি কেবল নির্ভরশীল পরিবর্তনশীলটিকে বাইনারি লেবেল হিসাবে বিবেচনা করবে না (কোন লেবেল দেওয়া হোক না কেন)

হালনাগাদ:

আমি দেখেছি এসএএস থেকে নির্ভরশীল পরিবর্তন যে অন্য কিছু একই মডেল (ব্যবহারে ফিরে প্রত্যাবর্তন করতে )। সম্ভবত আমার ত্রুটি বা সম্ভবত এসএএসের বহুমুখিতাটির অভাব। আমি আর-তে মডেলটি পরিবর্তন করতে সক্ষম হয়েছি উদাহরণ হিসাবে:1/0PROC GENMOD

data(ToothGrowth) 
attach(ToothGrowth) 

  # 1/0 coding 
dep          <- ifelse(supp == "VC", 1, 0) 
OneZeroModel <- glm(dep~len, family=binomial) 
OneZeroModel 
predict(OneZeroModel) 

  # Platt coding 
dep2           <- ifelse(supp == "VC", 31/32, 1/32) 
plattCodeModel <- glm(dep2~len, family=binomial) 
plattCodeModel 
predict(plattCodeModel) 

compare        <- cbind(predict(OneZeroModel), predict(plattCodeModel)) 

plot(predict(OneZeroModel), predict(plattCodeModel))

উত্তর:


13

আমি লজিস্টিক রিগ্রেশন এর উইকিপিডিয়া পৃষ্ঠাটি পরীক্ষা করার পরামর্শ দিই । এটিতে বলা হয়েছে যে বাইনারি নির্ভরশীল পরিবর্তনশীল লজিস্টিক রিগ্রেশন ক্ষেত্রে ভবিষ্যদ্বাণীকারীদের উপর নির্ভরশীল ভেরিয়েবলের ঘটনার সম্ভাবনা তৈরি করে। কোনও রূপান্তর ছাড়াই, মডেলটিকে প্রশিক্ষণের জন্য ব্যবহৃত সম্ভাবনাটি হয় হয় 1 (যদি প্রশিক্ষণ সংস্থায় y ইতিবাচক হয়) বা 0 (যদি y নেতিবাচক হয়)।

সুতরাং: ফিটিং করার সময় ধনাত্মক শ্রেণীর জন্য পরম মান 1 এবং নেতিবাচক শ্রেণীর 0 ব্যবহার করার পরিবর্তেপিআমি=1(1+ +এক্সপি(একজন*আমি+ +বি))আমিY+ +Y-শূন্য হয়ে যাবে। বিস্তারিত জানার জন্য, প্লাটের মূল কাগজটি দেখুন ।


উত্তরের জন্য ধন্যবাদ! আমি প্রথমে এসএএস ব্যবহার করছিলাম এবং কোনও ভিন্ন প্রতিক্রিয়া ভেরিয়েবলটি পেলাম না। আমি আর এর নিচের উদাহরণগুলিতে একটি উদাহরণ হিসাবে ফিট করেছি এবং দেখতে পাচ্ছি যে একটি পূর্ণসংখ্যা পুনরায় পরিবর্তনশীল না হওয়ার বিষয়ে একটি সতর্কতা জারি করা হয়েছে তবে ফলাফলটি ভিন্ন মডেলের সাথে খাপ খায় না।
বি_মিনার

ডেটা (টুথগ্রোথ) সংযুক্ত করুন (টুথ গ্রোথ) # 1/0 কোডিং ডিপ <-ফিল্ম (সাপ == "ভিসি", 1,0) ওয়ানজিরোমডেল <-glm (ডিপ ~ লেন, পরিবার = দ্বিপদী) ওয়ানজিরোমডেল পূর্বাভাস (ওয়ানজিরোমডেল) # প্লাট কোডিং Dep2 <-ifelse (supp == "VC", 31/32, 1/32) প্ল্যাটকোডমোডেল <-glm (Dep2 n লেন, পরিবার = দ্বিপদী) প্ল্যাটকোডমোডেল পূর্বাভাস (প্ল্যাটকোডমোডেল) <<ccind (পূর্বাভাস (ওয়ানজিরো মডেল), পূর্বাভাস ( প্ল্যাটকোডমোডেল)) প্লট (পূর্বাভাস (ওয়ানজিরো মডেল), পূর্বাভাস (প্ল্যাটকোডমোডেল))
বি_মিনার

@ ইউজার ২০৪০: ১. হ্যাঁ ... একটি প্রশ্ন আছে বা এটি কি কেবল একটি মন্তব্য :)? ২. আপনি কেন প্রশ্নটিতে কোড যুক্ত করবেন না? কোনও বিন্যাসই ভয়াবহ নয়।
8-10 এ স্টিফেন

2

ওভার-ফিটিং এড়ানোর আরেকটি পদ্ধতি যা আমি দরকারী বলে খুঁজে পেয়েছি তা হল এসভিএমের লিভ-আউট-আউট ক্রস-বৈধতা আউটপুটে ইউনিভারিটিটি লজিস্টিক রিগ্রেশন মডেলটি ফিট করা, যা স্প্যান বাউন্ডটি ব্যবহার করে দক্ষতার সাথে প্রায় কাছাকাছি করা যায় ।

তবে, আপনি যদি শ্রেণিবদ্ধ চান যা শ্রেণীর সদস্যতার সম্ভাবনার প্রাক্কলন তৈরি করে, তবে আপনি কার্নেল লজিস্টিক রিগ্রেশন ব্যবহার করা ভাল, যার লক্ষ্য এটি সরাসরি করা। এসভিএম এর আউটপুটটি পৃথক শ্রেণিবিন্যাসের জন্য ডিজাইন করা হয়েছে এবং সম্ভবত পি = 0.5 কনট্যুর থেকে দূরে সম্ভাবনার সঠিক অনুমানের জন্য প্রয়োজনীয় তথ্য ধারণ করে না।

যদি আপনি কার্নেল ভিত্তিক সম্ভাব্য শ্রেণিবদ্ধ চান তবে গাউসীয় প্রক্রিয়া শ্রেণিবদ্ধকারীগুলি আরেকটি ভাল বিকল্প।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.