শ্রেণিবিন্যাস এবং প্রতিরোধের সমন্বয়ে কি কোনও অ্যালগরিদম রয়েছে?


25

আমি ভাবছি যদি কোনও অ্যালগরিদম একই সাথে শ্রেণিবদ্ধকরণ এবং রিগ্রেশন করতে পারে। উদাহরণস্বরূপ, আমি অ্যালগরিদম একটি ক্লাসিফায়ার শিখতে দিন চাই, এবং একই সময়ে মধ্যে প্রতিটি লেবেল, এটি একটি ধারাবাহিক লক্ষ্য learns। সুতরাং, প্রতিটি প্রশিক্ষণের উদাহরণের জন্য এটির একটি শ্রেণিবদ্ধ লেবেল এবং একটি অবিচ্ছিন্ন মান রয়েছে।

আমি প্রথমে একজন শ্রেণিবদ্ধকে প্রশিক্ষণ দিতে পারি এবং তারপরে প্রতিটি লেবেলের মধ্যে একটি রেজিস্টারকে প্রশিক্ষণ দিতে পারি, তবে আমি কেবল ভাবছি যে যদি একটি অ্যালগরিদম থাকে যা উভয়ই করতে পারে তবে এটি দুর্দান্ত be



@ টিম, [সসীম-দৃ fi়তা-মডেল] (আপনি যে ট্যাগটি এখানে ব্যবহার করেছেন) এর কোনও উদ্ধৃতি নেই। একটি সরবরাহ যত্ন?
অ্যামিবা বলেছেন মনিকাকে

শুডং, আপনি কি "শ্রেণিবিন্যাস" বলতে চাইছেন বা আপনার অর্থ "ক্লাস্টারিং" হয়েছে? আপনি শ্রেণিবিন্যাস সম্পর্কে জিজ্ঞাসা করেছিলেন তবে টিম এর উত্তর গ্রহণ করেছেন যা ক্লাস্টারিং সম্পর্কে।
অ্যামিবা

@ অ্যামিবা শেষ হয়েছে, এটি কারওর পক্ষে নিখুঁত নয়, কোনও এককালের উদ্ধৃতি উন্নত হবে।
টিম

@ আমেবা মানে আমি শ্রেণিবিন্যাস করছি। টিমস উত্তরটি কাছাকাছি কিছু। অন্য কোন উত্তর নেই। আমার কিছুটা অপেক্ষা করা উচিত?
শুডং

উত্তর:


35

আপনি যে সমস্যাটির বর্ণনা দিচ্ছেন তা সুপ্ত শ্রেণীর রিগ্রেশন বা ক্লাস্টার- ওয়াইজ রিগ্রেশন দ্বারা সমাধান করা যেতে পারে , বা এটি সাধারণীকরণীয় লিনিয়ার মডেলগুলির এক্সটেনশন মিশ্রণ যা সীমাবদ্ধ মিশ্রণ মডেলগুলির বা বিচ্ছিন্ন শ্রেণির মডেলগুলির একটি বিস্তৃত পরিবারের সদস্য ।

এটি শ্রেণিবদ্ধকরণ (তদারকি করা শিক্ষণ) এবং প্রতি সেগুনের প্রতিরোধের সংমিশ্রণ নয় , বরং ক্লাস্টারিং (আনসারভিজড লার্নিং) এবং রিগ্রেশনের পরিবর্তে। বেসিক পদ্ধতির প্রসারিত করা যেতে পারে যাতে আপনি সহবর্তী ভেরিয়েবলগুলি ব্যবহার করে শ্রেণীর সদস্যতার পূর্বাভাস দিতে পারেন, এটি আপনাকে যা খুঁজছেন তার আরও নিকটতম করে তোলে। প্রকৃতপক্ষে, শ্রেণিবিন্যাসের জন্য সুপ্ত শ্রেণির মডেলগুলি ব্যবহার করার বিষয়টি ভারমুন্ট এবং ম্যাগিডসন (2003) দ্বারা বর্ণিত হয়েছিল যারা এই জাতীয় pালাইয়ের প্রস্তাব দিয়েছিলেন।

প্রচ্ছন্ন শ্রেণির প্রতিরোধ

এই পদ্ধতির মূলত একটি সীমাবদ্ধ মিশ্রণ মডেল (বা সুপ্ত শ্রেণীর বিশ্লেষণ ) আকারে

(Y|এক্স,ψ)=Σ=1কেπ(Y|এক্স,θ)

যেখানে সকল প্যারামিটার এবং একটি ভেক্টর হয় মিশ্রণ বস্তুগুলির দ্বারা parametrized হয় θ , এবং সুপ্ত অনুপাত সঙ্গে প্রতিটি উপাদানের প্রদর্শিত হয় π । সুতরাং ধারণাটি হ'ল আপনার ডেটা বন্টন হ'ল কে উপাদানগুলির মিশ্রণ , প্রতিটি যা একটি রিগ্রেশন মডেল দ্বারা বর্ণনা করা যেতে পারে f k সম্ভাব্যতা π কে দিয়ে উপস্থিত হয় । চূড়ান্ত মিশ্রণ মডেলগুলি কে এর পছন্দে খুব নমনীয়ψ=(π,θ)θπকেπ উপাদানগুলি এবং বিভিন্ন ফর্ম এবং বিভিন্ন শ্রেণীর মডেলগুলির মিশ্রণগুলিতে বাড়ানো যেতে পারে (উদাহরণস্বরূপ ফ্যাক্টর বিশ্লেষকের মিশ্রণ)।

সহবর্তী ভেরিয়েবলের উপর ভিত্তি করে শ্রেণি সদস্যতার সম্ভাবনার পূর্বাভাস

সাধারণ প্রচ্ছন্ন শ্রেণির রিগ্রেশন মডেলটিকে সহকারী পরিবর্তনশীলগুলি অন্তর্ভুক্ত করার জন্য বাড়ানো যেতে পারে যা শ্রেণীর সদস্যতার পূর্বাভাস দেয় (ডেটন এবং ম্যাকডিয়ার, 1998; আরও দেখুন: লিনজার এবং লুইস, ২০১১; গ্রুন এবং লেইচ, ২০০৮; ম্যাককচিয়ন, ১৯৮7; হাগেনারস এবং ম্যাকক্যাচিয়ন, ২০০৯) , এই ক্ষেত্রে মডেল হয়ে যায়

(Y|এক্স,W,ψ)=Σ=1কেπ(W,α)(Y|এক্স,θ)

ψWπ(W,α)

খুঁটিনাটি

এটি সম্পর্কে দুর্দান্ত কী, এটি হ'ল এটি একটি মডেল-ভিত্তিক ক্লাস্টারিং কৌশল, যার অর্থ আপনি আপনার ডেটাতে মডেলগুলি ফিট করেন এবং এই জাতীয় মডেলগুলিকে মডেল তুলনার জন্য বিভিন্ন পদ্ধতি ব্যবহার করে তুলনা করা যেতে পারে (সম্ভাবনা-অনুপাতের পরীক্ষা, বিআইসি, এআইসি ইত্যাদি) be ), সুতরাং চূড়ান্ত মডেলের পছন্দটি সাধারণভাবে ক্লাস্টার বিশ্লেষণের মতো বিষয়গত নয়। ক্লাস্টারিংয়ের দুটি স্বতন্ত্র সমস্যার মধ্যে সমস্যাটি ব্রেক করা এবং তারপরে রিগ্রেশন প্রয়োগ করা পক্ষপাতদুষ্ট ফলাফলের দিকে পরিচালিত করতে পারে এবং একক মডেলের মধ্যে থাকা সমস্ত কিছুর মূল্যায়ন আপনাকে আপনার ডেটা আরও দক্ষতার সাথে ব্যবহার করতে সক্ষম করে।

খারাপ দিকটি হ'ল আপনার মডেল সম্পর্কে আপনার অনেকগুলি অনুমান করা উচিত এবং এটি সম্পর্কে কিছুটা চিন্তাভাবনা করা উচিত, তাই এটি কোনও ব্ল্যাক-বাক্স পদ্ধতি নয় যা কেবল আপনাকে ডেটা নিয়ে নেবে এবং এ সম্পর্কে আপনাকে বিরক্ত না করেই কোনও ফলাফল ফিরিয়ে দেবে। কোলাহলপূর্ণ ডেটা এবং জটিল মডেলগুলির সাথে আপনার কাছে মডেল সনাক্তকরণের সমস্যাও থাকতে পারে। এছাড়াও যেহেতু এই জাতীয় মডেলগুলি জনপ্রিয় নয়, সেখানে ব্যাপকভাবে প্রয়োগ করা হয়নি (আপনি দুর্দান্ত আর প্যাকেজগুলি পরীক্ষা করতে পারেন flexmixএবং poLCAযতদূর আমি জানি এটি এসএএস এবং এমপ্লাসে কিছুটা হলেও প্রয়োগ করা হয়), কী আপনাকে সফ্টওয়্যার নির্ভর করে তোলে।

উদাহরণ

নীচে আপনি flexmixলাইব্রেরি থেকে এই জাতীয় মডেলের উদাহরণ দেখতে পাচ্ছেন (লেইচ, 2004; গ্রুন এবং লেইচ, ২০০৮) মেক-আপ ডেটাতে দুটি রিগ্রেশন মডেলের ভিগনেট ফিটিং মিশ্রণ।

library("flexmix")
data("NPreg")
m1 <- flexmix(yn ~ x + I(x^2), data = NPreg, k = 2)
summary(m1)
## 
## Call:
## flexmix(formula = yn ~ x + I(x^2), data = NPreg, k = 2)
## 
##        prior size post>0 ratio
## Comp.1 0.506  100    141 0.709
## Comp.2 0.494  100    145 0.690
## 
## 'log Lik.' -642.5452 (df=9)
## AIC: 1303.09   BIC: 1332.775 
parameters(m1, component = 1)
##                      Comp.1
## coef.(Intercept) 14.7171662
## coef.x            9.8458171
## coef.I(x^2)      -0.9682602
## sigma             3.4808332
parameters(m1, component = 2)
##                       Comp.2
## coef.(Intercept) -0.20910955
## coef.x            4.81646040
## coef.I(x^2)       0.03629501
## sigma             3.47505076

এটি নিম্নলিখিত প্লটগুলিতে ভিজ্যুয়ালাইজ করা হয়েছে (পয়েন্ট আকারগুলি সত্য শ্রেণি, রঙগুলি শ্রেণিবিন্যাস)।

সুপ্ত শ্রেণির প্রতিরোধের উদাহরণ

তথ্যসূত্র এবং অতিরিক্ত সংস্থান

আরও তথ্যের জন্য আপনি নিম্নলিখিত বই এবং কাগজপত্রগুলি পরীক্ষা করতে পারেন:

বিদেল, এম এবং ডিসরবো, ডাব্লুএস (1995)। জেনারাইজড লিনিয়ার মডেলগুলির জন্য একটি মিশ্রণ সম্ভাবনার পন্থা। শ্রেণিবিন্যাস জার্নাল, 12 , 21-55।

বিদেল, এম এবং কামাকুরা, ডাব্লুএ (2001)। বাজার বিভাজন - ধারণাগত এবং পদ্ধতিগত ভিত্তি। ক্লুওয়ার একাডেমিক পাবলিশার্স।

লিশ, এফ (2004)। ফ্লেক্সিমিক্স: স্ট্যাটিস্টিকাল সফটওয়্যার, জার্নাল জার্নালের 11 (8) , 1-18 এ সীমাবদ্ধ মিশ্রণ মডেল এবং সুপ্ত কাচের প্রতিরোধের জন্য একটি সাধারণ কাঠামো

গ্রুন, বি এবং লেশচ, এফ (২০০৮)। ফ্লেক্সমিক্স সংস্করণ 2: সমবর্তী ভেরিয়েবল এবং বিভিন্ন এবং ধ্রুবক পরামিতিগুলির সাথে সসীম মিশ্রণ। পরিসংখ্যান সফটওয়্যার জার্নাল, 28 (1) , 1-35।

ম্যাকলাচলান, জি। এবং পিল, ডি (2000)। সীমাবদ্ধ মিশ্রণ মডেল। জন উইলি অ্যান্ড সন্স

ডেটন, সিএম এবং ম্যাকডিয়ার, জিবি (1988)। একযোগে-পরিবর্তনশীল প্রচ্ছন্ন-শ্রেণীর মডেল। আমেরিকান পরিসংখ্যান সমিতির জার্নাল, 83 (401), 173-178।

লিনজার, ডিএ এবং লুইস, জেবি (২০১১)। পোলসিএএ: বহুভুজ পরিবর্তনশীল সুপ্ত শ্রেণীর বিশ্লেষণের জন্য একটি আর প্যাকেজ। পরিসংখ্যান সফটওয়্যার জার্নাল, 42 (10), 1-29।

ম্যাককচিয়ন, আ.লীগ (1987)। প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ। সাগে।

হাজেনার্স জেএ এবং ম্যাককচিয়ন, আ.লীগ (২০০৯)। ফলিত প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ। ক্যামব্রিজ ইউনিভার্সিটি প্রেস.

ভার্মান্ট, জে কে, এবং ম্যাগিডসন, জে। (2003) শ্রেণিবিন্যাসের জন্য প্রচ্ছন্ন শ্রেণির মডেল। গণনা সংক্রান্ত পরিসংখ্যান ও ডেটা বিশ্লেষণ, 41 (3), 531-537।

গ্রান, বি। এবং লেশচ, এফ (2007)। রিগ্রেশন মডেলগুলির সীমাবদ্ধ মিশ্রণের অ্যাপ্লিকেশন। ফ্লেক্সমিক্স প্যাকেজ ভিগনেট।

গ্রান, বি।, এবং লিশ, এফ। (2007) আর। গণনা সংক্রান্ত পরিসংখ্যান ও ডেটা বিশ্লেষণ, 51 (11), 5247-5252 এ সাধারণীকরণীয় রৈখিক রেগ্রেশনগুলির সীমাবদ্ধ মিশ্রণগুলি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.