আপনি যে সমস্যাটির বর্ণনা দিচ্ছেন তা সুপ্ত শ্রেণীর রিগ্রেশন বা ক্লাস্টার- ওয়াইজ রিগ্রেশন দ্বারা সমাধান করা যেতে পারে , বা এটি সাধারণীকরণীয় লিনিয়ার মডেলগুলির এক্সটেনশন মিশ্রণ যা সীমাবদ্ধ মিশ্রণ মডেলগুলির বা বিচ্ছিন্ন শ্রেণির মডেলগুলির একটি বিস্তৃত পরিবারের সদস্য ।
এটি শ্রেণিবদ্ধকরণ (তদারকি করা শিক্ষণ) এবং প্রতি সেগুনের প্রতিরোধের সংমিশ্রণ নয় , বরং ক্লাস্টারিং (আনসারভিজড লার্নিং) এবং রিগ্রেশনের পরিবর্তে। বেসিক পদ্ধতির প্রসারিত করা যেতে পারে যাতে আপনি সহবর্তী ভেরিয়েবলগুলি ব্যবহার করে শ্রেণীর সদস্যতার পূর্বাভাস দিতে পারেন, এটি আপনাকে যা খুঁজছেন তার আরও নিকটতম করে তোলে। প্রকৃতপক্ষে, শ্রেণিবিন্যাসের জন্য সুপ্ত শ্রেণির মডেলগুলি ব্যবহার করার বিষয়টি ভারমুন্ট এবং ম্যাগিডসন (2003) দ্বারা বর্ণিত হয়েছিল যারা এই জাতীয় pালাইয়ের প্রস্তাব দিয়েছিলেন।
প্রচ্ছন্ন শ্রেণির প্রতিরোধ
এই পদ্ধতির মূলত একটি সীমাবদ্ধ মিশ্রণ মডেল (বা সুপ্ত শ্রেণীর বিশ্লেষণ ) আকারে
চ( y)∣ x , ψ ) = ∑ ∑কে = 1কেπটচট( y)| এক্স , θট)
যেখানে সকল প্যারামিটার এবং একটি ভেক্টর হয় চ ট মিশ্রণ বস্তুগুলির দ্বারা parametrized হয় θ ট , এবং সুপ্ত অনুপাত সঙ্গে প্রতিটি উপাদানের প্রদর্শিত হয় π ট । সুতরাং ধারণাটি হ'ল আপনার ডেটা বন্টন হ'ল কে উপাদানগুলির মিশ্রণ , প্রতিটি যা একটি রিগ্রেশন মডেল দ্বারা বর্ণনা করা যেতে পারে f k সম্ভাব্যতা π কে দিয়ে উপস্থিত হয় । চূড়ান্ত মিশ্রণ মডেলগুলি চ কে এর পছন্দে খুব নমনীয়ψ = ( π , ϑ )চটθটπটকেচটπটচট উপাদানগুলি এবং বিভিন্ন ফর্ম এবং বিভিন্ন শ্রেণীর মডেলগুলির মিশ্রণগুলিতে বাড়ানো যেতে পারে (উদাহরণস্বরূপ ফ্যাক্টর বিশ্লেষকের মিশ্রণ)।
সহবর্তী ভেরিয়েবলের উপর ভিত্তি করে শ্রেণি সদস্যতার সম্ভাবনার পূর্বাভাস
সাধারণ প্রচ্ছন্ন শ্রেণির রিগ্রেশন মডেলটিকে সহকারী পরিবর্তনশীলগুলি অন্তর্ভুক্ত করার জন্য বাড়ানো যেতে পারে যা শ্রেণীর সদস্যতার পূর্বাভাস দেয় (ডেটন এবং ম্যাকডিয়ার, 1998; আরও দেখুন: লিনজার এবং লুইস, ২০১১; গ্রুন এবং লেইচ, ২০০৮; ম্যাককচিয়ন, ১৯৮7; হাগেনারস এবং ম্যাকক্যাচিয়ন, ২০০৯) , এই ক্ষেত্রে মডেল হয়ে যায়
চ( y)∣ x , w , ψ ) = ∑ ∑কে = 1কেπট( ডাব্লু , α )চট( y)| এক্স , θট)
ψWπট( ডাব্লু , α )
খুঁটিনাটি
এটি সম্পর্কে দুর্দান্ত কী, এটি হ'ল এটি একটি মডেল-ভিত্তিক ক্লাস্টারিং কৌশল, যার অর্থ আপনি আপনার ডেটাতে মডেলগুলি ফিট করেন এবং এই জাতীয় মডেলগুলিকে মডেল তুলনার জন্য বিভিন্ন পদ্ধতি ব্যবহার করে তুলনা করা যেতে পারে (সম্ভাবনা-অনুপাতের পরীক্ষা, বিআইসি, এআইসি ইত্যাদি) be ), সুতরাং চূড়ান্ত মডেলের পছন্দটি সাধারণভাবে ক্লাস্টার বিশ্লেষণের মতো বিষয়গত নয়। ক্লাস্টারিংয়ের দুটি স্বতন্ত্র সমস্যার মধ্যে সমস্যাটি ব্রেক করা এবং তারপরে রিগ্রেশন প্রয়োগ করা পক্ষপাতদুষ্ট ফলাফলের দিকে পরিচালিত করতে পারে এবং একক মডেলের মধ্যে থাকা সমস্ত কিছুর মূল্যায়ন আপনাকে আপনার ডেটা আরও দক্ষতার সাথে ব্যবহার করতে সক্ষম করে।
খারাপ দিকটি হ'ল আপনার মডেল সম্পর্কে আপনার অনেকগুলি অনুমান করা উচিত এবং এটি সম্পর্কে কিছুটা চিন্তাভাবনা করা উচিত, তাই এটি কোনও ব্ল্যাক-বাক্স পদ্ধতি নয় যা কেবল আপনাকে ডেটা নিয়ে নেবে এবং এ সম্পর্কে আপনাকে বিরক্ত না করেই কোনও ফলাফল ফিরিয়ে দেবে। কোলাহলপূর্ণ ডেটা এবং জটিল মডেলগুলির সাথে আপনার কাছে মডেল সনাক্তকরণের সমস্যাও থাকতে পারে। এছাড়াও যেহেতু এই জাতীয় মডেলগুলি জনপ্রিয় নয়, সেখানে ব্যাপকভাবে প্রয়োগ করা হয়নি (আপনি দুর্দান্ত আর প্যাকেজগুলি পরীক্ষা করতে পারেন flexmix
এবং poLCA
যতদূর আমি জানি এটি এসএএস এবং এমপ্লাসে কিছুটা হলেও প্রয়োগ করা হয়), কী আপনাকে সফ্টওয়্যার নির্ভর করে তোলে।
উদাহরণ
নীচে আপনি flexmix
লাইব্রেরি থেকে এই জাতীয় মডেলের উদাহরণ দেখতে পাচ্ছেন (লেইচ, 2004; গ্রুন এবং লেইচ, ২০০৮) মেক-আপ ডেটাতে দুটি রিগ্রেশন মডেলের ভিগনেট ফিটিং মিশ্রণ।
library("flexmix")
data("NPreg")
m1 <- flexmix(yn ~ x + I(x^2), data = NPreg, k = 2)
summary(m1)
##
## Call:
## flexmix(formula = yn ~ x + I(x^2), data = NPreg, k = 2)
##
## prior size post>0 ratio
## Comp.1 0.506 100 141 0.709
## Comp.2 0.494 100 145 0.690
##
## 'log Lik.' -642.5452 (df=9)
## AIC: 1303.09 BIC: 1332.775
parameters(m1, component = 1)
## Comp.1
## coef.(Intercept) 14.7171662
## coef.x 9.8458171
## coef.I(x^2) -0.9682602
## sigma 3.4808332
parameters(m1, component = 2)
## Comp.2
## coef.(Intercept) -0.20910955
## coef.x 4.81646040
## coef.I(x^2) 0.03629501
## sigma 3.47505076
এটি নিম্নলিখিত প্লটগুলিতে ভিজ্যুয়ালাইজ করা হয়েছে (পয়েন্ট আকারগুলি সত্য শ্রেণি, রঙগুলি শ্রেণিবিন্যাস)।
তথ্যসূত্র এবং অতিরিক্ত সংস্থান
আরও তথ্যের জন্য আপনি নিম্নলিখিত বই এবং কাগজপত্রগুলি পরীক্ষা করতে পারেন:
বিদেল, এম এবং ডিসরবো, ডাব্লুএস (1995)। জেনারাইজড লিনিয়ার মডেলগুলির জন্য একটি মিশ্রণ সম্ভাবনার পন্থা। শ্রেণিবিন্যাস জার্নাল, 12 , 21-55।
বিদেল, এম এবং কামাকুরা, ডাব্লুএ (2001)। বাজার বিভাজন - ধারণাগত এবং পদ্ধতিগত ভিত্তি। ক্লুওয়ার একাডেমিক পাবলিশার্স।
লিশ, এফ (2004)। ফ্লেক্সিমিক্স: স্ট্যাটিস্টিকাল সফটওয়্যার, জার্নাল জার্নালের 11 (8) , 1-18 এ সীমাবদ্ধ মিশ্রণ মডেল এবং সুপ্ত কাচের প্রতিরোধের জন্য একটি সাধারণ কাঠামো ।
গ্রুন, বি এবং লেশচ, এফ (২০০৮)। ফ্লেক্সমিক্স সংস্করণ 2: সমবর্তী ভেরিয়েবল এবং বিভিন্ন এবং ধ্রুবক পরামিতিগুলির সাথে সসীম মিশ্রণ।
পরিসংখ্যান সফটওয়্যার জার্নাল, 28 (1) , 1-35।
ম্যাকলাচলান, জি। এবং পিল, ডি (2000)। সীমাবদ্ধ মিশ্রণ মডেল। জন উইলি অ্যান্ড সন্স
ডেটন, সিএম এবং ম্যাকডিয়ার, জিবি (1988)। একযোগে-পরিবর্তনশীল প্রচ্ছন্ন-শ্রেণীর মডেল। আমেরিকান পরিসংখ্যান সমিতির জার্নাল, 83 (401), 173-178।
লিনজার, ডিএ এবং লুইস, জেবি (২০১১)। পোলসিএএ: বহুভুজ পরিবর্তনশীল সুপ্ত শ্রেণীর বিশ্লেষণের জন্য একটি আর প্যাকেজ। পরিসংখ্যান সফটওয়্যার জার্নাল, 42 (10), 1-29।
ম্যাককচিয়ন, আ.লীগ (1987)। প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ। সাগে।
হাজেনার্স জেএ এবং ম্যাককচিয়ন, আ.লীগ (২০০৯)। ফলিত প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ। ক্যামব্রিজ ইউনিভার্সিটি প্রেস.
ভার্মান্ট, জে কে, এবং ম্যাগিডসন, জে। (2003) শ্রেণিবিন্যাসের জন্য প্রচ্ছন্ন শ্রেণির মডেল। গণনা সংক্রান্ত পরিসংখ্যান ও ডেটা বিশ্লেষণ, 41 (3), 531-537।
গ্রান, বি। এবং লেশচ, এফ (2007)। রিগ্রেশন মডেলগুলির সীমাবদ্ধ মিশ্রণের অ্যাপ্লিকেশন। ফ্লেক্সমিক্স প্যাকেজ ভিগনেট।
গ্রান, বি।, এবং লিশ, এফ। (2007) আর। গণনা সংক্রান্ত পরিসংখ্যান ও ডেটা বিশ্লেষণ, 51 (11), 5247-5252 এ সাধারণীকরণীয় রৈখিক রেগ্রেশনগুলির সীমাবদ্ধ মিশ্রণগুলি।