বহু-জাতীয় লজিস্টিক রিগ্রেশন বনাম এক-বনাম-বিশ্রামের বাইনারি লজিস্টিক রিগ্রেশন


36

বলতে আমরা একটি নির্ভরশীল পরিবর্তনশীল যেতে পারেন কয়েক শ্রেণীর ও স্বাধীন ভেরিয়েবল সেট দিয়ে। Y

বাইনারি লজিস্টিক রিগ্রেশন (যেমন এক-বনাম-বাকী স্কিম ) সেট করে মাল্টিনোমিয়াল লজিস্টিক রিগ্রেশন সুবিধা কি ? বাইনারি লজিস্টিক রিগ্রেশন সেট করে আমি বলতে চাইছি যে প্রতিটি বিভাগ জন্য আমরা লক্ষ্য = 1 সহ পৃথক বাইনারি লজিস্টিক রিগ্রেশন মডেল তৈরি করি যখন এবং অন্যথায় 0।Y = y iyiYY=yi


3
গাণিতিকভাবে, একটি বহুজাতিক লজিট মডেল বাইনারি লগইট মডেলের একটি সেট, সবগুলি বেস বিকল্পের তুলনায়। তবে আপনি জেনেরিক প্যারামিটারগুলি ভেঙে পড়তে এবং সম্ভবত কিছু অন্যান্যকে একত্রিত করার কারণে এমএনএল সর্বদা কমপক্ষে দক্ষ হবে (এবং সম্ভবত আরও বেশি)। আমি কখনও সিরিজের দ্বিপদী মডেল ব্যবহার করার কোনও কারণ দেখতে পাচ্ছি না।
গ্রেগম্যাকফার্লেনে

2
@ জিএমএকফার্লেইন: আমি ডেটা সিমুলেট করার চেষ্টা করেছি যেখানে বাইনারি লজিস্টিক রিগ্রেশনগুলির ধারাবাহিকের চেয়ে এমএনএল আরও ভাল হবে, তবে প্রতিবারের গড় গুণমান একই ছিল। আমি লিফট চার্টের তুলনা করছিলাম এবং কয়েকটি সিমুলেশন থেকে ফলাফল গড়ার পরে তারা প্রায় একই দেখায়। এমএনএল বাইনারি লজিস্টিক রিগ্রেশনগুলিকে মারবে যাতে আপনার কীভাবে ডেটা তৈরি করা যায় তা সম্পর্কে একটি ধারণা থাকতে পারে? যদিও এমএনএলটির দুর্দান্ত সুবিধা ছিল, তবে এর স্কোরগুলি সম্ভাব্যতা হিসাবে ব্যাখ্যা করা যেতে পারে।
টোমেক তার্কিজেনস্কি

মাল্টিনোমিয়াল লজিস্টিক রিগ্রেশন হ'ল বাইনারি লজিট রিগ্রেশনকে বাড়ানো। যখন অধ্যয়নের নির্ভরশীল ভেরিয়েবলগুলি তিনটি বা তার বেশি হয় তখন এটি ব্যবহৃত হয়, যখন অধ্যয়নের নির্ভরশীল ভেরিয়েবল দুটি হয় তখন বাইনারি লগইট ব্যবহৃত হয়।

পাঠকের কাছে: আমি @ জুলিয়েতের উত্তরটি শুরু করার এবং টিটিএনএফএনএস পড়ার পরামর্শ দিচ্ছি। আমি মনে করি প্রাক্তন আরও সরাসরি মূল প্রশ্নের উত্তর দেয় তবে উত্তরটি কিছু আকর্ষণীয় প্রসঙ্গ যুক্ত করে। ttnphns এছাড়াও একটি জনপ্রিয় সফ্টওয়্যার রুটিনে উভয়ের জন্য উপলভ্য বিভিন্ন বৈশিষ্ট্যগুলি দেখায়, যা নিজেই অন্যগুলির মধ্যে একটির ব্যবহারের কারণ গঠন করতে পারে (গ্রেগম্যাকফার্লেনের বিবৃতি দেখুন)।
বেন ওগোরেক

উত্তর:


21

যদি এর দুটিরও বেশি বিভাগ থাকে তবে অন্যগুলির তুলনায় একটির বিরুদ্ধে "সুবিধা" সম্পর্কে আপনার প্রশ্নটি অর্থহীন হবে যদি আপনি মডেলগুলির পরামিতিগুলির তুলনা করতে চান তবে মডেলগুলি মৌলিকভাবে আলাদা হবে:Y

আমিlogP(i)P(not i)=logiti=linear combination প্রতিটি বাইনারি লজিস্টিক রিগ্রেশন এবংi

আমি r আমি RlogP(i)P(r)=logiti=linear combination প্রত্যেকের জন্য বিভাগ একাধিক লজিস্টিক প্রত্যাবৃত্তি, মনোনীত রেফারেন্স বিভাগ হচ্ছে ( )।irir

যাইহোক, যদি আপনার উদ্দেশ্যটি কেবলমাত্র প্রতিটি বিভাগের সম্ভাব্যতার পূর্বাভাস দেওয়া হয় তবে উভয়ই ন্যায্য, যদিও তারা বিভিন্ন সম্ভাবনার প্রাক্কলন দিতে পারে। সম্ভাব্যতা অনুমানের সূত্রটি জেনেরিক:i

i,j,,rrexp(l)ogit)=1P(iP(i)=exp(logiti)exp(logiti)+exp(logitj)++exp(logitr) , যেখানে সব বিভাগ, আর যদি এর রেফারেন্স হিসাবে বেছে নেওয়া হয় তবে এর । সুতরাং, বাইনারি লজিস্টিক জন্য একই সূত্র উঠবে যে, । বহুজাতিক লজিস্টিক অপ্রাসঙ্গিক বিকল্পের স্বাধীনতার ধারণা (সর্বদা বাস্তবসম্মত নয়) উপর নির্ভর করে যেখানে বাইনারি লজিস্টিক ভবিষ্যদ্বাণীগুলির একটি সিরিজ এটি করে না।i,j,,rrexp(logit)=1P(i)=exp(logiti)exp(logiti)+1


আলাদা আলাদা থিম কি ক্ষেত্রে MULTINOMIAL ও বাইনারি লজিস্টিক রিগ্রেশন মধ্যে প্রযুক্তিগত পার্থক্য আছে যখন হয় dichotomous । ফলাফলের মধ্যে কি কোনও পার্থক্য থাকবে? বেশিরভাগ সময় covariates এর অভাবে ফলাফল একই হবে, তবুও, অ্যালগরিদমে এবং আউটপুট বিকল্পগুলির মধ্যে পার্থক্য রয়েছে। আমাকে কেবল এসপিএসএস-এ এই সমস্যাটি সম্পর্কে এসপিএসএস সহায়তা উদ্ধৃত করুন:Y

বাইনারি লজিস্টিক রিগ্রেশন মডেলগুলি লজিস্টিক রিগ্রেশন পদ্ধতি বা বহুজাতিক লজিস্টিক রিগ্রেশন পদ্ধতি ব্যবহার করে লাগানো যেতে পারে। প্রতিটি পদ্ধতিতে অপরটিতে অপশন উপলব্ধ নেই। একটি তাত্ত্বিক তাত্ত্বিক পার্থক্য হ'ল লজিস্টিক রিগ্রেশন পদ্ধতিটি পৃথক কেস স্তরে ডেটা ব্যবহার করে সমস্ত পূর্বাভাস, অবশিষ্টাংশ, প্রভাবের পরিসংখ্যান এবং ধার্মিকতার উপযুক্ত পরীক্ষাগুলি উপস্থাপন করে, ডেটা কীভাবে প্রবেশ করা হয় এবং কোভারিয়েট প্যাটার্নের সংখ্যা নির্বিশেষে মোট মামলার সংখ্যার তুলনায় ছোট, যদিও বহুজাতিক লজিস্টিক রিগ্রেশন পদ্ধতি অভ্যন্তরীণভাবে ভবিষ্যদ্বাণীকারীদের জন্য অভিন্ন কোভারিয়েট নিদর্শনগুলির সাথে উপ-জনসংখ্যা গঠনের ক্ষেত্রে এই সংখ্যার উপজাতির উপর ভিত্তি করে ভবিষ্যদ্বাণী, অবশিষ্টাংশ এবং গুডনেস-ফিট-টেস্ট পরীক্ষাগুলি গঠন করে cases

লজিস্টিক রিগ্রেশন নিম্নলিখিত অনন্য বৈশিষ্ট্যগুলি সরবরাহ করে:

• মডেলটির জন্য হোস্টার-লেমশো মাপের ধার্মিকতার পরীক্ষা

• ধাপে ধাপে বিশ্লেষণ করে

Model মডেল প্যারামিটারাইজেশন সংজ্ঞায়িত করার বিপরীতে

Class শ্রেণিবিন্যাসের জন্য বিকল্প কাটা পয়েন্ট

• শ্রেণিবিন্যাস প্লট

• মামলার এক সেটে মডেল লাগানো মামলাগুলির একটি আউট-সেট মামলায়

Ic পূর্বাভাস, অবশিষ্টাংশ এবং প্রভাবের পরিসংখ্যান সংরক্ষণ করে

বহুজাতিক লজিস্টিক রিগ্রেশন নিম্নলিখিত অনন্য বৈশিষ্ট্যগুলি সরবরাহ করে:

• মডেলের ফিটনেসের জন্য পিয়ারসন এবং ডিভিয়েশন চি-স্কোয়ার পরীক্ষা

Good ধার্মিকতা-ফিট-পরীক্ষার জন্য ডেটা বিভাজনের জন্য উপ-জনসংখ্যা নির্দিষ্টকরণ

P উপ-জনসংখ্যা অনুসারে গণনা, পূর্বাভাস গণনা এবং অবশিষ্টাংশের তালিকাভুক্ত

Over অতিরিক্ত ছড়িয়ে পড়ার জন্য বৈকল্পিক অনুমানের সংশোধন

The প্যারামিটার অনুমানের কোভারিয়েন্স ম্যাট্রিক্স

Para পরামিতিগুলির রৈখিক সংমিশ্রণের পরীক্ষা

N নেস্টেড মডেলগুলির স্পষ্ট স্পেসিফিকেশন

Difference পার্থক্যযুক্ত ভেরিয়েবলগুলি ব্যবহার করে 1-1- এর সাথে শর্তযুক্ত লজিস্টিক রিগ্রেশন মডেলগুলির সাথে মেলে •


আমি জানি যে এই মডেলগুলি আলাদা হবে, তবে কোন পরিস্থিতিতে কোনটি ভাল তা আমি জানি না। আমি অন্যভাবে প্রশ্ন জিজ্ঞাসা করব। যদি আপনাকে কোনও কাজ দেওয়া হয়: প্রতিটি লোকের জন্য কোনও মোবাইল ফোন সংস্থাই প্রিয় একটি (সম্ভাব্য প্রত্যেকের কাছে প্রিয় মোবাইল ফোন সংস্থা রয়েছে বলে ধরে নেওয়া যায়) এমন সম্ভাবনাটি পূর্বাভাস দেয়। এই পদ্ধতিগুলির মধ্যে আপনি কোনটি ব্যবহার করবেন এবং দ্বিতীয়টি থেকে কী কী সুবিধা রয়েছে?
টোমেক তার্কিজেনস্কি

@ টমেক আমি আমার উত্তরটি কিছুটা বাড়িয়েছি
ttnphns

যদিও আমি মনে করি @ জুলাইথ হ'ল ওপির মূল প্রশ্নের সেরা উত্তর, তবে অপ্রাসঙ্গিক বিকল্প ধারনা স্বাধীনতার পরিচয় করিয়ে দেওয়ার জন্য আমি আপনার কাছে owণী। আমার একটি প্রশ্ন এখনও আছে যে পৃথক রসদ সত্যই এর আশেপাশে আসে কিনা; উইকিপিডিয়া নিবন্ধটি আপনি উল্লিখিত প্রবিকে এবং "নেস্টেড লজিট" এর সাথে যুক্ত করেছেন যা আইআইএ লঙ্ঘনের অনুমতি দিয়েছে
বেন ওগোরেক

আপনি কীভাবে মডেলগুলিকে রেফারেন্স বিভাগের পছন্দ সহ ফিট করতে পারেন তা ব্যাখ্যা করতে সক্ষম হবেন? বিভাগের জন্য , আমরা কেবলমাত্র ডেটাগুলির একটি উপসেট ব্যবহার করব যা হয় হয় রেফারেন্স ক্যাটাগরিতে বা বিভাগে , ? r i i ririir
ব্যবহারকারী 21359 21

13

শিরোনামের কারণে, আমি ধরে নিচ্ছি যে "একাধিক লজিস্টিক রিগ্রেশন সুবিধা" এর অর্থ "বহুজাতিক রিগ্রেশন"। মডেল একসাথে ফিট হলে প্রায়শই সুবিধা রয়েছে। এই নির্দিষ্ট পরিস্থিতিটি অ্যাগ্র্রেস্টি (শ্রেণীবদ্ধ ডেটা অ্যানালাইসিস, 2002) পৃষ্ঠাগুলিতে বর্ণিত হয়েছে। সংক্ষেপে (অ্যাগ্রেস্টি প্যারাফ্রেসিং) আপনি একটি যৌথ মডেল থেকে অনুমানগুলি একটি স্তরিত মডেলের চেয়ে আলাদা বলে আশা করছেন। পৃথক লজিস্টিক মডেলগুলির বৃহত্তর স্ট্যান্ডার্ড ত্রুটি থাকতে থাকে যদিও ফলাফলটির সর্বাধিক ঘন স্তরটি রেফারেন্স স্তর হিসাবে সেট করা হলে এটি এতটা খারাপ নাও হতে পারে।


ধন্যবাদ! আমি এই বই খুঁজে পেতে চেষ্টা করবে, unfortunatelly google.books শুধুমাত্র পৃষ্ঠার 268. পর্যন্ত বিষয়বস্তু প্রদান করে
Tomek Tarczynski

@ টোমেকটারজাইস্কি আমি অনুচ্ছেদ থেকে প্রাসঙ্গিক তথ্য সংক্ষিপ্ত করেছি, সুতরাং আপনি বইটি দেখে এই প্রশ্নের সাথে সম্পর্কিত আরও কোনও তথ্য পেতে পারেন না (যদিও বইটি দুর্দান্ত তাই আপনি অন্যান্য ভাল তথ্য পাবেন)।
জুলাইথ

4
আগ্রেস্তি বইয়ের উদ্ধৃতি: "পৃথক-ফিটিংয়ের অনুমানগুলি জে -1 লগিজের একযোগে ফিট করার জন্য এমএল অনুমানের থেকে পৃথক। তারা আরও দক্ষ, বৃহত্তর স্ট্যান্ডার্ড ত্রুটি থাকার প্রবণতা। যখন প্রতিক্রিয়া বিভাগটি সর্বাধিক প্রসারিত হয় তখন বেসিক হয় "
ফ্রাঙ্ক ডারননকোর্ট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.