0 এবং 1 এর মধ্যে সীমাতে ফলাফলের জন্য লজিস্টিক রিগ্রেশন প্রসারিত করা


9

আমার একটি রিগ্রেশন সমস্যা রয়েছে যেখানে ফলাফলগুলি কঠোরভাবে 0, 1 নয় বরং 0 থেকে 1 পর্যন্ত সমস্ত আসল সংখ্যার মধ্যে রয়েছে Y=[0,0.12,0.31,...,1]

এই প্রশ্নটি ইতিমধ্যে এই থ্রেডে আলোচনা করা হয়েছে , যদিও আমার প্রশ্নটি কিছুটা আলাদা।

লজিস্টিক রিগ্রেশন সাধারণত ব্যবহৃত হয় একই কারণে আমি লিনিয়ার রিগ্রেশন ব্যবহার করতে পারি না। লিনিয়ার রিগ্রেশন এ) খুব বড় আইভিএসের মানগুলি পূর্বাভাসিত ফলাফলটিকে 1 এবং B এ ছুঁড়ে দেয়) লিনিয়ার রিগ্রেশনটির ফলাফল 0,1 সীমাতে আবদ্ধ হয় না।

আমার পাঠ্যপুস্তক থেকে এই লজিস্টিক ব্যয় ফাংশনটি খুঁজছি

Cost=ylog(h(x))(1y)log(1h(x))
আমি সংগ্রহ করেছি যে সমীকরণটি কেবল তখনই 0 এর চেয়ে বেশি ব্যয় গণনা করার জন্য ডিজাইন করা হয়েছে yএবং মান 0 বা 1 এর সমান নয়।x

সমস্ত অনুমানের ত্রুটিগুলি পরিমাপ করতে ব্যয় ফাংশনটি সংশোধন করে লজিস্টিক রিগ্রেশন ব্যবহার করা কি সম্ভব হবে?

উত্তর:


9

আপনার কাছে বেশ কয়েকটি বিকল্প রয়েছে। তাদের মধ্যে দুটি হতে পারে:

  1. আপনি যদি আপনার রূপান্তর Y মাধ্যমে log(y1y) লজিস্টিক রূপান্তর আপনি সেই সর্বনিম্ন স্কোয়ারের মাধ্যমে সেই রূপান্তরিত প্রতিক্রিয়ার ভেরিয়েবলের ক্ষেত্রে লিনিয়ার রিগ্রেশনকে ফিট করার চেষ্টা করতে পারেন।
  2. বিকল্পভাবে, আপনি মূল লিঙ্কটিকে আপনার লিংক ভেরিয়েবল হিসাবে লজিস্টিক ট্রান্সফর্মের সাথে সাধারণ রৈখিক মডেলের সাথে ফিট করতে পারেন এবং এর মধ্যে সম্পর্কের সাথে Yএর বৈকল্পিক এবং এর অর্থ একই হিসাবে এটি দ্বি-দ্বিস্থ পরিবর্তনশীল, পুনরাবৃত্তি হওয়া ন্যূনতম স্কোয়ার দ্বারা ফিটিং। এটি মূলত "লজিস্টিক রিগ্রেশন ব্যবহার করা" এর সমান।

কোনটি ব্যবহার করা হবে তা ত্রুটির কাঠামোর উপর নির্ভর করবে এবং সিদ্ধান্ত নেওয়ার একমাত্র উপায় হ'ল উভয়কেই ফিট করতে হবে এবং কোনটির মধ্যে একটির অবশিষ্টাংশ রয়েছে যা মডেলের অনুমানগুলি সবচেয়ে ভাল ফিট করে best আমার সন্দেহ এই যে তাদের মধ্যে পছন্দ করার মতো খুব বেশি কিছু থাকবে না। অবশ্যই, অপরিবর্তিতদের সাথে স্ট্রেট লিনিয়ার রিগ্রেশনটিতে এই বিকল্পগুলির মধ্যে একটি বড় উন্নতি হবেY, আপনি যে কারণে বলছেন for


2
(+1) বিকল্প 2: সাধারণত আপনি তখন অতি-ছড়িয়ে পড়ার প্রাক্কলন করতে পারেন এবং স্ট্যান্ডার্ড ত্রুটিগুলি গণনা করতে এটি ব্যবহার করবেন - একটি "আধা-দ্বিপদী" মডেল যেখানে ওয়াইয়ের বৈকল্পিক এবং গড়ের মধ্যকার সম্পর্কটি সমানুপাতিক না হয়ে তার চেয়ে সমানুপাতিক একটি দ্বিপদী পরিবর্তনশীল।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

@ স্কার্টচি: glm()ক্রমাগত প্রতিক্রিয়া দেওয়া হয় এবং এটির কি আর ফাংশনটি করছে family=quasibinomial? অর্থাত্ এটি family=binomialএকটি অতিরিক্ত পদক্ষেপের সাথে সহগের সাথে অনুমানকারীদের অনুমান করবে এবং অতিরিক্ত বিতরণকে বিবেচনায় নেওয়ার ক্ষেত্রে মানক ত্রুটিগুলি গণনা করবে? যদি হ্যাঁ, তবে এটি "শক্তিশালী স্ট্যান্ডার্ড ত্রুটিগুলি" গণনার মতো? আমার কিছু উপযুক্ত তথ্য আছে এবং আমি উভয় পরিবারকে দিয়ে চেষ্টা করেছি glm; আমি অভিন্ন গুণফল পাই তবে স্ট্যান্ডার্ড ত্রুটিগুলি পৃথক করে থাকি। ধন্যবাদ।
অ্যামিবা

1
@ অ্যামিবা: হ্যাঁ এটাই তবে "শক্তসমর্থ স্ট্যান্ডার্ড ত্রুটিগুলি" এর অর্থ সাধারণত একটি স্যান্ডউইচ অনুমানকারী বা এর মতো ব্যবহার করা হয়।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

9

যখন ওয়াই আবদ্ধ হয়, বিটা-রিগ্রেশন প্রায়শই অর্থবোধ করে; "একটি ভাল লেবু স্কুজার" কাগজটি দেখুন

এটি মেঝে এবং সিলিং প্রভাবগুলির জন্য অনুমতি দেয়; এটি ভিন্নতার পাশাপাশি গড়ের মডেলিংয়ের অনুমতি দেয় allows


0

যেহেতু y কঠোরভাবে শূন্য নয় বা এক (যেমন আপনি বলেছেন) ব্যয়টি সর্বদা শূন্যের চেয়ে বেশি হওয়া উচিত। সুতরাং, আমি মনে করি না আপনি মডেল পরিবর্তন প্রয়োজন।


0

আমি দুটি বিকল্প মডেল প্রস্তাব:

যদি আপনার ফলাফল (y ভেরিয়েবল) অর্ডার করা হয় তবে অর্ডার করা প্রবিট মডেলটি চেষ্টা করুন।

যদি আপনার ফলাফল (y ভেরিয়েবল) অর্ডার না করা হয় তবে বহুজাতিক লগিট মডেলটি চেষ্টা করুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.