পয়সন রিগ্রেশন বনাম লগ-গণনা সর্বনিম্ন-স্কোয়ার রিগ্রেশন?


21

লগ-লিঙ্ক ফাংশন সহ একটি পয়সন রিগ্রেশন একটি জিএলএম

সাধারণভাবে বিতরণ করা গণনা উপাত্তকে মডেল করার বিকল্প উপায় হ'ল লগ (বা বরং, 0 এর পরিচালনা করতে লগ (1 + গণনা) গ্রহণ করে প্রিপ্রোসেস করা। লগ-কাউন্টের প্রতিক্রিয়াগুলিতে আপনি যদি সর্বনিম্ন-স্কোয়ারের রিগ্রেশন করেন তবে তা কি পইসন রিগ্রেশন সম্পর্কিত? এটি কি একইরকম ঘটনা পরিচালনা করতে পারে?


6
শূন্য যে কোনও সংখ্যা গণনা করার জন্য আপনি কীভাবে পরিকল্পনা করবেন?
whuber

3
অবশ্যই সমতুল্য নয়। এটি দেখার একটি সহজ উপায় হ'ল আপনি যদি শূন্য সংখ্যা গণনা করেন তবে কী ঘটবে তা দেখুন at (@ হুইবারের মন্তব্য দেখার আগে মন্তব্য তৈরি হয়েছিল App দৃশ্যত এই পৃষ্ঠাটি আমার ব্রাউজারে যথাযথভাবে রিফ্রেশ হয়নি))
কার্ডিনাল

ঠিক আছে, আমার স্পষ্টতই বলা উচিত, লগ (1 + গণনা)। স্পষ্টতই সমতুল্য নয়, তবে ভাবছেন যে কোনও সম্পর্ক ছিল কিনা, বা যদি তারা একইরকম ঘটনা পরিচালনা করতে পারে।
ব্রেন্ডন ওকননর

1
এখানে এই সমস্যা সম্পর্কে দরকারী আলোচনা রয়েছে: blog.stata.com/2011/08/22/…
মাইকেল বিশপ

উত্তর:


22

একদিকে, পোইসন রিগ্রেশনে, মডেল সমীকরণের বাম দিকটি হ'ল প্রত্যাশিত গণনার লগারিদম: ।log(E[Y|x])

অন্যদিকে, একটি "স্ট্যান্ডার্ড" লিনিয়ার মডেলটিতে, বাম-হাতের দিকটি সাধারণ প্রতিক্রিয়ার পরিবর্তনশীলটির প্রত্যাশিত মান: । বিশেষত, লিঙ্ক ফাংশন হ'ল পরিচয় ফাংশন।E[Y|x]

এখন, আসুন আমরা বলি যে হ'ল একটি পয়েসন ভেরিয়েবল এবং আপনি লগটি লাগিয়ে এটিকে স্বাভাবিক করতে চান: । যেহেতু স্বাভাবিক হওয়া উচিত বলে মনে করা হচ্ছে আপনি স্ট্যান্ডার্ড লিনিয়ার মডেলটি ফিট করার পরিকল্পনা করছেন যার জন্য বাম দিকের অংশটি । তবে, সাধারণভাবে, । ফলস্বরূপ, এই দুটি মডেলিং পদ্ধতির ভিন্ন differentY = লগ ( Y ) Y E [ Y | | x ] = [ লগ ( ওয়াই ) | x ] [ লগ ( ওয়াই ) | x ] লগ ( [ ওয়াই | এক্স ] )YY=log(Y)YE[Y|x]=E[log(Y)|x]E[log(Y)|x]log(E[Y|x])


6
আসলে, কি কখনো যদি না কিছু -measurable ফাংশন , অর্থাত্, সম্পূর্ণরূপে দ্বারা নির্ধারিত হয় । পি ( ওয়াই = ( এক্স ) | এক্স ) = 1 σ ( এক্স ) ওয়াই এক্সE(log(Y)|X)log(E(Y|X)) P(Y=f(X)|X)=1σ(X)fYX
কার্ডিনাল

@cardinal। খুব ভাল লাগানো।
সানকুলসু

9

আমি দুটি গুরুত্বপূর্ণ পার্থক্য দেখছি।

প্রথমত, পূর্বাভাসিত মানগুলি (মূল স্কেলে) আলাদা আচরণ করে; লগলাইনারে সর্বনিম্ন-স্কোয়ারগুলিতে তারা শর্তযুক্ত জ্যামিতিক অর্থ উপস্থাপন করে; লগ-পোইসন মডেলটিতে শর্তাধীন উপস্থাপন করে। যেহেতু এই ধরণের বিশ্লেষণের ডেটাগুলি প্রায়শই সঠিকভাবে স্কিউ করা হয়, তাই শর্তসাপেক্ষ জ্যামিতিক গড়টি শর্তসাপেক্ষ গড়কে অবমূল্যায়ন করবে।

দ্বিতীয় পার্থক্য হ'ল অন্তর্নিহিত বিতরণ: লগনরমাল বনাম পোইসন। এটি অবশিষ্টাংশের হেটেরোস্কেস্টাস্টিটি কাঠামোর সাথে সম্পর্কিত: বর্ধিত প্রত্যাশিত মানের (লগনরমাল) বনাম প্রত্যাশিত মানের (পোয়েসন) এর সমানুপাতিক আনুপাতিক আনুপাতিক আনুপাতিক অনুপাতের আনুষাঙ্গিক।


-1

একটি স্পষ্ট পার্থক্য পয়সন রিগ্রেশন পয়েন্ট পূর্বাভাস হিসাবে পূর্ণসংখ্যার উত্পাদন করবে যখন লগ-গণনা লিনিয়ার রিগ্রেশন অ-পূর্ণসংখ্যা দিতে পারে।


12
ওটা কিভাবে কাজ করে? জিএলএম প্রত্যাশা অনুমান করে না , যা অগত্যা অবিচ্ছেদ্য নয়?
হোবার

1
এটি অসত্য। যান্ত্রিকভাবে, পিসন রিগ্রেশনগুলি অ-পূর্ণসংখ্যাগুলি পরিচালনা করতে পুরোপুরি সক্ষম। স্ট্যান্ডার্ড ত্রুটিগুলি বিতরণ করা হবে না, তবে আপনি কেবল এর পরিবর্তে শক্তিশালী স্ট্যান্ডার্ড ত্রুটিগুলি ব্যবহার করতে পারেন।
ম্যাথু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.