লজিস্টিক রিগ্রেশন এর জন্য টুপি ম্যাট্রিক্সের বাইরে তথ্য


12

এটি আমার কাছে স্পষ্ট, এবং একাধিক সাইটে ভালভাবে ব্যাখ্যা করা হয়েছে, টুপি ম্যাট্রিক্সের ত্রিভুজের মানগুলি লিনিয়ার রিগ্রেশন জন্য কোন তথ্য দেয়।

লজিস্টিক রিগ্রেশন মডেলের টুপি ম্যাট্রিক্স আমার কাছে কম স্পষ্ট। লিনিয়ার রিগ্রেশন প্রয়োগ করে আপনি টুপি ম্যাট্রিক্স থেকে বেরিয়ে আসা তথ্যের সাথে কি অভিন্ন? এটি সিভির অন্য একটি বিষয়ের (উত্স 1) -তে আমি পেয়েছি টুপি ম্যাট্রিক্সের সংজ্ঞা:

H=VX(XVX)1XV

এক্স সঙ্গে predictor ভেরিয়েবল ও V এর ভেক্টর একটি তির্যক ম্যাট্রিক্স সঙ্গে (π(1π))

এটি কি অন্য কথায়, এটিও সত্য যে কোনও পর্যবেক্ষণের টুপি ম্যাট্রিক্সের নির্দিষ্ট মানটিও কোভেরিয়েট স্পেসে কোভেরিয়েটদের অবস্থানকে উপস্থাপন করে এবং সেই পর্যবেক্ষণের ফলাফলের মানের সাথে কোনও সম্পর্ক নেই?

এটি এগ্র্রেস্টির "শ্রেণীবদ্ধ তথ্য বিশ্লেষণ" বইয়ে লেখা হয়েছে:

একটি পর্যবেক্ষণের বয়স যত বেশি হবে, ফিটের উপর এর সম্ভাব্য প্রভাব তত বেশি। সাধারণ রিগ্রেশন হিসাবে, লিভারেজগুলি 0 থেকে 1 এর মধ্যে পড়ে এবং মডেল পরামিতিগুলির সংখ্যার সমষ্টি হয়। সাধারণ রিগ্রেশন থেকে পৃথক, টুপি মানগুলি ফিটের পাশাপাশি মডেল ম্যাট্রিক্সের উপর নির্ভর করে এবং চূড়ান্ত পূর্বাভাসক মানগুলির মধ্যে পয়েন্টগুলি বেশি উচ্চতর লাভের প্রয়োজন হয় না।

সুতরাং এই সংজ্ঞাটির বাইরে, মনে হচ্ছে আমরা সাধারণ লিনিয়ার রিগ্রেশন হিসাবে এটি ব্যবহার করতে পারি না?

উত্স 1: আরজে লজিস্টিক রিগ্রেশনের জন্য টুপি ম্যাট্রিক্স কীভাবে গণনা করবেন?

উত্তর:


13

আমাকে স্বরলিপিটি কিছুটা পরিবর্তন করতে দিন এবং টুপি ম্যাট্রিক্সকে যেখানে সাধারণ উপাদানগুলির সাথে একটি তির্যক সমমিত ম্যাট্রিক্স । বোঝাতে একই covariate মান ব্যক্তিদের দলের যেমন । আপনি as হিসাবে টুপি ম্যাট্রিক্সের তির্যক উপাদান ( ) পেতে পারেন তারপর এর সমষ্টি রৈখিক রিগ্রেশনের হিসেবে পরামিতি সংখ্যা দেয়। এখন আপনার প্রশ্নের:

H=V12X(XVX)1XV12
Vvj=mjπ(xj)[1π(xj)]mjx=xjjthhj
hj=mjπ(xj)[1π(xj)]xj(XVX)1xj
hj

টুপি ম্যাট্রিক্সের লিভারেজ মানগুলির ব্যাখ্যা অনুমান সম্ভাবনা উপর নির্ভর করে । যদি , আপনি লিনিয়ার রিগ্রেশন কেসের মতো একই ধরণের লিভারেজ মানগুলি ব্যাখ্যা করতে পারেন, অর্থাত্ গড় থেকে আরও দূরে থাকা আপনাকে উচ্চতর মান দেয়। আপনি যদি সম্ভাবনা বিতরণের চূড়ান্ত প্রান্তে থাকেন তবে এই লিভারেজ মানগুলি একই অর্থে দূরত্বটি আর মাপতে পারে না। এটি হোমার এবং লেমশো (2000) থেকে নেওয়া নীচের চিত্রটিতে দেখানো হয়েছে:π0.1<π<0.9

এখানে চিত্র বর্ণনা লিখুন

এই ক্ষেত্রে কোভারিয়েট স্পেসের সর্বাধিক চূড়ান্ত মানগুলি আপনাকে ক্ষুদ্রতম লিভারেজ দিতে পারে, যা লিনিয়ার রিগ্রেশন ক্ষেত্রে বিপরীত। কারণটি হ'ল লিনিয়ার রিগ্রেশন-এ লিভারেজ একটি মনোোটোনিক ফাংশন, যা অ-রৈখিক লজিস্টিক রিগ্রেশনের জন্য সত্য নয়। উপরের রূপটি হ্যাট ম্যাট্রিক্সের তির্যক উপাদানগুলির মনোোটোনিকভাবে বর্ধমান অংশ রয়েছে যা গড় থেকে দূরত্বকে উপস্থাপন করে। এটি হ'ল অংশ, আপনি যদি প্রতি কেবলমাত্র দূরত্বে আগ্রহী হন তবে আপনি এটি দেখতে পারেন। লজিস্টিক রিগ্রেশনগুলির জন্য বেশিরভাগ ডায়াগনস্টিক পরিসংখ্যান সম্পূর্ণ লিভারেজ ব্যবহার করে , তাই এই পৃথক একঘেয়েমিক অংশটি খুব কমই একাই বিবেচিত হয়।xj(XVX)1xjhj

আপনি যদি এই বিষয়ে আরও গভীরভাবে পড়তে চান তবে প্রেজিবনের (১৯৮১) পেপারটি দেখুন, যিনি লজিস্টিক টুপি ম্যাট্রিক্স পেয়েছেন এবং হোসমার এবং লেমেশো (2000) বইটি দেখুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.