লজিস্টিক রিগ্রেশন সহগ বিশ্লেষণ


12

এখানে লজিস্টিক রিগ্রেশন সহগগুলির একটি তালিকা রয়েছে (প্রথমটি একটি ইন্টারসেপ্ট)

-1059.61966694592
-1.23890500515482
-8.57185269220438
-7.50413155570413
 0
 1.03152408392552
 1.19874787949191
-4.88083274930613
-5.77172565873336
-1.00610998453393

আমি এটিকে অদ্ভুত বলে মনে করি যে কীভাবে ইন্টারসেপটিটি এত কম এবং আমার একটি সহগ রয়েছে যা আসলে 0 এর সমান I আমি কীভাবে এটি ব্যাখ্যা করব তা সম্পর্কে আমি পুরোপুরি নিশ্চিত নই। 0 টি কি ইঙ্গিত দেয় যে নির্দিষ্ট ভেরিয়েবলের কোনও মডেলটিতে কোনও প্রভাব নেই? কিন্তু কারও কলামটি ইনপুট করে যে ইন্টারসেপ্ট তৈরি করা হয়েছে তা হঠাৎ করেই গুরুত্বপূর্ণ? বা আমার ডেটাটি কেবল বকাবকি এবং মডেলটি এটির সাথে সঠিকভাবে ফিট করতে অক্ষম।


2
আপনার অন্যান্য ভেরিয়েবলগুলির ব্যাপ্তি বা স্ট্যান্ডার্ড বিচ্যুতি কী? অন্যের তুলনায় শূন্যের প্রাক্কলনের সাথে ভেরিয়েবলের স্ট্যান্ডার্ড বিচ্যুতির মধ্যে কি বড় পার্থক্য রয়েছে? অন্যের তুলনায় মান বিচ্যুতি যদি কম হয় তবে আপনি শূন্যের একটি সহগের আশা করতে পারেন (সংখ্যাসম্য নির্ভুলতা)। এছাড়াও বিরতি মূলত এর অর্থ হল আপনার চলকগুলি রয়েছে যার বড় গড় রয়েছে (শূন্য থেকে দূরে)। আপনার ভেরিয়েবলগুলি কেন্দ্রীকরণ একটি আরও ব্যাখ্যামূলক ইন্টারসেপ্ট দেবে এবং অন্যান্য ভেরিয়েবলগুলির জন্য বিটাগুলি পরিবর্তন করবে না (পুনরাবৃত্ত অ্যালগরিদম ত্রুটি একপাশে রেখে)।
সম্ভাব্যতা

1
আপনি যদি ষষ্ঠ ভেরিয়েবলের সমস্ত মান থেকে 1027 বিয়োগ করতে চান তবে আপনার বাধাটি 0 এর কাছাকাছি হবে would এটি কি আপনাকে আরও ভাল বোধ করবে? :-)
হুবুহু

4
এর মতো গুণফলের একটি তালিকা প্রদর্শন করা, কোনও প্রসঙ্গ ছাড়াই সম্ভবত বলা হচ্ছে "জো-এর 31 টি আছে, এটি কি খুব বেশি নয়?" 31 না বলে কি । 31 গাড়ি? অনেক. 31 বাচ্চা? অনেকটা একটা হেক! 31 ডলার? বেশি না.
পিটার ফ্লুম - মনিকা পুনরায়

1
শূন্যের গুণাগুণ সম্পর্কে: আমি আপনার সমস্ত সহগকে এখানে এখানে আটকানোর আগে এক্সএলে রাখার একটি নিদর্শন হিসাবে এটি দেখতে পেয়েছি - এমন একটি জিনিস যা আমরা সাধারণত যে দশমিক স্থানের চেয়ে বেশি সংখ্যক স্থানে দেখি consistent সম্ভবত এই এক্সএল কোষগুলির মধ্যে একটি শূন্য প্রদান করে পূর্ণসংখ্যাগুলিতে চলে গেছে। আমার এমন ঘটনা ঘটেছে।
রোল্যান্ডো 2

আপনার ইনপুট জন্য আপনাকে সবাই ধন্যবাদ! আমি সত্যিই আপনার প্রত্যেকে প্রশংসা করি! আমার অনেক প্রশ্নের উত্তর দেওয়া হয়েছিল
shiu6rewgu

উত্তর:


16

আপনি আমার মতামত মতামত কিছু খুব ভাল তথ্য পাচ্ছেন। আমি ভাবছি যদি লজিস্টিক রিগ্রেশন সম্পর্কিত কিছু প্রাথমিক তথ্যগুলি এই বিষয়গুলিকে আরও বোধগম্য করে তুলতে সহায়তা করে, তাই এই বিষয়টি মনে রেখে, আমাকে কয়েকটি বিষয় বর্ণনা করতে দিন। লজিস্টিক রিগ্রেশন-এ, সহগগুলি লজিস্টিক স্কেলে থাকে (অতএব নাম ...)) যদি আপনি কোনও পর্যবেক্ষণের জন্য আপনার সমবায়িক মানগুলি প্লাগ করতে থাকেন তবে তাদের সহগের দ্বারা গুণিত করুন এবং সেগুলি যোগ করুন, আপনি লগইট পাবেন
2.718281828 2 = 7.389056 7.389056

logit=β0+β1x1+β2x2+...+βkxk
লগইট এমন একটি সংখ্যা যা কারও কাছে স্বজ্ঞাত জ্ঞান তৈরি করে না, তাই কোনও সংখ্যার সাথে কী করা উচিত তা মজাদার দেখাচ্ছে (যেমন, খুব উচ্চ বা খুব নীচে) এটি জানা খুব কঠিন it এই জিনিসগুলি বোঝার সর্বোত্তম উপায় হ'ল তাদের আসল স্কেল (লগইটগুলি) থেকে আপনি বুঝতে পারেন এমন একটিতে রূপান্তর করা, বিশেষত সম্ভাব্যতা। এটি করার জন্য, আপনি আপনার লজিটটি নিয়ে যান এবং এটি এক্সপেনসেট করেন। তার মানে আপনি ( ) এবং এটিকে শক্তি বাড়িয়ে । আপনার 2: কল্পনা করুন এটি আপনাকে দেবে। প্রতিকূলতাকে একের সাথে আরও ভাগ করে একটি সম্ভাবনার পক্ষে রূপান্তর করতে পারেন: লোকেরা সাধারণত সম্ভাবনাটি মোকাবিলা করতে আরও সহজ মনে করে। e2.718281828
e2=7.389056
7.3890561+7.389056=0.880797

আপনার মডেলটির জন্য, কল্পনা করুন যে আপনার একটি পর্যবেক্ষণ হয়েছে যাতে আপনার সমস্ত ভেরিয়েবলের মান হ'ল 0 হয়, তবে আপনার সমস্ত সহগটি বাদ পড়বে এবং আপনি কেবল আপনার বিরতি মান রেখে চলে যাবেন। যদি আমরা আপনার মানটিকে আরও স্পষ্ট করে দেখি তবে আমরা 0 টি প্রতিকূল হিসাবে পেয়ে যাব (যদি এটি -700 হয়, তবে প্রতিকূলতা , তবে আমি আমার কম্পিউটার -1060 এর জন্য একটি মান দিতে পারি না, এটি আমার সফ্টওয়্যারের সংখ্যার সীমাতে খুব ছোট)। এই প্রতিকূলতাকে সম্ভাব্যতায় রূপান্তর করা, ( 0 / ( 1 + 0 )9.8×103050/(1+0)), আবার আমাদের 0 দেয়। সুতরাং, আপনার আউটপুট আপনাকে যা বলছে তা হ'ল আপনার ইভেন্টটি (যা কিছু হোক না কেন) কেবল তখনই ঘটে না যখন আপনার সমস্ত ভেরিয়েবল 0 এর সমান হয় অবশ্যই, এটি আমরা কী সম্পর্কে কথা বলছি তার উপর নির্ভর করে তবে আমি খুব উল্লেখযোগ্য কিছুই পাই না about এই. একটি স্ট্যান্ডার্ড লজিস্টিক রিগ্রেশন সমীকরণ (উদাহরণস্বরূপ, একটি বর্গক্ষেত্র শব্দ ছাড়া বলুন) প্রয়োজনীয়ভাবে ধরে নেওয়া হয় যে একটি কোভেরিয়াট এবং সাফল্যের সম্ভাবনার মধ্যে সম্পর্ক হয় একঘেয়েমি বাড়ছে বা একঘেয়েভাবে হ্রাস পাচ্ছে। এর অর্থ এটি সর্বদা বৃহত্তর এবং বৃহত্তর হয় (বা আরও ছোট এবং ছোট), এবং তাই, আপনি যদি এক দিকে অনেক বেশি যান তবে আপনি খুব কম সংখ্যক হয়ে উঠবেন আমার কম্পিউটারে 0 ছাড়াই তাদের বলতে পারবেন না That এটি কেবলমাত্র জন্তু প্রকৃতি। এটি যেমন ঘটে থাকে, আপনার মডেলের জন্য, সত্যই দূরে চলে যাওয়া আপনার কোভেরিয়েটের 0 টি সমান হয়।

0 এর সহগ হিসাবে, এর অর্থ এই নয় যে আপনার পরিবর্তন হিসাবে এর পরিবর্তনশীলটির কোনও প্রভাব নেই। এখন, এটি বেশ যুক্তিসঙ্গত যে কোনও পরিবর্তনশীলটির প্রভাব থাকবে না, তবে আপনি মূলত কখনই 0 এর সহগ পাবেন না। কেন জানি না কেন এই ক্ষেত্রে এটি ঘটেছে; মন্তব্যগুলি কিছু সম্ভাব্য পরামর্শ দেয়। আমি অন্য একটি অফার করতে পারি, এটি হ'ল সেই ভেরিয়েবলের কোনও ভিন্নতা নাও থাকতে পারে। উদাহরণস্বরূপ, যদি আপনার কাছে এমন কোনও পরিবর্তনশীল থাকে যা যৌনতার জন্য কোড করে তবে আপনার নমুনায় কেবলমাত্র মহিলা। আমি জানি না যে এটিই আসল উত্তর (আর, উদাহরণস্বরূপ, NAসেই ক্ষেত্রে ফিরে আসে , তবে সফ্টওয়্যার পৃথক হয়) - এটি কেবল অন্য একটি পরামর্শ another


2
উল্লেখ্য গুন প্রাকৃতিক লগ মতভেদ দ্বারা বেস থেকে দশ মতভেদ পেতে পারেন । আপনি যে উত্তরটি তা মোটামুটি । এবং ছোট প্রতিক্রিয়া জন্য, সম্ভাবনা বৈষম্যের সমান। সুতরাং সমস্ত কোভারিয়েট শূন্য হলে আমাদের প্রায় of এর সম্ভাবনা থাকে । -46010-4603067003746010460
সম্ভাব্যতাব্লোগিক

10

ইন্টারসেপ্ট ব্যাখ্যা করা

আপনি লজিস্টিক রিগ্রেশনটিকে আপনি '1' হওয়ার পূর্ববর্তী সম্ভাবনা প্রদান হিসাবে ভাবতে পারেন। ইন্টারসেপ্টটি ডেটাসেট থেকে প্রাপ্ত বিভাগগুলির পূর্বের প্রতিনিধিত্ব করে: বিশেষত, এটি লগ (পি (ওয়াই = 1) / পি (ওয়াই = 0) এর অনুশীলনমূলক প্রাক্কলন হয়, যখন মডেলটিতে কেবলমাত্র একটি বিরতি থাকে, ক্ষেত্রে ক্ষেত্রে শ্রেণিবদ্ধ covariates যখন 'রেফারেন্স' ক্লাস, এবং ক্ষেত্রে যখন covariates সাধারণত আরও 0 হয় (তবে কম ব্যাখ্যাযোগ্য) সুতরাং আপনার দৃ strongly় নেতিবাচক সংখ্যা সম্ভবত আপনাকে বলছে যে আপনার নমুনা দ্বারা চিহ্নিত বৈশিষ্ট্যগুলির মধ্যে '1 এর বিরল হয় সমস্ত কোভেরিয়েট ০. এ থাকা আবারও, সেখানে কোনও পর্যবেক্ষণ নাও থাকতে পারে, সুতরাং এটি বিরতি মান সম্পর্কে চিন্তা করার মতো নয় এই আলোচনাটি মোটামুটি পরিষ্কার।

প্যারামিটারগুলির মধ্যে উদ্বেগের এই সহজ বিভাজনের কারণে, আপনি আরও ভাল ভারসাম্যপূর্ণ নমুনার প্রশিক্ষণ দিয়ে এবং কেবল ইন্টারসেপ্ট সামঞ্জস্য করে বিভাগের ভারসাম্যহীনতার জন্য সংশোধন করতে পারেন । পুরো আলোচনার জন্য কিং এবং জেং দেখুন King


"এই আলোচনা" এর লিঙ্কটি মারা গেছে বলে মনে হয়। এই লিঙ্কটি পুনরুদ্ধার করার কোনও সুযোগ?
আলেক্সি গ্রিগোরভ

1
@ Alexey-grigorev আমি ইউসিএলএ লিংক আপডেট
conjugateprior

এবং একটি ডাউনভোট জোগাড় খুব অদ্ভুত.
conjugateprior
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.