লজিস্টিক রিগ্রেশন মধ্যে প্রতিকূল অনুপাতের সরল পূর্বাভাসের ব্যাখ্যা


29

আমি লজিস্টিক রিগ্রেশন ব্যবহারে কিছুটা নতুন, এবং আমার নীচের মূল্যবোধগুলির ব্যাখ্যাগুলির মধ্যে একটি বৈষম্য দ্বারা কিছুটা বিভ্রান্ত হয়েছি যা আমি ভেবেছিলাম একই হবে:

  • বিস্মৃত বিটা মান
  • বিটা মান ব্যবহার করে ফলাফলের সম্ভাবনা পূর্বাভাস।

আমি যে মডেলটি ব্যবহার করছি তার একটি সরল সংস্করণ এখানে দেওয়া হয়েছে, যেখানে অপুষ্টি ও বীমা উভয় বাইনারি এবং সম্পদ অবিচ্ছিন্ন:

Under.Nutrition ~ insurance + wealth

আমার (প্রকৃত) মডেল বীমাগুলির জন্য .8 এর একটি বিস্মৃত বিটা মান প্রদান করে, যা আমি এই হিসাবে ব্যাখ্যা করব:

"কোনও বীমাকৃত ব্যক্তির জন্য অপুষ্ট হওয়ার সম্ভাবনা একটি বীমাবিহীন ব্যক্তির জন্য অপুষ্ট হওয়ার সম্ভাবনা .8 গুণ বেশি।"

যাইহোক, আমি যখন 0 এবং 1 এর মানগুলিকে বীমা ভেরিয়েবলের মধ্যে এবং ধন-সম্পদের জন্য গড় মূল্য রেখে, সম্ভাব্যতার পার্থক্যটি গণনা করি, তখন অপুষ্টির পার্থক্য কেবলমাত্র 0.04 is এটি নিম্নলিখিত হিসাবে গণনা করা হয়:

Probability Undernourished = exp(β0 + β1*Insurance + β2*Wealth) /
                             (1+exp(β0 + β1*Insurance + β2*wealth))

কেউ যদি এই মানগুলি কেন আলাদা হয় তা ব্যাখ্যা করতে পারে এবং এর থেকে আরও ভাল ব্যাখ্যা (বিশেষত দ্বিতীয় মানের জন্য) কী হতে পারে তা আমি সত্যিই প্রশংসা করব।


আরও স্পষ্টকরণের সম্পাদনাগুলি
যেমন আমি এটি বুঝতে পারি, একটি বীমাবিহীন ব্যক্তির (যেখানে বি 1 বিমার সাথে মিল রয়েছে) স্বল্প-পুষ্ট হওয়ার সম্ভাবনা হ'ল:

Prob(Unins) = exp(β0 + β1*0 + β2*Wealth) /
              (1+exp(β0 + β1*0+ β2*wealth))

বীমাকৃত ব্যক্তির জন্য স্বল্প-পুষ্ট হওয়ার সম্ভাবনা হ'ল:

Prob(Ins)= exp(β0 + β1*1 + β2*Wealth) /
           (1+exp(β0 + β1*1+ β2*wealth))

কোনও বীমাকৃত ব্যক্তির তুলনায় একটি বীমাহীন ব্যক্তির জন্য অপুষ্ট হওয়ার অসুবিধাগুলি হ'ল:

exp(B1)

এই মানগুলির মধ্যে (গাণিতিক) অনুবাদ করার কোনও উপায় আছে কি? আমি এখনও এই সমীকরণ দ্বারা কিছুটা বিভ্রান্ত (যেখানে আমার সম্ভবত আরএইচএসের চেয়ে আলাদা মান হওয়া উচিত):

Prob(Ins) - Prob(Unins) != exp(B)

সাধারণ মানুষের শর্তে, প্রশ্নটি হল যে কোনও ব্যক্তি অসুবিধাগুলির অনুপাত যেমন ইঙ্গিত করে তেমনি স্বল্প-পুষ্ট হওয়ার সম্ভাবনাও কেন তাদের পরিবর্তিত হয় না? আমার ডেটাতে প্রোব (ইনস) - প্রোব (আনইনস) = .04, যেখানে বিস্ফোরিত বিটার মান .8 (সুতরাং পার্থক্যটি কেন হয় না? 2?)


2
এই দুর্দান্ত এবং স্পষ্ট ব্যাখ্যা লগ-লজিস্টিক মডেল / রিগ্রেশনগুলির জন্য প্রযোজ্য?

উত্তর:


50

আমার কাছে এটি স্ব-স্পষ্ট বলে মনে হয় যে যতক্ষণ না । সুতরাং, আমি বিভ্রান্তি কী হতে পারে সে সম্পর্কে আমি কম পরিষ্কার। আমি কি বলতে পারেন (না) সমান চিহ্নের বাম দিকে (LHS) হয় মতভেদ অপুষ্টির শিকার হচ্ছে যেহেতু RHS হয় সম্ভাব্যতা অপুষ্টির শিকার হচ্ছে। যখন নিজে থেকে পরীক্ষা করা হয়, হ'ল বিজোড় অনুপাত , এটি হ'ল গুণক কারণ যা আপনাকে ( ) থেকে বিজোড় ( ) এ যেতে দেয়। এক্সপ্রেস(β0+β1এক্স)=0এক্সপ্রেস(β1)xx+1

exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
exp(β0+β1x)=0exp(β1)xx+1

আপনার অতিরিক্ত / ভিন্ন তথ্যের প্রয়োজন হলে আমাকে জানান।

আপডেট:
আমি মনে করি এটি বেশিরভাগ ক্ষেত্রে সম্ভাব্যতা এবং প্রতিকূলতার সাথে অপরিচিত থাকার একটি সমস্যা এবং তারা কীভাবে একে অপরের সাথে সম্পর্কিত। এর কোনওটিই খুব স্বজ্ঞাত নয়, আপনাকে বসে কিছুক্ষণ এটি নিয়ে কাজ করতে হবে এবং সেই পদগুলিতে ভাবতে শেখা উচিত; এটি কারও কাছে স্বাভাবিকভাবে আসে না।

বিষয়টি হ'ল পরম সংখ্যাগুলি তাদের নিজস্ব ব্যাখ্যা করা খুব কঠিন। আসুন আমি বলি যে আমি আপনাকে এমন একটি সময় সম্পর্কে বলছিলাম যখন আমার একটি মুদ্রা ছিল এবং আমি ভাবছিলাম যে এটি উপযুক্ত কিনা। তাই আমি এটিকে কিছুটা উল্টে ফেলেছিলাম এবং 6 টি মাথা পেয়েছি। ওটার মানে কি? 6 কি অনেক, কিছুটা ঠিক? এটা বলতে খুব ভয়ঙ্কর। এই সমস্যাটি মোকাবেলা করার জন্য আমরা সংখ্যাকে কিছু প্রসঙ্গ দিতে চাই। এর মতো ক্ষেত্রে প্রয়োজনীয় প্রসঙ্গটি কীভাবে সরবরাহ করা যায় তার জন্য দুটি সুস্পষ্ট পছন্দ রয়েছে: আমি মোট ফ্লিপগুলি দিতে পারতাম, বা আমি পুচ্ছের সংখ্যা দিতে পারতাম। উভয় ক্ষেত্রেই আপনার কাছে 6 টি মাথা বুদ্ধি করার জন্য পর্যাপ্ত তথ্য রয়েছে এবং আমি আপনাকে যা বলেছি সে যদি আপনি পছন্দ করেন না তবে আপনি অন্য মানটি গণনা করতে পারেন। সম্ভাবনা হ'ল ইভেন্টগুলির মোট সংখ্যার দ্বারা বিভক্ত মাথাগুলির সংখ্যা। প্রতিক্রিয়া হ'ল মাথা সংখ্যার সাথে অনুপাতনন-হেডস (স্বজ্ঞাতভাবে আমরা লেজের সংখ্যা বলতে চাই, যা এই ক্ষেত্রে কাজ করে তবে 2 টিরও বেশি সম্ভাবনা থাকলে তা নয়)। প্রতিকূলতার সাথে উভয় সংখ্যা দেওয়া সম্ভব, যেমন 4 থেকে 5। এর অর্থ দীর্ঘমেয়াদে প্রতিটি 5 বারের জন্য 4 বার ঘটবে তা ঘটে না। প্রতিকূলতাকে এইভাবে উপস্থাপন করা হলে তাদের " লাস ভেগাসের বিজোড় " বলা হয়। তবে পরিসংখ্যানগুলিতে, আমরা সাধারণত বিভাজক হয়ে যাই এবং মানকে মান নির্ধারণের উদ্দেশ্যে instead পরিবর্তে (8, 4/5 = .8) প্রতিক্রিয়াগুলি বলি। প্রতিকূলতা এবং সম্ভাবনার মধ্যে আমরা রূপান্তর করতে পারি:

probability=odds1+odds                odds=probability1probability
(এই সূত্রগুলির সাহায্যে বৈধতাগুলি শীর্ষে এলএইচএস, এবং এটির সম্ভাবনাটি আরএইচএস, তবে এটি মনে রাখবেন যে এটি মাঝখানে সমান চিহ্ন নয় )) একটি প্রতিক্রিয়া অনুপাত কেবলমাত্র বিভক্ত কোনও কিছুর প্রতিক্রিয়া অন্য কিছুর প্রতিক্রিয়া; লজিস্টিক রিগ্রেশন প্রসঙ্গে, প্রতিটি হ'ল সংশ্লিষ্ট কোভারিয়েটের ক্রমান্বিত মানগুলির প্রতিকূলতার অনুপাত যখন সমস্ত কিছু সমান হয়। exp(β)

এই সমস্ত সমীকরণগুলি থেকে স্বীকৃতি দেওয়ার জন্য গুরুত্বপূর্ণ বিষয়টি হ'ল সম্ভাবনা, প্রতিকূলতা এবং প্রতিকূল অনুপাতগুলি কোনও সোজা পদ্ধতিতে সমান হয় না; কেবল সম্ভাবনা .04 দ্বারা উপরে চলে যাওয়ার কারণে খুব বেশি বোঝা যায় না যে প্রতিকূলতা বা প্রতিকূলতার অনুপাতটি .04 এর মতো কিছু হওয়া উচিত! তদুপরি, সম্ভাব্যতাগুলি থেকে বিস্তৃত , যদিও এলএন বিজোড় (কাঁচা লজিস্টিক রিগ্রেশন সমীকরণ থেকে আউটপুট) থেকে শুরু করে এবং বৈষম্য এবং প্রতিকূল অনুপাতগুলি range হতে পারে । এই শেষ অংশটি গুরুত্বপূর্ণ: সম্ভাব্যতার সীমাবদ্ধ সীমার কারণে, সম্ভাবনাগুলি অ-রৈখিক , তবে ln বৈচিত্র লিনিয়ার হতে পারে। এটি, যেমন (উদাহরণস্বরূপ)[0,1](,+)(0,+)wealthধ্রুবক বৃদ্ধি দ্বারা বৃদ্ধি পায়, অপুষ্টির সম্ভাবনা বিভিন্ন পরিমাণে বৃদ্ধি পাবে, তবে ln বৈষম্যগুলি একটি ধ্রুবক পরিমাণে বৃদ্ধি পাবে এবং বৈষম্যগুলি একটি ধ্রুবক গুণক কারণ দ্বারা বৃদ্ধি পাবে। আপনার লজিস্টিক রিগ্রেশন মডেলটিতে দেওয়া কোনও মানের , এখানে কিছু পয়েন্ট থাকতে পারে যেখানে কিছু এবং , তবে এটি অন্য কোথাও অসম হবে। xx

exp(β0+β1x)exp(β0+β1x)=exp(β0+β1x)1+exp(β0+β1x)exp(β0+β1x)1+exp(β0+β1x)
xx

(যদিও এটি কোন অন্য প্রশ্নের প্রেক্ষাপটে লেখা ছিল আমার উত্তর এখানে লজিস্টিক রিগ্রেশন বিষয়ে তথ্য আরো সম্পূর্ণরূপে এল আর ও সংশ্লিষ্ট বিষয় বুঝতে আপনার জন্য সহায়ক হতে পারে অনেক রয়েছে।)


প্রতিক্রিয়াটির জন্য ধন্যবাদ - আমি উপরের সম্পাদনাতে আমার বিভ্রান্তিকে আরও ব্যাখ্যা করেছি।
মাইক

একটি সম্পূর্ণ ব্যাখ্যা লিখতে সময় দেওয়ার সত্যই প্রশংসা করুন - খুব সহায়ক।
মাইকে

আপনাকে স্বাগতম, @ মিমি, সিভি এর জন্যই।
গুং - মনিকা পুনরায়

পুনরায় লাস ভেগাস মতভেদ লিঙ্ক: আমি ভেগাস আগে কখনো ছিল না করেছি, কিন্তু আপ খুঁজছেন কিছু থাকার ভেগাস-ভিত্তিক সাইট, যেখানে তারা ভগ্ন মতভেদ উদ্ধৃত (যেমন moneyline থেকে ভিন্ন) তাদের "বিরুদ্ধে অডস" ব্রিটিশ সিস্টেম অনুসরণ দ্বারা প্রদত্ত, না পরিসংখ্যানগত "পক্ষে মতবিরোধ"। আপনার লিঙ্কে যেমন "লাস ভেগাসের মতভেদ" প্রকৃত জুয়ার বৈষম্যের সাথে সামঞ্জস্য করে না, যেখানে "9 থেকে 1" একটি সম্ভাব্য ইভেন্টের জন্য নয়, ("9 থেকে 1" অর্থ কোনও পরিসংখ্যানবিদকে বোঝায় না) সম্ভবত! বিভ্রান্তির একটি উত্স আমি এখানে
সম্বোধন

@ সিলভারফিশ, আমি দীর্ঘদিন লাস ভেগাসে যাইনি। আমি মনে করি না তারা সাধারণত প্রতিকূলতার বিরুদ্ধে বা প্রতিকূলতার তালিকা দেয় কিনা। তবুও '4 থেকে 5' কে লাস ভেগাসের প্রতিকূলতা বলে
গুং - মনিকা পুনরায়

0

ঠিক আছে উত্তরটি সহজ যখন আপনি সমস্ত ভেরিয়েবলকে ধ্রুবক রাখতে এবং এক পরিবর্তকের পরিবর্তিত করতে ইচ্ছুক হন। তবে প্রতিটি পরিবর্তনশীল পরিবর্তনের মুহুর্তে এটি কিছুটা জটিল হয়ে ওঠে। আপনি নিম্নলিখিত পোস্টটি দেখতে পারেন, এটি সাহায্য করতে পারে http://analyticspro.org/2016/03/02/r-tutorial- মাল্টিপল- লাইনার- রেজিস্ট্রেশন /


-1

অদ্ভুত অনুপাত OR = এক্সপ (বি) সম্ভাব্যতা A = এসকিউআরটি (ওআর) / (এসকিউআরটি (ওআর) +1) তে অনুবাদ করে, যেখানে সম্ভাব্যতা এ-এর ইভেন্ট এ এর ​​সম্ভাবনা এবং ও হচ্ছে ঘটনার অনুপাত এ / ঘটবে না এমন ঘটনা এ (বা না উপরের প্রশ্নে বীমা দ্বারা উন্মুক্ত / উন্মুক্ত নয়)। সমাধান করতে আমার বেশ খানিকটা সময় লেগেছিল; আমি কেন জানি না যে এটি সুপরিচিত সূত্র নয়।

একটি উদাহরণ আছে। মনে করুন, বিশ্ববিদ্যালয়ে ভর্তিচ্ছু ১০ জন; তাদের মধ্যে 7 জন পুরুষ। সুতরাং, প্রতিটি মানুষের জন্য এটি ভর্তি হওয়ার 70% সম্ভাবনা। পুরুষদের জন্য ভর্তি হওয়া প্রতিক্রিয়াগুলি 7/3 = 2.33 এবং 3/7 = 0.43 এ ভর্তি হতে হবে না। বিজোড় অনুপাত (ওআর) হ'ল ২৩.৩ / / ০.৪৩ = ৫.৪৪ যার অর্থ পুরুষদের ক্ষেত্রে নারীদের ক্ষেত্রে ভর্তির সুযোগ ৫.৪৪ গুণ বেশি higher আসুন OR এর থেকে মানুষের জন্য ভর্তি হওয়ার সম্ভাবনাটি খুঁজে বার করুন: পি = এসকিউআরটি (5.44) / (এসকিউআরটি (5.44) +1) = 0.7

আপডেট এটি শুধুমাত্র সত্য যদি ভর্তি হওয়া পুরুষ বা মহিলা সংখ্যা আবেদনকারী সংখ্যার সমান হয়। অন্য কথায়, এটি OR হয় না। আমরা অতিরিক্ত তথ্য না জেনে সম্ভাবনার লাভ (বা ক্ষতি) ফ্যাক্টরের উপর নির্ভর করতে পারি না।


ভুল আমি ভীত: এই উদাহরণে আমরা বিশদ (এবং সম্ভাবনা )টি অনুমান করতে পারি যে বিশ্ববিদ্যালয়ে ভর্তি হওয়া কোনও ব্যক্তি একজন পুরুষ (বা একজন মহিলা), তবে আবেদনকারীদের মধ্যে কত পুরুষ এবং মহিলা ছিলেন তা জেনেও কোনও প্রতিকূল অনুপাত নেই । ভুল আমি ভীত: এই উদাহরণে আমরা বিশদ (এবং সম্ভাবনা )টি অনুমান করতে পারি যে বিশ্ববিদ্যালয়ে ভর্তি হওয়া কোনও ব্যক্তি একজন পুরুষ (বা একজন মহিলা), তবে আবেদনকারীদের মধ্যে কত পুরুষ এবং মহিলা ছিলেন তা জেনেও কোনও প্রতিকূল অনুপাত নেই । কি আপনাকে কল করছি অথবা এখানে আসলে শুধু মতভেদ ছক হয় । 7232
Scortchi - পুনর্বহাল মনিকা

হ্যাঁ, আপনি একেবারে ঠিক, ধন্যবাদ। আমি দেখতে পেয়েছি যে আমরা পূর্বের সম্ভাব্যতা সম্পর্কে তথ্য না জেনে আমরা পরিচিত ওআর (উদাহরণস্বরূপ, লজিস্টিক রিগ্রেশন আউটপুট হিসাবে) সম্ভাব্যতা লাভ বা ক্ষতির মধ্যে রূপান্তর করতে পারি না। আমি আমার উত্তর আপডেট করা।
নিক্সর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.