লজিস্টিক রিগ্রেশন সহগগুলির তাত্পর্যটি কী?


42

আমি বর্তমানে ২০০০ ও ২০০৪ সালের নির্বাচনের ভোটদানের স্থান এবং ভোটদানের পছন্দ সম্পর্কিত একটি কাগজ পড়ছি । এটিতে একটি চার্ট রয়েছে যা লজিস্টিক রিগ্রেশন সহগগুলি প্রদর্শন করে। কয়েক বছর আগে এবং কিছুটা পড়া শুরু, আমি একাধিক স্বতন্ত্র ভেরিয়েবল এবং বাইনারি প্রতিক্রিয়া ভেরিয়েবলের মধ্যে সম্পর্ককে বর্ণনা করার উপায় হতে লজিস্টিক রিগ্রেশনকে বুঝি। আমি যে বিষয়টি সম্পর্কে বিভ্রান্ত হয়েছি তা হল নীচের টেবিলটি দেওয়া, কারণ দক্ষিণে .903 এর একটি লজিস্টিক রিগ্রেশন সহগ রয়েছে, এর অর্থ কি 90.3% দক্ষিণের ভোটাররা রিপাবলিকান? মেট্রিকের যৌক্তিক প্রকৃতির কারণে, যে এই প্রত্যক্ষ পারস্পরিক সম্পর্ক নেই lation পরিবর্তে, আমি ধরে নিলাম যে আপনি কেবল এটিই বলতে পারেন যে .903 সহ দক্ষিণ, রিংগ্রেশনকে পর্বতমালা / সমভূমির চেয়ে বেশি ভোট দেয় ।506 এর সাথে। পরেরটি কেস হিসাবে বিবেচিত, আমি কীভাবে তা জানব যে কোনটি তাৎপর্যপূর্ণ এবং কোনটি নয় এবং এই লজিস্টিক রিগ্রেশন সহগকে প্রদত্ত প্রজাতন্ত্রের ভোটের শতকরা ভাগের বহির্ভূতকরণ কীভাবে সম্ভব? সারণী লজিস্টিক রিগ্রেশন সহগগুলি দেখায়

পার্শ্ব নোট হিসাবে, দয়া করে যদি কিছু ভুলভাবে বলা থাকে তবে আমার পোস্টটি সম্পাদনা করুন


এটি আরও অনুসরণীয় (এবং আমার সম্ভবত এটি পোস্ট করা উচিত নয়), তবে আপনি কী "একটি শতাংশকে বহির্ভূত করা সম্ভব" এর একটি ভাল উপায় খুঁজে পেয়েছেন কারণ এটি আমি যা খুঁজছি তা অনেকটাই।
স্টিফান অ্যান্ডারসন

2
আমি মনে করি আপনার পক্ষে এটিকে এককভাবে প্রশ্ন হিসাবে প্রণয়ন করা এবং এখানে উত্তর হিসাবে না দিয়ে আলাদাভাবে পোস্ট করা ভাল।
কার্ডিনাল

যে কেউ কাগজ সম্পর্কে হতাশ হয়ে থাকে তবে এটি এসসি McKee এবং জে এম Teigen কারো নির্দেশ চলে না গোষ্ঠীতন্ত্র এবং 2000 এবং 2004 মার্কিন প্রেসিডেন্ট নির্বাচনে ভোটার অবস্থান: reds এবং ব্লুজ অনুষন্ধানে (2009) রাজনৈতিক ভূগোল
অ্যালেক্স নেলসন

উত্তর:


36

লেখক চিন্তাশীল যেমন কেউ বাধ্য করেছে যে তোমাকে একটা প্রশ্ন জিজ্ঞেস মত এই কেন অনুশীলন বাধ্যকারী চিত্রণ আছে - এখনও পথ খুব সাধারণ - এই মত একটি টেবিল থেকে রিগ্রেশন মডেল ফলাফল প্রতিবেদনের সীমাবদ্ধ তাই অগ্রহণযোগ্য।

  1. আপনি যেমন উল্লেখ করেছেন, লগইট সহগকে প্রশ্নের পূর্বাভাসকারী হিসাবে অনুমান করা হচ্ছে এমন প্রভাবের কিছু অর্থপূর্ণ ইঙ্গিততে রূপান্তরিত করার চেষ্টা করতে পারেন তবে এটি জটিল এবং ভবিষ্যদ্বাণীটির নির্ভুলতা সম্পর্কে তথ্য প্রকাশ করতে পারে না , যা সাধারণত একটি ক্ষেত্রে বেশ গুরুত্বপূর্ণ লজিস্টিক রিগ্রেশন মডেল (বিশেষত ভোটদানের ক্ষেত্রে)।

  2. এছাড়াও, "স্তরের" তাত্পর্যপূর্ণ হওয়ার জন্য একাধিক তারকাচিহ্নের ব্যবহার এই ভ্রান্ত ধারণাটিকে আরও শক্তিশালী করে যে পি-মানগুলি প্রভাব আকারের কিছু অর্থবহ সূচক ("বাহ - যেটির 3 টি তারকাচিহ্ন রয়েছে !!")); জোরে চিৎকার করার জন্য, ডাব্লু / এন এর 10,000 থেকে 20,000 এর মধ্যে সম্পূর্ণরূপে তুচ্ছ পার্থক্য p <.001 ব্লাহ ব্লাহে "উল্লেখযোগ্য" হবে।

  3. এইভাবে রহস্যময় করার কোনও দরকার নেই। লজিস্টিক রিগ্রেশন মডেল এমন একটি সমীকরণ যা পরিমাপের ত্রুটির সাপেক্ষে ভবিষ্যদ্বাণীকারীদের জন্য নির্দিষ্ট মানগুলিতে শর্তসাপেক্ষে কোনও ফলাফলের সম্ভাবনা পূর্বাভাস দেওয়ার জন্য (গণনা নির্ধারণ করে বা আরও ভাল এখনও সিমুলেশন মাধ্যমে) ব্যবহার করা যেতে পারে equ সুতরাং গবেষক রিপোর্ট করা উচিতআগ্রহের ভবিষ্যদ্বাণীকারীদের প্রভাবের সুদের ফলাফলের পরিবর্তনশীলের সম্ভাব্যতার উপর কী কী প্রভাব রয়েছে, এবং সম্পর্কিত সিআই যেমন ইউনিটগুলিতে পরিমাপ করা হয় যার ব্যবহারিক গুরুত্বটি সহজেই ধরা যায়। প্রস্তুত গ্রাস্পিংয়ের আশ্বাস দেওয়ার জন্য, ফলাফলগুলি গ্রাফিক্যালি প্রদর্শিত হওয়া উচিত। এখানে, উদাহরণস্বরূপ, গবেষক রিপোর্ট করতে পারেন যে একটি শহুরে ভোটারের বিপরীতে পল্লী হওয়ায় এক্স পি সি পয়েন্ট দ্বারা সমান, রিপাবলিকান ভোট দেওয়ার সম্ভাবনা বৃদ্ধি পায় (আমি 2000 সালে 17 এর কাছাকাছি অনুমান করছি; "4 দ্বারা বিভক্ত") একটি যুক্তিযুক্ত হিউরিস্টিক) +/- x% আত্মবিশ্বাসের 0.95 স্তরে - যদি এটি এমন কিছু হয় যা জানার জন্য দরকারী।

  4. সিউডো আর ^ 2 এর প্রতিবেদনটিও একটি লক্ষণ যে মডেলার আলোকিত করার কোনও প্রয়াসের চেয়ে পরিসংখ্যান রীতিতে জড়িত। "সিউডো আর ^ 2" গণনা করার বিভিন্ন উপায় রয়েছে; কেউ অভিযোগ করতে পারেন যে এখানে ব্যবহৃত একটিকে নির্দিষ্ট করা হয়নি তবে কেন বিরক্ত করবেন? সবগুলি অর্থহীনতার পাশে রয়েছে। কেউ সিউডো আর ^ 2 ব্যবহারের একমাত্র কারণ হ'ল তারা বা পর্যালোচক যারা তাদের উপর অত্যাচার করছে তারা শিখেছে (সম্ভবত ২৫ বা তারও বেশি বছর আগে) যে ওএলএস লিনিয়ার রিগ্রেশন হ'ল পরিসংখ্যানের পবিত্র কৌতুক এবং মনে করে যে একমাত্র জিনিসটিই বের করার চেষ্টা করা হচ্ছে "বৈকল্পিক ব্যাখ্যা করা হয়েছে।" লজিস্টিক বিশ্লেষণের জন্য সামগ্রিক মডেলের ফিটের পর্যাপ্ততা নির্ধারণের জন্য প্রচুর স্বীকৃত উপায় রয়েছে এবং সম্ভাবনা অনুপাতটি এমন মডেলগুলির তুলনা করার জন্য অর্থবহ তথ্য সরবরাহ করে যা বিকল্প অনুমানগুলি প্রতিফলিত করে। কিং, জি। কিভাবে পরিসংখ্যানের সাথে মিথ্যা বলা যায় না। অ্যাম। জে পোল সী। 30, 666-687 (1986)।

  5. আপনি যদি এমন একটি কাগজ পড়ে থাকেন যাতে প্রতিবেদন কমবেশি এই জাতীয় সারণীর মধ্যে সীমাবদ্ধ থাকে তবে বিভ্রান্ত হবেন না, ভয় পাবেন না এবং অবশ্যই প্রভাবিত হবেন না; পরিবর্তে রাগান্বিত হন এবং গবেষককে বলুন তিনি বা তিনি একটি লম্পট কাজ করছেন (বিশেষত যদি সে বা সে আপনার স্থানীয় বুদ্ধিজীবী পরিবেশকে ডাব্লু / রহস্যবাদ এবং বিস্ময়কর করে তোলে - আশ্চর্যজনক যে কতগুলি সম্পূর্ণ মধ্যযুগীয় চিন্তাবিদ স্মার্ট লোকদের এমন চিন্তাভাবনা করতে প্ররোচিত করে যে তারা কিছু খালি জানেন? / সি তারা একটি টেবিল তৈরি করতে পারে যা পরবর্তীকরা বুঝতে পারে না)। স্মার্ট, ও সমীকরণীয়, এই ধারণাগুলির প্রকাশের জন্য, কিং, জি।, টমজ, এম। ও উইটেনবার্গ দেখুন। জে। মেকিং সর্বাধিক পরিসংখ্যান বিশ্লেষণ: ব্যাখ্যার উন্নতি ও উপস্থাপনা । অ্যাম। জে পোল সী। 44, 347-361 (2000); এবং গেলম্যান, এ।, পাসারিকা, সি। ও দোদিয়া, আর।আসুন আমরা যা প্রচার করি তা অনুশীলন করুন: টেবিলগুলি গ্রাফগুলিতে পরিণত করা । অ্যাম। তাত্ক্ষণিকবাজার। 56, 121-130 (2002)।


19

এখানে ধারণাটি হ'ল লজিস্টিক রিগ্রেশন-এ, আমরা প্রকৃত সম্ভাবনাটি অনুমান করি না যে, বলা যাক, একজন দক্ষিণদিক রিপাবলিকানকে ভোট দেয়, তবে এর একটি রূপান্তরিত সংস্করণ, "লগ প্রতিক্রিয়া"। সম্ভাব্যতা এর পরিবর্তে আমরা সাথে লেনদেন করি এবং লগ প্রতিক্রিয়াগুলির জন্য লিনিয়ার রিগ্রেশন সহগ খুঁজে পাই ।plogp/(1p)

সুতরাং উদাহরণস্বরূপ, ধরে নেওয়া যাক যে একটি নগর উত্তর-পূর্বের রিপাবলিকানকে ভোট দেওয়ার সম্ভাবনা ০.০ (এটি অবশ্যই রিগ্রেশনের অংশ হতে পারে; আমি এই টেবিলটিতে এটি প্রকাশিত দেখতে পাচ্ছি না, যদিও আমি ধরে নিই যে এটি মূল কাগজে রয়েছে)) এখন, দেয় ; যে, , "লগ অডস" সংশ্লিষ্ট । এই "লগ প্রতিক্রিয়া" রৈখিক আচরণ করে; লগ সংশ্লিষ্ট মতভেদ হয় । সুতরাং একটি শহুরে সাউদার্নার ভোটদানের রিপাবলিকানগুলির লগ প্রতিক্রিয়াগুলি এটি (উইকিপিডিয়া যা ইন্টারসেপ্ট বলে ) দক্ষিণের জন্য লজিস্টিক রিগ্রেশন ,x=1/(1+ez)z=logx1xf1(x)=logx1xx0.3log0.3/0.70.85β00.903 - যা । তবে আপনি প্রকৃত সম্ভাবনা চান, সুতরাং আমাদের ফাংশনটি উল্টাতে হবে । এটি । প্রকৃত প্রতিক্রিয়া থেকে চলে গেছে , থেকে ; অনুপাত হয় , লজিস্টিক প্রত্যাবৃত্তি সহগের সূচকীয়।0.85+0.904=0.05plogp/(1p)f(0.05)1/(1+e0.05)0.510.4311.0511.05/0.43e0.903

তদুপরি, দেশের অঞ্চল এবং শহুরে / শহরতলির / গ্রামীণ অঞ্চলের জন্য প্রভাবগুলি ইন্টারঅ্যাক্ট করে না। সুতরাং একটি পল্লী ভোটদান রিপাবলিকান এর লগ , বলুন, এই মডেল অনুযায়ী ; সম্ভাবনা হ'ল ।f ( 0.20 ) = 1 / ( 1 + - 0.20 ) = 0.550.85+0.37+0.68=+0.20f(0.20)=1/(1+e0.20)=0.55


2
হিউরিস্টিক: 4 দ্বারা ভাগ করুন - লগিট কোফ / 4 এটি প্রায় pct-pt পার্থক্যযুক্ত prob 1 ইউনিট পরিবর্তন থেকে। এটি "ব্যক্তি ডাব্লু / ubসুবন চার্টারস্টিস্টিক = জেড x% এর সম্ভাবনাযুক্ত বলে বলার মতো নয়।" কেবল (যেমন হিসাবে উল্লেখ করা হয়েছে) কেবল রেফ ক্লাসের সাথে যুক্ত সাব -0 এবং বিয়োগের সম্ভাবনাও যুক্ত করতে হবে না। ভবিষ্যদ্বাণীকারী কলিনারিটির অ্যাকাউন্ট নেওয়াও প্রয়োজনীয়। বি / সি দক্ষিণাঞ্চলীয় অন্যান্য ভবিষ্যদ্বাণীকের সাথে সম্পর্কিত, এটি সঠিক হবে না। সাউথার্নার ভোটদানের পুনর্নির্মাণটি হ'ল 0সুব0 - দক্ষিণ পূর্বের জন্য রূপান্তরিত লগ প্রতিক্রিয়া প্লাস রূপান্তরিত লগ ds বলা ভাল, "দক্ষিণে থেকে সমান, এক্স
পি সি

1
'প্রকৃত প্রতিক্রিয়া 0.43 থেকে 1 এ চলে গেছে'। 0.43 প্রথম স্থান থেকে এসেছিল?
মনিকা হেডনেক

মূল সম্ভাব্যতা , যখন মতভেদ হিসাবে প্রকাশ করা হয় । 0.3 / ( 1 - 0.3 ) 0.430.30.3/(10.3)0.43
মাইকেল লুগো

6

লজিস্টিক রিগ্রেশনের সহগগুলি কোনও রেফারেন্স বিভাগের তুলনায় একটি প্রদত্ত অঞ্চল / ডেমোগ্রাফিকদেরকে রিপাবলিকানকে ভোট দেওয়ার প্রবণতা উপস্থাপন করে। একটি ইতিবাচক সহগ বলতে বোঝায় যে অঞ্চলটি রিপাবলিকানকে ভোট দেওয়ার সম্ভাবনা বেশি, এবং নেতিবাচক সহগের পক্ষে তদ্বিপরীত; বৃহত্তর পরম মান মানে একটি ছোট মানের চেয়ে শক্তিশালী প্রবণতা।

রেফারেন্স বিভাগগুলি "উত্তরপূর্ব" এবং "নগর ভোটার", সুতরাং সমস্ত সহগ সহ এই নির্দিষ্ট ভোটার প্রকারের সাথে বৈপরীত্য উপস্থাপন করে।

সাধারণভাবে, লজিস্টিক রিগ্রেশনটিতে সহগের উপর [0, 1], এমনকি পরম মানতেও কোনও বাধা নেই। লক্ষ্য করুন যে উইকিপিডিয়া নিবন্ধে নিজেই -5 এবং 2 এর সহগ সহ একটি লজিস্টিক রিগ্রেশন উদাহরণ রয়েছে।


5

আপনি "জিজ্ঞাসা করেছিলেন কীভাবে আমি কীভাবে তাৎপর্যপূর্ণ এবং কোনটি নয়"। (আমি ধরে নিচ্ছি যে আপনি পরিসংখ্যানগতভাবে তাত্পর্যপূর্ণ বলতে চাইছেন, যেহেতু ব্যবহারিক বা বাস্তব তাত্পর্য অন্য বিষয়)) টেবিলের নক্ষত্রগুলি পাদটীকাটি উল্লেখ করে: কিছু প্রভাব ছোট পি- মূল্যায়ন হিসাবে চিহ্নিত হয়। এগুলি প্রতিটি সহগের তাত্পর্যটির ওয়াল্ড পরীক্ষা ব্যবহার করে প্রাপ্ত হয়। এলোমেলো নমুনা ধরে নিলে , পি <.05 এর অর্থ হ'ল, বৃহত্তর জনগোষ্ঠীতে যদি এরকম কোনও প্রভাব না ঘটে, তবে এই আকারের নমুনায় একটি সংযোগ যেমন দেখা হয়েছে তত শক্তিশালী বা শক্তিশালী দেখার সম্ভাবনা কম রয়েছে ।05 এর চেয়ে কম হবে । আপনি এই সাইটে অনেক থ্রেড দেখতে পাবেন সূক্ষ্ম তবে গুরুত্বপূর্ণ সম্পর্কিত পয়েন্ট যা পি <.05 না বলে আলোচনা করছে এর অর্থ যে বৃহত্তর জনগোষ্ঠীর সাথে সংযোগ না থাকার সম্ভাবনা রয়েছে।


5

আমাকে কেবল রোল্যান্ডো 2 এবং dmk38 উভয়ই উল্লেখ করেছেন তার গুরুত্বের উপরে জোর দিন: তাত্পর্যটি সাধারণত ভুলভাবে লেখা হয়, এবং ফলাফলগুলির টবুলার উপস্থাপনার সাথে এটি হওয়ার ঝুঁকি রয়েছে।

পল শ্রড্ট সম্প্রতি সমস্যার একটি সুন্দর বর্ণনা দিয়েছেন:

গবেষকরা তাৎপর্য পরীক্ষার সঠিক ব্যাখ্যা মেনে চলা প্রায় অসম্ভব বলে মনে করেন। পি-মান আপনাকে কেবলমাত্র সম্ভাবনা বলে দেয় যে আপনি নাল অনুমানের সম্পূর্ণরূপে অবাস্তব অবস্থার অধীনে একটি ফলাফল পাবেন। যা আপনি জানতে চান তা নয় — আপনি সাধারণত একটি স্বাধীন ভেরিয়েবলের প্রভাবের দৈর্ঘ্যটি জানতে চান, ডেটা দেওয়া। এটি একটি বায়েশিয়ান প্রশ্ন, ঘন ঘন প্রশ্ন নয়। পরিবর্তে আমরা দেখতে পাই — ক্রমাগত — পি-মানটিকে ব্যাখ্যা করা যেন এটি সংযুক্তির শক্তি দেয়: এটি তারার এবং পি-ভ্যালুগুলির সর্বব্যাপী মাইস্টিকাল কাল্ট যা আমাদের জার্নালে ছড়িয়ে পড়ে। (Fn) এটি পি-ভ্যালু বলে না , না কখনও তা হবে না।

আমার অভিজ্ঞতায়, এই ভুলটি এড়ানো প্রায় অসম্ভব: এমনকি খুব সচেতন বিশ্লেষকরা যারা সমস্যা সম্পর্কে পুরোপুরি সচেতন তারা প্রায়শই মৌখিকভাবে তাদের ফলাফলগুলি নিয়ে আলোচনা করার সময় মোডগুলি স্যুইচ করবেন, এমনকি তারা কোনও লিখিত বিবরণে সমস্যাটি এড়িয়ে গেছেন। এবং এমনকি কালি হাজার হাজার ঘন্টা এবং গ্যালন সম্পর্কে অনুমান করা যাক আমরা স্নাতক পত্রগুলিতে এটি সংশোধন করতে ব্যয় করেছি।

(এফএন) পাদটীকা dmk38 দ্বারা উল্লিখিত অন্য একটি ইস্যুতেও অবহিত করেছে: "[তারকারা ও পি-ভ্যালুগুলির সর্বব্যাপী রহস্যবাদী সম্প্রদায়] পূর্বের equally এবং সমানভাবে বিস্তৃত — উচ্চতম আর -2 এর কল্টকে ভেঙে ফেলা হয়েছে ... কিং দ্বারা (1986) । "


ও-- আমি স্রেফ আমার সম্পাদিত প্রতিক্রিয়ার সাথে কিং উদ্ধৃতি যুক্ত করেছি। প্রবন্ধটি সত্যিকার অর্থে রি the 2 ম্যানিয়া (একনোমেট্রিক্সে এখনও স্থায়ী) ধ্বংস করে দেয় যেখানে এমনকি পরিসংখ্যানগুলির একটি অর্থ রয়েছে - ওএলএস প্রতিরোধের জন্য। কিং আরও উল্লেখ করেছেন যে সিউডো আর ^ 2 হ'ল জিব্বারিশ যা "ভেরিয়েন্সের সাথে ব্যাখ্যা করা" এর সাথে সম্পর্কিত উদ্বিগ্নতা বৃদ্ধির জন্য তৈরি করা হয়েছিল।
dmk38
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.