মডেল জুড়ে লজিস্টিক রিগ্রেশন সহগের তুলনা করছেন?


11

আমি ক্রস-বিভাগীয় তথ্য ছয়টি বিভিন্ন সেট প্রয়োগ করতে একটি লগইট মডেল তৈরি করেছি। আমি যে বিষয়টি উন্মোচন করার চেষ্টা করছি তা হ'ল নির্ভরযোগ্য ভেরিয়েবলের (ডিভি) বিভিন্ন সময়ে এবং সময়ের সাথে সাথে অন্যান্য নিয়ন্ত্রণের জন্য নিয়ন্ত্রণাধীন প্রদত্ত স্বতন্ত্র ভেরিয়েবলের (আইভি) সংক্ষিপ্ত প্রভাবের পরিবর্তন রয়েছে কিনা।

আমার প্রশ্নগুলি হ'ল:

  • চতুর্থ এবং ডিভির মধ্যে সংযুক্তিতে আমি কীভাবে বর্ধিত / হ্রাস আকারটি মূল্যায়ন করব?
  • আমি কি সহজেই মডেলগুলি জুড়ে সহগের বিভিন্ন মাত্রা (আকার) দেখতে পারি বা অন্য কোনও প্রক্রিয়াটি নিয়ে যাওয়ার দরকার আছে?
  • আমার যদি অন্য কিছু করার দরকার হয় তবে এটি কী এবং এটি করা যায় / এসপিএসএসে এটি কীভাবে করব?

    এছাড়াও, একটি একক মডেলের মধ্যে,

  • যদি সমস্ত 0-1 কোড করে থাকে বা আমার কি তাদের মানকৃত স্কোরগুলিতে রূপান্তর করতে হবে তবে আমি স্ট্যান্ডার্ড স্কোরগুলির ভিত্তিতে স্বতন্ত্র ভেরিয়েবলের আপেক্ষিক আকারের তুলনা করতে পারি?
  • মানকৃত স্কোরগুলির সাথে কি সমস্যা রয়েছে?

2
এই নিবন্ধটি আগ্রহী হতে পারে, dx.doi.org/10.1093/esr/jcp006 , স্পষ্টতই লজিস্টিক মডেলগুলির মধ্যে প্রভাবগুলির তুলনা ওএলএসের ক্ষেত্রে তুলনায় যথেষ্ট জটিল!
অ্যান্ডি ডাব্লু

উত্তর:


13

আমি মূলত আপনার প্রথম তিনটি প্রশ্নের উপর ফোকাস করব। সংক্ষিপ্ত উত্তরগুলি হ'ল: (1) আপনার প্রতিটি সময়কালের জন্য ডিভিতে চতুর্থ এর প্রভাব তুলনা করতে হবে তবে (2) মাত্রার সাথে তুলনা করলে ভুল সিদ্ধান্তে পৌঁছতে পারে এবং (3) এটি করার অনেক উপায় আছে তবে যেটি সঠিক তা নিয়ে কোন sensক্যমত্য নেই।

নীচে আমি বর্ণনা করছি যে আপনি কেবল সহগ মাত্রার তুলনা করতে পারবেন না এবং আপনাকে এমন কিছু সমাধানের দিকে নির্দেশ করতে পারেন যা এখন পর্যন্ত চিন্তা করা হয়েছে।

অ্যালিসনের (১৯৯৯) মতে ওএলএসের বিপরীতে, লজিস্টিক রিগ্রেশন কো-কোফিয়েন্টসগুলি অরক্ষিত বৈজাতীয়তার দ্বারা প্রভাবিত হয় এমনকি যখন এই জাতীয় বৈচিত্র্য আগ্রহের পরিবর্তনশীলতার সাথে সম্পর্কিত না হয়।

আপনি যখন কোনও লজিস্টিক রিগ্রেশন ফিট করেন তবে:

(1)

ln(11pi)=β0+β1x1i

আপনি আসলে একটি সুপ্ত পরিবর্তনশীল এর মান পূর্বাভাসের একটি সমীকরণ ফিটিং করছেন যা বাইনারি নির্ভরশীল ভেরিয়েবলের মান অনুমান করার জন্য প্রতিটি পর্যবেক্ষণের অন্তর্নিহিত প্রবণতা উপস্থাপন করে , যদি একটি নির্দিষ্ট চৌম্বের উপরে থাকে তবে কী ঘটে । এর সমীকরণটি হ'ল (উইলিয়ামস, ২০০৯): 1 y y1y

(2)

y=α0+α1x1i+σε

শব্দটি অন্যান্য শর্ত থেকে স্বতন্ত্র বলে ধরে নেওয়া হয় এবং একটি লজিস্টিক বিতরণ অনুসরণ করতে পারে - বা প্রবিটের ক্ষেত্রে একটি সাধারণ বিতরণ এবং পরিপূরক লগ-লগের ক্ষেত্রে একটি লগ-লজিস্টিক বিতরণ এবং ক্ষেত্রে একটি বিতর্কিত বিতরণ cauchit।ε

উইলিয়ামস (২০০৯) এর মতে, সমীকরণ 2- এ সহগগুলি সমীকরণ 1 এর মধ্যে সহগের সাথে সম্পর্কিত :বিটাαβ

(3)

βj=αjσj=1,...,J.

2 এবং 3 সমীকরণগুলিতে, হ'ল অরক্ষিত প্রকরণের স্কেলিং ফ্যাক্টর এবং আমরা দেখতে পাচ্ছি যে অনুমিত সহগের আকার of উপর নির্ভর করে , যা পর্যবেক্ষণ করা হয় না। এর ভিত্তিতে, অ্যালিসন (1999), উইলিয়ামস (২০০৯), এবং মুড (২০০৯), অন্যদের মধ্যে, দাবি করেছেন যে আপনি বিভিন্ন গ্রুপ, দেশ বা পিরিয়ডের জন্য অনুমান করা লজিস্টিক মডেলগুলির মধ্যে নির্বিচারে গুণের তুলনা করতে পারবেন না।β σσβσ

এর কারণ কারণ তুলনাগুলি যদি ভুল গ্রুপ, দেশ বা পিরিয়ডের মধ্যে অননक्षित সংরক্ষিত প্রকরণের পার্থক্য করে তবে ভুল সিদ্ধান্ত নেওয়া হতে পারে। উভয় তুলনা বিভিন্ন মডেল ব্যবহার করে এবং একই মডেলের মধ্যে ইন্টারঅ্যাকশন পদ ব্যবহার করে এই সমস্যায় ভুগছে। লজিট ছাড়াও, এই লিঙ্ক ফাংশনগুলি ব্যবহার করে অনুমানযোগ্য সময় বিপদ মডেলগুলিকে আলাদা করার জন্য এটি তার কাজিন্স প্রবিট, ক্লগ-লগ, কৌচিট এবং এক্সটেনশন দ্বারা প্রযোজ্য। অর্ডারযুক্ত লজিট মডেলগুলি এটি দ্বারা প্রভাবিত হয়।

উইলিয়ামস (২০০৯) যুক্তি দেখিয়েছেন যে সমাধানটি হ'ল ভিন্নজাতীয় পছন্দ মডেল (ওরফে, একটি লোকেশন-স্কেল মডেল) এর মাধ্যমে অরক্ষিত পরিবর্তনকে মডেল করা এবং এটির oglm (উইলিয়ামস ২০১০) নামক স্টাটা অ্যাড সরবরাহ করে । আর-তে, ভিন্ন ভিন্ন পছন্দের মডেলগুলি প্যাকেজের hetglm()ক্রিয়াকলাপের সাথে উপযুক্ত হতে পারে glmxযা CRAN এর মাধ্যমে উপলব্ধ। উভয় প্রোগ্রাম ব্যবহার করা খুব সহজ। সবশেষে, উইলিয়ামস (২০০৯) এসপিএসএসের PLUMএই মডেলগুলির ফিটনেসের রুটিনির কথা উল্লেখ করেছে, তবে আমি কখনই এটি ব্যবহার করি নি এবং এটি ব্যবহার করা কতটা সহজ তা নিয়ে কোনও মন্তব্য করতে পারি না।

তবে, সেখানে কমপক্ষে একটি কার্যকারী কাগজ রয়েছে যাতে দেখা যাচ্ছে যে বৈকল্পিক সমীকরণটি ভুল বানানো থাকলে বা পরিমাপের ত্রুটি থাকলে ভিন্ন ভিন্ন পছন্দসই মডেল ব্যবহার করে তুলনাগুলি আরও পক্ষপাতদুষ্ট হতে পারে।

মেজাজ (2010) অন্যান্য সমাধানগুলিতে তালিকাবদ্ধ করে যা বৈকল্পিকের মডেলিংয়ের সাথে জড়িত না, তবে পূর্বাভাসের সম্ভাবনা পরিবর্তনের তুলনা ব্যবহার করে।

স্পষ্টতই এটি এমন একটি সমস্যা যা মীমাংসিত হয় না এবং আমি প্রায়শই আমার ক্ষেত্রের সম্মেলনে কাগজপত্রগুলি দেখতে পাই (সমাজবিজ্ঞান) এর বিভিন্ন সমাধান নিয়ে আসে। আমি আপনাকে পরামর্শ দিচ্ছি আপনার ক্ষেত্রের লোকেরা কী করবে তা দেখুন এবং তারপরে কীভাবে এটি মোকাবেলা করবেন তা স্থির করুন।

তথ্যসূত্র


আমি আর-তে উইলিয়ামস (২০০৯) সমাধানটি প্রয়োগ করার চেষ্টা করছি এবং মনে হচ্ছে যে গ্ল্যামেক্স প্যাকেজের নতুন সংস্করণে হেটপ্রব () ফাংশন নেই। আপনি কি এর কোনও বিকল্প জানেন কিনা তা খালি পরীক্ষা করতে চেয়েছিলেন?
আলিসিভিল

1
আমি কিছুক্ষণের মধ্যে গ্ল্যাম্যাক্স ব্যবহার করিনি এবং জানি না যে এটির পরিবর্তন হয়েছে। এখন এটি সিআরএএন এর মাধ্যমে উপলব্ধ, এবং হেরোস্কেস্টেস্টিক প্রবিটের জন্য ব্যবহৃত ফাংশনটিকে হিটগলম () বলা হয়, স্পষ্টতই। এটি পরে প্রতিফলিত করার জন্য আমি এই উত্তরটি আপডেট করব (এটি এখানে বিছানার সময় প্রায়)। আমি আশা করি এটি আপাতত সহায়তা করে।
কেনজি

3

ডেটা সেট জুড়ে পরিবর্তন আছে? আমি তথ্য না দেখে উত্তর দিতে পারি! হ্যাঁ. সেখানে. তারা কত বড়? এটা কি। আমার জন্য দেখার উপায়টি হচ্ছে অনুসন্ধান করা। প্রতিটি ডেটা সেটের জন্য প্রতিটি স্বতন্ত্র ভেরিয়েবলের জন্য আপনার পক্ষে মতভেদ অনুপাত থাকবে - লোকেরা আকর্ষণীয় বলে দেখানোর উপায়গুলি কি সেগুলি থেকে আলাদা? এখন, এটি সত্য যে প্রত্যেকের একটি স্ট্যান্ডার্ড ত্রুটি থাকবে এবং ততই রয়েছে এবং সম্ভবত তারা উপায়গুলিও দেখতে পাচ্ছেন যে তারা পরিসংখ্যানগতভাবে একে অপরের থেকে উল্লেখযোগ্যভাবে পৃথক কিনা, তবে এটি কি সত্যিই একটি আকর্ষণীয় প্রশ্ন? যদি এটি হয়, তবে সফ্টওয়্যার দিয়ে এটি সহজে পরীক্ষা করার একটি উপায় হ'ল সমস্ত অধ্যয়ন একত্রিত করা এবং "অধ্যয়ন" কে অন্য স্বতন্ত্র ভেরিয়েবল হিসাবে অন্তর্ভুক্ত করা। আপনি চাইলে আপনি এমনকি মিথস্ক্রিয়াও পরীক্ষা করতে পারেন। আপনি এটি করতে চান কিনা তা আপনার নির্ভরযোগ্য প্রশ্নের উপর নির্ভর করে।

কোনও মডেলের মধ্যে ভেরিয়েবলের সাথে তুলনা করার ক্ষেত্রে, প্রমিত স্কোরগুলির সাথে প্রধান সমস্যাটি হ'ল সেগুলি আপনার নির্দিষ্ট নমুনায় মানক করা হয়। সুতরাং, প্যারামিটারের অনুমানগুলি এবং তারপরে আপনার নির্দিষ্ট নমুনায় ভেরিয়েবলগুলির স্ট্যান্ডার্ড বিচ্যুতিগুলির শর্তাবলী। এমনকি যদি আপনার নমুনাটি কিছু জনগোষ্ঠীর থেকে এলোমেলো নমুনা হয় তবে এটি অন্যান্য এলোমেলো নমুনাগুলির থেকে কিছুটা স্ট্যান্ডার্ড বিচ্যুতিও ঘটবে। এটি বিভ্রান্তিকর করে তোলে।

অন্য সমস্যাটি হ'ল "আপেক্ষিক আকার" এর প্রশ্নটি কী বোঝায়। যদি আপনার আইভিগুলি এমন জিনিসগুলি হয় যা ভালভাবে বোঝা যায় তবে আপনি ওআরগুলি রেঞ্জগুলি জুড়ে তুলনা করতে পারেন যার অর্থ কিছু।


এই দরকারী, ধন্যবাদ পিটার। আমি প্রথম প্রশ্নটি জিজ্ঞাসা করার কারণটি হ'ল আমি ঠিক তা দেখেছি - একটি নমুনার মধ্যে মডেল জুড়ে সহগের তুলনা এবং বিভিন্ন নমুনা থেকে মডেলগুলির মধ্যে তুলনা - রেফার্ড পেপারগুলিতে। আমি অনুভব করি নি যে এটি সঠিক পদ্ধতি ছিল এবং স্পষ্টতই আমি সঠিক correct প্রযুক্তিগত বিবরণ সম্পর্কে, আমি কেবলমাত্র সমস্ত ছয়টি নমুনার উপর একটি মডেল এবং আমি যে মূল ভবিষ্যদ্বাণীকে তুলনা করতে চাই এবং প্রতিটি নমুনাকে নির্দিষ্ট করে একটি পরিবর্তনশীল (একটি ভিন্ন সময়কাল উপস্থাপন করে) এর মধ্যে একটি ইন্টারেকশন টার্মটি অনুমান করতে পারি না? তুমি কি বলছ? আমার কি প্রতিটি
এসের

হাই @ ইজেস ডামি কোডিং বা এফেক্ট কোডিং বা যা কিছু হোক না কেন আপনার "নমুনা" কোডটি অন্য যে কোনও শ্রেণিবদ্ধ ভেরিয়েবলের মতো একইভাবে করা দরকার।
পিটার ফ্লুম - মনিকা পুনরায়

মিথস্ক্রিয়া সম্পর্কে .... হ্যাঁ, তাদের ব্যাখ্যা করা কঠিন হতে পারে। তাদের অর্থ কী তা বোঝাতে আমি গ্রাফিকাল পদ্ধতির পছন্দ করি।
পিটার ফ্লুম - মনিকা পুনরায়

3

গিলহার্ম এখানে অর্থের উপর রয়েছে। অন্যান্য প্রতিক্রিয়াগুলি কার্যকর হওয়ার সময়, দয়া করে নোট করুন যে লজিস্টিক রিগ্রেশন (এবং এই বিষয়ে পোইসনের মতো সমস্ত ননরেখা রেগ্রেশন) লিনিয়ার রিগ্রেশন-এর চেয়ে মূলত পৃথক। ছয়টি পৃথক ডেটা সেটগুলিতে একই বিশ্লেষণ চালানো এবং তারপরে সম্মিলিত ডেটা সেটে সেই বিশ্লেষণ চালানোর সময় লগইট স্কেলিং ফ্যাক্টর নিয়ে গুরুতর সমস্যা হতে পারে। সহগের পরিবর্তনগুলির অর্থপূর্ণ পার্থক্যের সাথে কিছু নাও থাকতে পারে (এমনকি যদি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ বা তাত্পর্যপূর্ণভাবে গুরুত্বপূর্ণ)। নমুনাগুলি জুড়ে তারা অননक्षित সংরক্ষিত বৈচিত্র্যের সাথে যা কিছু করতে পারে। আপনাকে একেবারে পরীক্ষা করতে হবে। সামাজিক এবং নীতি বিজ্ঞানের ক্ষেত্রে অনেক (যদিও বেশিরভাগ নয়) গবেষকরা এটিকে উপেক্ষা করেন। গিলহার্ম এই বিষয়ে চূড়ান্ত নিবন্ধ দেয় যা আমি প্রত্যেককে দেখার পরামর্শ দিই। পিটারস পরামর্শগুলি ব্যবহারিক, কিন্তু তথ্যটি যে নমুনা থেকে আসে তার জন্য কেবল একটি ডামি ভেরিয়েবল কোডিং করা স্কেলিং ফ্যাক্টারে এই বৈষম্যকে চিহ্নিত করবে না। আপনি লিনিয়ার রিগ্রেশন এ এটি করতে পারেন এবং বৈজাতীয়তা আপনার সহগকে প্রভাবিত করবে না, তবে এখানে এটি হতে পারে।

লিনিট বনাম লিনিয়ার রিগ্রেশন অনন্য সংরক্ষিত ভিন্ন ভিন্নতার প্রভাবের আরেকটি দিক হ'ল প্রতিটি ডেটা সেটে বিভিন্ন রেজিস্ট্রারের প্রভাব। আপনার যদি একই ভেরিয়েবল না থাকে বা সম্ভবত সেগুলি আলাদাভাবে পরিমাপ করা হয় তবে আপনার বাদ দেওয়া পরিবর্তনশীল পক্ষপাতিত্ব রয়েছে of লিনিয়ার রিগ্রেশন-এর বিপরীতে, আপনার কী নিবন্ধকের কাছে বাদ দেওয়া পরিবর্তনশীল অर्थোগোনাল এখনও আপনার অনুমানটিকে পক্ষপাত করতে পারে। ক্র্যামার যেমন রাখে:

এমনকি অরথোগোনাল রেজিস্ট্রারগুলির পরেও, বাদ দেওয়া ভেরিয়েবলগুলি zero শূন্যের দিকে হ্রাস করে, সম্পূর্ণ সমীকরণের তুলনায় এর মান তুলনায়। অন্য কথায়, বিচ্ছিন্ন মডেলের বিচ্ছিন্নভাবে পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক পৃথক vary ব্যবহারিক পরিণতি হ'ল এই ক্ষেত্রে যে নমুনাগুলি থেকে পৃথক হয় সেগুলি থেকে অনুমানগুলি সরাসরি তুলনীয় নয়। ( http://dare.uva.nl/docament/2/96199 )β^β^

ক্র্যামার আরও উল্লেখ করে যদিও কোনও চলক বাদ দেওয়ার সময় সহগের অনুমানগুলি নিম্নমুখী হয় তবে আংশিক ডেরিভেটিভগুলি হয় না। এটি মোটামুটি জটিল এবং আরও সুস্পষ্ট ব্যাখ্যার জন্য আপনার নিবন্ধটি পড়া উচিত - সামগ্রিক বিষয়টি হ'ল লগ-প্রতিক্রিয়া বা প্রতিকূলতার অনুপাতটি একচেটিভাবে দেখবেন না। পূর্বাভাসযুক্ত সম্ভাবনা এবং ডেরাইভেটিভগুলি বিবেচনা করুন; আরও তথ্যের জন্য স্টাটাতে মার্জিন কমান্ডটি দেখুন। জেডি লংয়ের একটি কাগজ রয়েছে যা এখানে বিস্তারিতভাবে যায়।

অবশেষে, লগইট মডেলগুলিতে ইন্টারঅ্যাকশন শর্তাদি নিয়ে আলোচনা করতে গুগল করতে পারেন এমন বেশ কয়েকটি কাগজপত্র রয়েছে। আমার বোধগম্যতাটি হ'ল গাইড হিসাবে কোনও ইন্টারঅ্যাকশনের জন্য লগিট সহগকে গ্রহণ করা কিন্তু চূড়ান্ত নয়, বিশেষত যদি আপনি সহগকে তীব্র প্রতিকূল অনুপাত হিসাবে দেখতে পছন্দ করেন। পূর্বাভাসযুক্ত সম্ভাবনার দিকে লক্ষ্য করা এবং গড় প্রান্তিক প্রভাব আরও ভাল (আবার, লগিটের জন্য স্টাটার মার্জিন কমান্ডের ডকুমেন্টেশন সন্ধান করুন, এমনকি আপনি এসপিএসএস ব্যবহার করলেও এটি সহায়ক হবে)।

এই প্যাকেজটি কীভাবে এই সমস্যাগুলি মোকাবেলা করতে পারে তা জানার জন্য আমি এসপিএসএসের সাথে যথেষ্ট পরিচিত নই, তবে আমি এটিই বলব: আপনি যখন এইরকম গভীর পরিসংখ্যানগত সমস্যায় পড়েন, তখন এটি ইঙ্গিত দেয় যে আপনার আরও সময় নিয়ে যাওয়ার সময় এসেছে an স্টাটা বা আর এর মতো নমনীয়, পরিশীলিত প্যাকেজ


প্রান্তিক প্রভাবের প্রস্তাব দেওয়ার জন্য এবং আর
কেনজি

1

আর একটি সরঞ্জাম যা কার্যকর হতে পারে তা হ'ল মানকযুক্ত রেগ্রেশন সহগ বা কমপক্ষে একটি রুক্ষ এবং প্রস্তুত সিউডো সংস্করণ। আপনি পূর্বাভাসীর স্ট্যান্ডার্ড বিচ্যুতি দ্বারা আপনার প্রাপ্ত গুণাগুণকে গুণ করে এই জাতীয় একটি সংস্করণ পেতে পারেন। (সেরা সংস্করণ সম্পর্কে অন্যান্য সংস্করণ এবং কিছু বিতর্ক রয়েছে, উদাহরণস্বরূপ মেনার্ড 2002, অ্যাপ্লাইড লজিস্টিক রিগ্রেশন অ্যানালাইসিস ( গুগল বই ) দেখুন)। এটি আপনাকে অধ্যয়ন জুড়ে প্রভাবের শক্তি নির্ধারণের জন্য একটি উপায় দেবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.