সম্পূর্ণ সাফল্য সহ শ্রেণীবদ্ধ ভেরিয়েবলের সাথে দ্বিপদী গ্লিম


11

আমি দ্বিপদী প্রতিক্রিয়া ভেরিয়েবল এবং একটি স্পষ্টিকর ভবিষ্যদ্বাণী নিয়ে একটি গ্ল্যাম চালাচ্ছি। এলোমেলো প্রভাব ডেটা সংগ্রহের জন্য ব্যবহৃত নেস্টেড ডিজাইন দ্বারা দেওয়া হয়। ডেটা দেখতে এমন দেখাচ্ছে:

m.gen1$treatment
 [1] sucrose      control      protein      control      no_injection .....
Levels: no_injection control sucrose protein
m.gen1$emergence 
 [1]  1  0  0  1  0  1  1  1  1  1  1  0  0....
> m.gen1$nest
 [1] 1  1  1  2  2  3  3  3  3  4  4  4  .....
Levels: 1 2 3 4 5 6 8 10 11 13 15 16 17 18 20 22 24

আমি চালিত প্রথম মডেলটি দেখতে এমন দেখাচ্ছে

m.glmm.em.<-glmer(emergence~treatment + (1|nest),family=binomial,data=m.gen1)

আমি দেখতে দুটি সতর্কতা পেয়েছি যা দেখতে দেখতে:

Warning messages:
1: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
  Model failed to converge with max|grad| = 0.0240654 (tol = 0.001, component 4)
2: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
  Model is nearly unidentifiable: large eigenvalue ratio
 - Rescale variables?

মডেল সংক্ষিপ্তসারটি দেখায় যে চিকিত্সাগুলির একটিতে অস্বাভাবিকভাবে বড় স্ট্যান্ডার্ড ত্রুটি রয়েছে, যা আপনি এখানে দেখতে পারেন:

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)  
(Intercept)         2.565      1.038   2.472   0.0134 *
treatmentcontrol   -1.718      1.246  -1.378   0.1681  
treatmentsucrose   16.863   2048.000   0.008   0.9934  
treatmentprotein   -1.718      1.246  -1.378   0.1681 

আমি গ্লোমার কন্ট্রোল এবং অন্যান্য প্যাকেজগুলির ফাংশন থেকে বিভিন্ন অপটিমাইজার চেষ্টা করেছি এবং আমি একই রকম আউটপুট পাই। আমি এলোমেলো প্রভাবটিকে উপেক্ষা করে গ্ল্যাম ব্যবহার করে মডেলটি চালিয়েছি, এবং সমস্যাটি অব্যাহত রয়েছে। ডেটা অন্বেষণের সময় আমি বুঝতে পারি যে উচ্চমানের সাথে চিকিত্সা করা হয়েছে। ত্রুটির প্রতিক্রিয়া পরিবর্তনশীলটিতে কেবল সাফল্য রয়েছে। এই সমস্যাটি হতে পারে কিনা তা খতিয়ে দেখার জন্য আমি সেই চিকিত্সার জন্য "ব্যর্থতা" সহ একটি জাল ডেটা পয়েন্ট যুক্ত করেছি এবং মডেলটি সুচারুভাবে চলে এবং যুক্তিসঙ্গত মানক ত্রুটি দেয়। আপনি এখানে দেখতে পারেন:

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)  
(Intercept)        3.4090     1.6712   2.040   0.0414 *
treatmentcontrol  -1.8405     1.4290  -1.288   0.1978  
treatmentsucrose  -0.2582     1.6263  -0.159   0.8738  
treatmentprotein  -2.6530     1.5904  -1.668   0.0953 .

আমি ভাবছিলাম যে আমার অনুজ্ঞানটি যদি এই চিকিত্সাটির জন্য কোনও ভাল অনুমানের প্রতিরোধকারী ব্যর্থতার অভাব সম্পর্কে সঠিক হয় এবং আমি কীভাবে এই সমস্যাটি নিয়ে কাজ করতে পারি।

আগাম ধন্যবাদ!

উত্তর:


15

আপনার অন্তর্দৃষ্টি ঠিক সঠিক। এই ঘটনাটিকে সম্পূর্ণ বিচ্ছেদ বলা হয় । চারপাশে গুগলিং আপনি বেশ কিছু খুঁজে পেতে পারেন (এখন আপনি এটির নামটি জানেন) ... এটি একটি সাধারণ প্রসঙ্গে এবং এখানে জিএলএমএমসের প্রসঙ্গে এখানে মোটামুটিভাবে পুরোপুরি আলোচনা করা হয়েছে । এই সমস্যার স্ট্যান্ডার্ড সমাধান হ'ল একটি ছোট শব্দ যুক্ত করা যা প্যারামিটারগুলিকে শূন্যের দিকে পিছনে ঠেলে দেয় - ঘন ঘনবাদী প্রসঙ্গে তাকে দন্ডিত বা পক্ষপাত-সংশোধন পদ্ধতি বলা হয়। স্ট্যান্ডার্ড অ্যালগরিদমটি জন্মের কারণে (1993, " বায়োমেট্রিক 80, 27-38 সর্বাধিক সম্ভাবনা অনুমানের বায়াস হ্রাস ), এবং লজিস্টফ প্যাকেজে প্রয়োগ করা হয়CRAN এ। বায়েসীয় প্রসঙ্গে এইটিকে স্থির-প্রভাবের পরামিতিগুলির আগে দুর্বল যুক্ত হিসাবে চিহ্নিত করা হয়।

আমার জানা মতে, ফারথের অ্যালগরিদম জিএলএমএমগুলিতে প্রসারিত হয়নি, তবে আপনি ব্লাইম প্যাকেজটি ব্যবহার করে বয়েসিয়ান ট্রিক ব্যবহার করতে পারেন , যা প্যাকেজের শীর্ষে একটি পাতলা বায়েশিয়ান স্তর রাখে lme4। উপরের লিঙ্কযুক্ত জিএলএমএম আলোচনা থেকে এখানে একটি উদাহরণ দেওয়া হয়েছে:

cmod_blme_L2 <- bglmer(predation~ttt+(1|block),data=newdat,
                   family=binomial,
                   fixef.prior = normal(cov = diag(9,4)))

এই উদাহরণের প্রথম দুটি লাইন হ'ল আমরা স্ট্যান্ডার্ড glmerমডেলটিতে ব্যবহার করব ঠিক তেমনই; শেষটি নির্দিষ্ট করে যে স্থির প্রভাবগুলির পূর্ববর্তীটি একটি তির্যক ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স সহ বহুবিধ সাধারণ বিতরণ। ম্যাট্রিক্সটি 4x4 (কারণ আমাদের এই উদাহরণে 4 টি নির্দিষ্ট-প্রভাবের পরামিতি রয়েছে), এবং প্রতিটি প্যারামিটারের পূর্বের পার্থক্যটি 9 হয় (3 এর মানক বিচ্যুতির সাথে মিলিত, যা বেশ দুর্বল - যার অর্থ +/- 2SD হয় ( -6,6), যা লগইট স্কেলে খুব বড় পরিসীমা)।

আপনার উদাহরণের পরামিতিগুলির খুব বড় স্ট্যান্ডার্ড ত্রুটিগুলি সম্পূর্ণ বিচ্ছিন্নতার সাথে ঘনিষ্ঠভাবে সম্পর্কিত কোনও ঘটনার উদাহরণ (এটি যখনই ঘটে আমরা লজিস্টিক মডেলটিতে চূড়ান্ত পরামিতি মান পাই) হাক-ডোনার ইফেক্ট বলে

আরও দুটি সম্ভাব্য দরকারী তথ্যসূত্র (আমি এখনও এগুলিতে খনন করি নি):

  • গেলম্যান এ, জাকুলিন এ, পিট্টাউ এমজি এবং সু টিএস (২০০৮) লজিস্টিক এবং অন্যান্য রিগ্রেশন মডেলগুলির জন্য দুর্বল তথ্যবহুল ডিফল্ট পূর্ব বিতরণ। ফলিত পরিসংখ্যানগুলির অ্যানালস , 2, 1360–383।
  • জোসে করটিয়া আব্রাহাঙ্কেস এবং মার্ক অ্যার্টস (২০১২) ক্লাস্টার্ড বাইনারি ডেটা পৃথকীকরণের একটি সমাধান স্ট্যাটিস্টিকাল মডেলিং 12 (1): 3–27 doi: 10.1177 / 1471082X1001200102

"বিগ্লিমার 'সম্পূর্ণ বিচ্ছেদ'" এর জন্য আরও সাম্প্রতিক গুগল পণ্ডিত অনুসন্ধানটি আবিষ্কার করেছে:

  • কুইনসস, এই, এবং ডব্লিউটি ডাব্লিসিস্লো। " ফলস্বরূপ Eusocial ঘাম মৌমাছি মেগালোপ জেনাল মধ্যে ক্রিপ্টিক প্রসারিত ব্রুড কেয়ার ।" কীটসত্রে সোসিয়াাকস 62.3 (2015): 307–313।

বাহ অনেক ধন্যবাদ !! এটি নিখুঁত ধারণা তৈরি করে এবং মডেলটি এখন বিজিএলএমারের সাথে সুচারুভাবে চলে। আমার আরও একটি প্রশ্ন থাকবে, আমি কি অন্য পদ্ধতিতে বিভিন্ন মডেলের তুলনা করার জন্য, এলোমেলো এবং স্থির প্রভাবগুলি মূল্যায়নের জন্য lme4 এর মতো পদ্ধতিগুলি ব্যবহার করতে পারি?

2
আমি তাই বলব, তবে আমার মতামতের জন্য কোনও আনুষ্ঠানিক এবং / অথবা পিয়ার-পর্যালোচিত সমর্থন আছে কিনা তা আমি জানি না ...
বেন বলকার

ধন্যবাদ! এটি ঠিক আমার সমস্যাও। একটি দ্রুত ফলোআপ: আপনার উদাহরণের বিপরীতে, যার 4 টি মাত্রার একটি ফ্যাক্টর রয়েছে, আমার কাছে একটি 2 এক্স 2 ডিজাইন রয়েছে যেখানে প্রতিটি ফ্যাক্টরের 2 টি স্তর থাকে (সুতরাং এখনও মোট 4 টি স্তর রয়েছে)। আমি কি আমার মডেলের জন্য ডায়াগ (9,4) ব্যবহার করতে পারি? আমি ম্যাট্রিক্সের সাথে পারদর্শী নই তাই আমি ডাবল-চেক করতে চেয়েছিলাম। সম্পর্কিত, আমার কাগজে এই সমাধানটি ন্যায়সঙ্গত করার জন্য, আমি কি ফर्थ (১৯৯৩) উদ্ধৃত করা উচিত বা আরও সরাসরি কোনও প্রাসঙ্গিক কাগজ আছে, যা বিজিএলএম () ব্যবহার করে আপনার সমাধানটি কার্যকর করেছে?
সল

2
আপডেট উত্তর দেখুন।
বেন বলকার

2
আমি এটি মনে করি - মোট কতগুলি স্থির প্রভাবের পরামিতি রয়েছে তা কেবল বিবেচনা করা উচিত।
বেন বলকার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.