Lme4 এ কনভার্জেন্স সতর্কতা সম্পর্কে আমাদের কতটা ভয় পাওয়া উচিত


88

যদি আমরা একটি গ্লোমারের উপযোগী হয়ে উঠি তবে আমরা একটি সতর্কতা পেতে পারি যা আমাদের জানিয়েছে যে মডেলটি রূপান্তরিত করতে খুব কঠিন সময় খুঁজে নিচ্ছে ... উদাহরণস্বরূপ

>Warning message:
In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
  Model failed to converge with max|grad| = 0.00389462 (tol = 0.001)

@ বেন বলকারের দ্বারা এই থ্রেডে আলোচিত রূপান্তরটি পরীক্ষা করার আরেকটি উপায় হ'ল:

 relgrad <- with(model@optinfo$derivs,solve(Hessian,gradient))
 max(abs(relgrad))
 #[1] 1.152891e-05

যদি max(abs(relgrad))হয় <0.001তারপর কিছু ঠিক আছে হতে পারে ... তাই এই ক্ষেত্রে আমরা পরস্পরবিরোধী ফলাফল? আমাদের পদ্ধতির মধ্যে কীভাবে আমাদের চয়ন করা উচিত এবং আমাদের মডেলের ফিট ফিট রয়েছে?

অন্যদিকে যখন আমরা আরও চরম মানগুলি পাই:

>Warning message:
In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv,  :
  Model failed to converge with max|grad| = 35.5352 (tol = 0.001)

relgrad <- with(model@optinfo$derivs,solve(Hessian,gradient))
max(abs(relgrad))
#[1] 0.002776518

এর অর্থ কি আমাদের মডেল ফলাফল / অনুমান / পি-মানগুলিকে উপেক্ষা করতে হবে? 0.0027 এগিয়ে যাওয়ার জন্য খুব বেশি বড়?

যখন বিভিন্ন অপটিমাইজারগুলি বিভিন্ন ফলাফল দেয় এবং ভেরিয়েবল / অপসারণের প্যারামিটারগুলিকে কেন্দ্র করে (সর্বনিম্নে মডেলগুলি সরিয়ে দেয়) সাহায্য করে না তবে ভিআইএফগুলি কম, মডেলগুলি অত্যধিক সংক্ষিপ্ত নয় এবং মডেলগুলির ফলাফলগুলি অগ্রাধিকার প্রত্যাশার ভিত্তিতে যৌক্তিক ধারণা তৈরি করে, এটি জানা শক্ত মনে হয় কি করো.

কীভাবে রূপান্তর সমস্যাগুলি ব্যাখ্যা করতে হবে, কীভাবে চূড়ান্ত হওয়া দরকার তা সত্যই আমাদের চিন্তিত করতে এবং উল্লিখিতগুলির বাইরে তাদের পরিচালনা করার সম্ভাব্য উপায়গুলি খুব সহায়ক হবে।

ব্যবহার: R version 3.1.0 (2014-04-10)এবংlme4_1.1-6


10
lme4(সংস্করণ 1.1-7) এর নতুন সংস্করণটির বিভিন্ন সতর্কতা আচরণ রয়েছে যা লেখকরা বিশ্বাস করেন যে "মিথ্যা বিপদাশঙ্কা" সতর্কতা দেওয়ার সম্ভাবনা কম। আপনি lme4সর্বশেষতম সংস্করণে আপডেট করার চেষ্টা করতে পারেন, আবার মডেলটিকে ফিটিং করতে এবং অন্তত প্রথম ক্ষেত্রে আপনি এখনও একই ধরণের সতর্কতা পেয়েছেন কিনা তা দেখার জন্য।
জেক ওয়েস্টফল

উত্তর:


91

ভীত. খুব ভয় হয়।

গত বছর, আমি আইবিএম এর বিকাশকারী ওয়ার্কস সাইটে একটি নিবন্ধের জন্য আশাবাদী ও অপ্টেক্স এর লেখক জন ন্যাশের সাক্ষাত্কার নিয়েছি । অপ্টিমাইজার কীভাবে কাজ করে এবং ব্যর্থ হলে তারা কেন ব্যর্থ হয় সে সম্পর্কে আমরা কথা বললাম। তারা মনে করে যে তারা প্রায়শই এটি করার সুযোগ পাবে না। এজন্য ডায়াগনস্টিকসকে প্যাকেজে অন্তর্ভুক্ত করা হয়েছে। তিনি আরও ভেবেছিলেন যে আপনার "আপনার সমস্যাটি বোঝার" দরকার এবং আপনার ডেটা বুঝতে হবে। এর সবকটির অর্থ হ'ল সতর্কতাগুলি গুরুত্ব সহকারে নেওয়া উচিত এবং এটি অন্য উপায়ে আপনার ডেটা দেখার জন্য একটি আমন্ত্রণ।

সাধারণত, যখন কোনও অর্থবহ পরিমাণে ক্ষতির কার্যকারিতা আর উন্নত করা যায় না তখন কোনও অপ্টিমাইজার অনুসন্ধান বন্ধ করে দেয়। এটি মূলত কোথায় যেতে হবে তা জানে না। ক্ষতির ফাংশনের গ্রেডিয়েন্ট যদি সেই সময়ে শূন্য না হয়, তবে আপনি কোনও ধরণের সীমানায় পৌঁছেছেন না। যদি হেসিয়ান ইতিবাচক না হয় তবে গ্রেডিয়েন্টটি শূন্য হয়, আপনি একটি সর্বনিম্ন সন্ধান করেননি, তবে সম্ভবত আপনি সর্বাধিক বা স্যাডল পয়েন্টটি খুঁজে পেয়েছেন। অপ্টিমাইজারের উপর নির্ভর করে যদিও হেসিয়ান সম্পর্কে ফলাফল সরবরাহ করা যায় না। অপ্টিমেক্সে, আপনি যদি কেকেটি শর্তাদি মূল্যায়ন করতে চান তবে আপনাকে তাদের জিজ্ঞাসা করতে হবে - সেগুলি ডিফল্টরূপে মূল্যায়ন করা হয় না। (এই শর্তগুলি গ্রেডিয়েন্ট এবং হেসিয়ানকে দেখে আপনার সত্যিকারের কোনও ন্যূনতম রয়েছে কিনা তা দেখুন))

মিশ্র মডেলগুলির সমস্যা হ'ল এলোমেলো প্রভাবগুলির জন্য বৈকল্পিক অনুমানটি ইতিবাচক হতে বাধ্য হয়, এইভাবে অপ্টিমাইজেশন অঞ্চলের মধ্যে একটি সীমানা রেখে। তবে ধরুন আপনার মডেলটিতে একটি নির্দিষ্ট এলোমেলো প্রভাবের সত্যিকারের প্রয়োজন নেই - অর্থাত এলোমেলো প্রভাবের প্রকরণটি 0 হয় izer যদি সেই এলোমেলো প্রভাবটি উন্নত রূপান্তরটি অপসারণ করে তবে আপনি জানবেন যে সমস্যাটি ছিল।

একদিকে যেমন নোট করুন যে অ্যাসিপটোটিক সর্বাধিক সম্ভাবনা তত্ত্বটি ধরে নিয়েছে যে এমএলই একটি অভ্যন্তরীণ বিন্দুতে পাওয়া গেছে (যেমন লাইসেন্স প্যারামিটার মানের সীমানায় নয়) - সুতরাং প্রকৃতির উপাদানগুলির জন্য সম্ভাবনা অনুপাতের পরীক্ষাগুলি কার্যকর হতে পারে না যখন সত্যই শূন্য প্রকরণের নাল অনুমানটি হয় সত্য। RLRsim প্যাকেজ হিসাবে প্রয়োগ হিসাবে সিমুলেশন পরীক্ষা ব্যবহার করে পরীক্ষা করা যেতে পারে।

আমার কাছে, আমি সন্দেহ করি যে পরামিতিগুলির সংখ্যার জন্য খুব অল্প ডেটা থাকলে বা প্রস্তাবিত মডেলটি সত্যিই উপযুক্ত নয়, তখন অপ্টিমাইজারগুলি সমস্যার মধ্যে পড়ে। কাঁচের স্লিপার এবং কুরুচিপূর্ণ ধাপ-বোনটিকে ভাবুন: আপনি যতই চেষ্টা করুন না কেন, এবং কিছু দিতে হবে তা আপনি মডেলটিতে আপনার ডেটা জুতো বানাতে পারবেন না।

এমনকি যদি তথ্যটি মডেলটির সাথে মানিয়ে যায় তবে সমস্ত পরামিতি অনুমান করার ক্ষমতা তাদের নাও থাকতে পারে। এই লাইনের সাথে আমার কাছে একটি মজার ঘটনা ঘটেছে। আমি একটি প্রশ্নের উত্তর দেওয়ার জন্য কিছু মিশ্র মডেল সিমুলেটেড করেছিআপনি যদি মিশ্র ইফেক্টের মডেলটি ফিট করার সময় এলোমেলো প্রভাবগুলিকে পারস্পরিক সম্পর্ক স্থাপনের অনুমতি না দেন তবে কী হয়। আমি দুটি এলোমেলো প্রভাবের মধ্যে দৃ corre় সম্পর্কের সাথে ডেটা সিমুলেটেড করেছিলাম, তারপরে মডেলটিকে উভয় উপায়ে লিমার দিয়ে ফিট করব: 0 পারস্পরিক সম্পর্ক এবং ফ্রি পারস্পরিক সম্পর্ক pos পারস্পরিক সম্পর্কযুক্ত মডেলটি অনিয়ন্ত্রিত মডেলের চেয়ে ভাল ফিট করে তবে মজার বিষয় হল 1000 সিমুলেশনগুলিতে সত্য মডেলটি ফিট করার সময় আমার 13 টি ত্রুটি ছিল এবং সহজ মডেলটি ফিটিং করার সময় 0 টি ত্রুটি ছিল। কেন এটি ঘটেছিল তা আমি পুরোপুরি বুঝতে পারি না (এবং আমি অনুরূপ ফলাফলগুলিতে সিমগুলি পুনরাবৃত্তি করেছি)। আমি সন্দেহ করি যে পারস্পরিক সম্পর্কের প্যারামিটারটি মোটামুটি অকেজো এবং অপ্টিমাইজারটি মানটি খুঁজে পাচ্ছে না (কারণ এটি কোনও ব্যাপার নয়)।

যখন বিভিন্ন অপ্টিমাইজার বিভিন্ন ফলাফল দেয় তখন আপনি কী করবেন সে সম্পর্কে জিজ্ঞাসা করেছিলেন। জন এবং আমি এই বিষয়টি নিয়ে আলোচনা করেছি। কিছু অপ্টিমাইজার, তার মতে, এটি খুব ভাল নয়! এবং তাদের সকলেরই দুর্বলতার পয়েন্ট রয়েছে - অর্থাত্ ডেটা সেট যা তাদের ব্যর্থ করে দেবে। এই কারণেই তিনি অপ্টেক্স লিখেছিলেন, যার মধ্যে বিভিন্ন ধরণের অপটিমাইজার রয়েছে। আপনি একই ডেটা সেটটিতে বেশ কয়েকটি চালাতে পারেন।

যদি দুটি অপ্টিমাইজার একই প্যারামিটার দেয় তবে আলাদা ডায়াগনস্টিকস - এবং সেই পরামিতিগুলি সত্যই বিশ্বকে উপলব্ধি করে - তবে আমি প্যারামিটারের মানগুলিতে বিশ্বাস রাখতে আগ্রহী। অসুবিধাটি ডায়াগনস্টিকগুলির সাথে থাকতে পারে, যা মূর্খ-প্রমাণ নয়। যদি আপনি স্পষ্টভাবে গ্রেডিয়েন্ট ফাংশন এবং / অথবা হেসিয়ান ম্যাট্রিক্স সরবরাহ না করে থাকেন তবে অপটিমাইজারকে ক্ষতির ফাংশন এবং ডেটা থেকে এগুলি অনুমান করতে হবে যা অন্যথায় ভুল হতে পারে।

আপনি যদি আলাদা আলাদা প্যারামিটার মানও পেতে থাকেন তবে আপনি বিভিন্ন প্রারম্ভিক মানগুলি চেষ্টা করে দেখতে পারেন এবং তারপরে কী ঘটে। কিছু অপ্টিমাইজার এবং কিছু সমস্যা শুরুর মানগুলির জন্য খুব সংবেদনশীল। আপনি বল পার্ক শুরু হতে চান।


3
আহা! "ভয় পান খুব ভয় পান।" করতে আমি এই প্রশ্নটি সবেমাত্র খুলেছি। তামাশা। তোমার জন্য ভাল. এটি একটি আসল উত্তরে অন্তর্ভুক্ত করার পক্ষেও ভাল, যা করার আমার কোনও ইচ্ছা ছিল না।
অ্যালেক্সিস

2
আপনার সত্যই ন্যাশ রচিত বইটি পড়া উচিত। হেসিয়ান নির্ধারণ করা অনুশীলনে খুব কঠিন তাই অপ্টিমাইজারটি অনেক ক্ষেত্রে রূপান্তরিত হতে পারে তবে হেসিয়ান অসম্পূর্ণ, তাই যদি আপনি বিভিন্ন অপটিমাইজারের কাছ থেকে একই রকম ফলাফল পান তবে রূপান্তর সতর্কবার্তা এটি প্রায়শই ঘটে থাকে যে আপনার হেসিয়ান আপনার মডেল নয় বোগাস। হেসিয়ান বা গ্রেডিয়েন্ট পরীক্ষাগুলি কেবল আশ্বাসের জন্য রয়েছে। কখনও কখনও একটি হেসিয়ানও খুব বেশি বোঝায় না যেমন আপনার যখন সীমানা-সীমাবদ্ধ অপটিমাইজার থাকে তবে আপনার হেসিয়ান অ্যালগরিদম এটিকে বিবেচনায় রাখে না (lme4 এর মতো) এবং আপনি সীমানাটিকে আঘাত করেন।

18

আমি কেবল @ প্লাসিডিয়ার দুর্দান্ত উত্তরের পরিপূরক চাই। জেমস হজস (২০১৪) এর মাধ্যমে আপনি "রিচলি প্যারামিটারাইজড লিনিয়ার মডেলস: অ্যাডিটিভ, টাইম সিরিজ, এবং র্যান্ডম এফেক্টস ব্যবহার করে স্থানিক মডেলগুলি" যাচাই করতে চাইতে পারেন 2014 এটি মিশ্র মডেলগুলি সম্পর্কে যা আমরা জানি না তা ব্যর্থ করে এবং একই সাথে জটিল মডেলগুলির ফিটিংয়ের জন্য কার্যকর টিপস পাশাপাশি একটি বিস্তৃত তত্ত্ব সরবরাহ করার চেষ্টা করে।

নিজেকে প্রায়শই ভয় পাওয়া একজন মডেলার, আমি হজের "ধাঁধা" এর আলোচনাগুলি অমূল্য বলে মনে করি। তিনি মজাদার মিশ্রণ-প্রভাবগুলির মডেলিং থেকে উদ্ভূত অদ্ভুত মামলাগুলি ব্যাখ্যা করেছেন, "একটি স্থির প্রভাবের সাথে প্রতিযোগিতা করা এলোমেলো প্রভাব" এবং "র্যান্ডম এফেক্টের মধ্যে প্রতিযোগিতা" সহ। পরিচিত শব্দ?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.