ভীত. খুব ভয় হয়।
গত বছর, আমি আইবিএম এর বিকাশকারী ওয়ার্কস সাইটে একটি নিবন্ধের জন্য আশাবাদী ও অপ্টেক্স এর লেখক জন ন্যাশের সাক্ষাত্কার নিয়েছি । অপ্টিমাইজার কীভাবে কাজ করে এবং ব্যর্থ হলে তারা কেন ব্যর্থ হয় সে সম্পর্কে আমরা কথা বললাম। তারা মনে করে যে তারা প্রায়শই এটি করার সুযোগ পাবে না। এজন্য ডায়াগনস্টিকসকে প্যাকেজে অন্তর্ভুক্ত করা হয়েছে। তিনি আরও ভেবেছিলেন যে আপনার "আপনার সমস্যাটি বোঝার" দরকার এবং আপনার ডেটা বুঝতে হবে। এর সবকটির অর্থ হ'ল সতর্কতাগুলি গুরুত্ব সহকারে নেওয়া উচিত এবং এটি অন্য উপায়ে আপনার ডেটা দেখার জন্য একটি আমন্ত্রণ।
সাধারণত, যখন কোনও অর্থবহ পরিমাণে ক্ষতির কার্যকারিতা আর উন্নত করা যায় না তখন কোনও অপ্টিমাইজার অনুসন্ধান বন্ধ করে দেয়। এটি মূলত কোথায় যেতে হবে তা জানে না। ক্ষতির ফাংশনের গ্রেডিয়েন্ট যদি সেই সময়ে শূন্য না হয়, তবে আপনি কোনও ধরণের সীমানায় পৌঁছেছেন না। যদি হেসিয়ান ইতিবাচক না হয় তবে গ্রেডিয়েন্টটি শূন্য হয়, আপনি একটি সর্বনিম্ন সন্ধান করেননি, তবে সম্ভবত আপনি সর্বাধিক বা স্যাডল পয়েন্টটি খুঁজে পেয়েছেন। অপ্টিমাইজারের উপর নির্ভর করে যদিও হেসিয়ান সম্পর্কে ফলাফল সরবরাহ করা যায় না। অপ্টিমেক্সে, আপনি যদি কেকেটি শর্তাদি মূল্যায়ন করতে চান তবে আপনাকে তাদের জিজ্ঞাসা করতে হবে - সেগুলি ডিফল্টরূপে মূল্যায়ন করা হয় না। (এই শর্তগুলি গ্রেডিয়েন্ট এবং হেসিয়ানকে দেখে আপনার সত্যিকারের কোনও ন্যূনতম রয়েছে কিনা তা দেখুন))
মিশ্র মডেলগুলির সমস্যা হ'ল এলোমেলো প্রভাবগুলির জন্য বৈকল্পিক অনুমানটি ইতিবাচক হতে বাধ্য হয়, এইভাবে অপ্টিমাইজেশন অঞ্চলের মধ্যে একটি সীমানা রেখে। তবে ধরুন আপনার মডেলটিতে একটি নির্দিষ্ট এলোমেলো প্রভাবের সত্যিকারের প্রয়োজন নেই - অর্থাত এলোমেলো প্রভাবের প্রকরণটি 0 হয় izer যদি সেই এলোমেলো প্রভাবটি উন্নত রূপান্তরটি অপসারণ করে তবে আপনি জানবেন যে সমস্যাটি ছিল।
একদিকে যেমন নোট করুন যে অ্যাসিপটোটিক সর্বাধিক সম্ভাবনা তত্ত্বটি ধরে নিয়েছে যে এমএলই একটি অভ্যন্তরীণ বিন্দুতে পাওয়া গেছে (যেমন লাইসেন্স প্যারামিটার মানের সীমানায় নয়) - সুতরাং প্রকৃতির উপাদানগুলির জন্য সম্ভাবনা অনুপাতের পরীক্ষাগুলি কার্যকর হতে পারে না যখন সত্যই শূন্য প্রকরণের নাল অনুমানটি হয় সত্য। RLRsim প্যাকেজ হিসাবে প্রয়োগ হিসাবে সিমুলেশন পরীক্ষা ব্যবহার করে পরীক্ষা করা যেতে পারে।
আমার কাছে, আমি সন্দেহ করি যে পরামিতিগুলির সংখ্যার জন্য খুব অল্প ডেটা থাকলে বা প্রস্তাবিত মডেলটি সত্যিই উপযুক্ত নয়, তখন অপ্টিমাইজারগুলি সমস্যার মধ্যে পড়ে। কাঁচের স্লিপার এবং কুরুচিপূর্ণ ধাপ-বোনটিকে ভাবুন: আপনি যতই চেষ্টা করুন না কেন, এবং কিছু দিতে হবে তা আপনি মডেলটিতে আপনার ডেটা জুতো বানাতে পারবেন না।
এমনকি যদি তথ্যটি মডেলটির সাথে মানিয়ে যায় তবে সমস্ত পরামিতি অনুমান করার ক্ষমতা তাদের নাও থাকতে পারে। এই লাইনের সাথে আমার কাছে একটি মজার ঘটনা ঘটেছে। আমি একটি প্রশ্নের উত্তর দেওয়ার জন্য কিছু মিশ্র মডেল সিমুলেটেড করেছিআপনি যদি মিশ্র ইফেক্টের মডেলটি ফিট করার সময় এলোমেলো প্রভাবগুলিকে পারস্পরিক সম্পর্ক স্থাপনের অনুমতি না দেন তবে কী হয়। আমি দুটি এলোমেলো প্রভাবের মধ্যে দৃ corre় সম্পর্কের সাথে ডেটা সিমুলেটেড করেছিলাম, তারপরে মডেলটিকে উভয় উপায়ে লিমার দিয়ে ফিট করব: 0 পারস্পরিক সম্পর্ক এবং ফ্রি পারস্পরিক সম্পর্ক pos পারস্পরিক সম্পর্কযুক্ত মডেলটি অনিয়ন্ত্রিত মডেলের চেয়ে ভাল ফিট করে তবে মজার বিষয় হল 1000 সিমুলেশনগুলিতে সত্য মডেলটি ফিট করার সময় আমার 13 টি ত্রুটি ছিল এবং সহজ মডেলটি ফিটিং করার সময় 0 টি ত্রুটি ছিল। কেন এটি ঘটেছিল তা আমি পুরোপুরি বুঝতে পারি না (এবং আমি অনুরূপ ফলাফলগুলিতে সিমগুলি পুনরাবৃত্তি করেছি)। আমি সন্দেহ করি যে পারস্পরিক সম্পর্কের প্যারামিটারটি মোটামুটি অকেজো এবং অপ্টিমাইজারটি মানটি খুঁজে পাচ্ছে না (কারণ এটি কোনও ব্যাপার নয়)।
যখন বিভিন্ন অপ্টিমাইজার বিভিন্ন ফলাফল দেয় তখন আপনি কী করবেন সে সম্পর্কে জিজ্ঞাসা করেছিলেন। জন এবং আমি এই বিষয়টি নিয়ে আলোচনা করেছি। কিছু অপ্টিমাইজার, তার মতে, এটি খুব ভাল নয়! এবং তাদের সকলেরই দুর্বলতার পয়েন্ট রয়েছে - অর্থাত্ ডেটা সেট যা তাদের ব্যর্থ করে দেবে। এই কারণেই তিনি অপ্টেক্স লিখেছিলেন, যার মধ্যে বিভিন্ন ধরণের অপটিমাইজার রয়েছে। আপনি একই ডেটা সেটটিতে বেশ কয়েকটি চালাতে পারেন।
যদি দুটি অপ্টিমাইজার একই প্যারামিটার দেয় তবে আলাদা ডায়াগনস্টিকস - এবং সেই পরামিতিগুলি সত্যই বিশ্বকে উপলব্ধি করে - তবে আমি প্যারামিটারের মানগুলিতে বিশ্বাস রাখতে আগ্রহী। অসুবিধাটি ডায়াগনস্টিকগুলির সাথে থাকতে পারে, যা মূর্খ-প্রমাণ নয়। যদি আপনি স্পষ্টভাবে গ্রেডিয়েন্ট ফাংশন এবং / অথবা হেসিয়ান ম্যাট্রিক্স সরবরাহ না করে থাকেন তবে অপটিমাইজারকে ক্ষতির ফাংশন এবং ডেটা থেকে এগুলি অনুমান করতে হবে যা অন্যথায় ভুল হতে পারে।
আপনি যদি আলাদা আলাদা প্যারামিটার মানও পেতে থাকেন তবে আপনি বিভিন্ন প্রারম্ভিক মানগুলি চেষ্টা করে দেখতে পারেন এবং তারপরে কী ঘটে। কিছু অপ্টিমাইজার এবং কিছু সমস্যা শুরুর মানগুলির জন্য খুব সংবেদনশীল। আপনি বল পার্ক শুরু হতে চান।
lme4
(সংস্করণ 1.1-7) এর নতুন সংস্করণটির বিভিন্ন সতর্কতা আচরণ রয়েছে যা লেখকরা বিশ্বাস করেন যে "মিথ্যা বিপদাশঙ্কা" সতর্কতা দেওয়ার সম্ভাবনা কম। আপনিlme4
সর্বশেষতম সংস্করণে আপডেট করার চেষ্টা করতে পারেন, আবার মডেলটিকে ফিটিং করতে এবং অন্তত প্রথম ক্ষেত্রে আপনি এখনও একই ধরণের সতর্কতা পেয়েছেন কিনা তা দেখার জন্য।