আপনার বিশেষ ক্ষেত্রে বিশেষ কিছু মনে করে, আমি মনে করি ডিফল্ট (মানে স্কোয়ার ত্রুটি) ব্যবহার করার জন্য লগগুলির ত্রুটির অর্থ বা চি-স্কোয়ার ত্রুটিটি ব্যবহার করার জন্য একটি ভাল যুক্তি রয়েছে।
ব্যয় ফাংশনের উদ্দেশ্য হ'ল ভুল অনুমানের সাথে আপনি কতটা "বিচলিত" তা প্রকাশ করা, বিশেষত কোনটি "অন্যায়" আপনাকে সবচেয়ে বেশি বিরক্ত করে। এটি বাইনারি প্রতিক্রিয়াগুলির জন্য বিশেষত গুরুত্বপূর্ণ, তবে যে কোনও পরিস্থিতিতে তা কার্যকর হতে পারে।
বর্গ ত্রুটি গড় (প্রতিক্রিয়াগুলির)
C=1n∑i(Yi−Y^i)2
এমএসই ব্যবহার করে আপনি উপরের এবং নীচের ত্রুটিগুলির জন্য সমান সংবেদনশীল এবং বড় এবং ছোট ভবিষ্যদ্বাণীগুলির জন্য সমান সংবেদনশীল। এটি করা খুব সুন্দর একটি স্ট্যান্ডার্ড জিনিস, এবং তাই আমি মনে করি না বেশিরভাগ পরিস্থিতিতেই তা ভ্রান্ত হবে।
স্কয়ার ত্রুটি গড় (লগ প্রতিক্রিয়াগুলির)
C=1n∑i(lnYi−lnY^i)2
যেহেতু আপনি গণনা ডেটা নিয়ে কাজ করছেন, এটি যুক্তিযুক্ত হতে পারে যে আপনি প্রতিসাম্য বা আকার উদাসীন নন। 10 এর পূর্বাভাসের জন্য 10 গুনে বাইরে থাকা 1000 এর পূর্বাভাসের থেকে খুব আলাদা This এটি কিছুটা "প্রমিত" ব্যয় ফাংশন, কারণ আপনি লিংক ফাংশনের সাথে ব্যয় মেলেছেন। এটি নিশ্চিত করে যে সেই ব্যয়গুলি মডেলটিতে ধরে নেওয়া ভেরিয়েন্স বিতরণটির সাথে মেলে।
চি-স্কোয়ার ত্রুটি
C=1n∑i(Yi−Y^i)2Y^i
তৃতীয় উপায় হ'ল চি-স্কোয়ার ত্রুটিটি ব্যবহার করা। আপনি যদি আপনার জিএলএমকে অন্য গণনাভিত্তিক মডেলগুলির সাথে তুলনা করছেন - বিশেষত যদি আপনার জিএলএমের কোনও কারণ রয়েছে তবে এটি বিশেষত আবেদনকারী হতে পারে। ত্রুটি লগ প্রতিক্রিয়াগুলির অনুরূপ, এটি আকারের সাথে স্কেল করবে তবে এটি পূর্বাভাসিত গণনার চারপাশে প্রতিসাম্য। আপনি এখন শতাংশ ত্রুটির উপর ভিত্তি করে ফিটের ন্যূন্যের মূল্যায়ন করছেন।
বিবেচনার উপর
প্রশ্নটি ডকুমেন্টেশনের উদাহরণকে উদ্ধৃত করে যেখানে তাদের বাইনারি প্রতিক্রিয়া ভেরিয়েবল রয়েছে, সুতরাং একটি ভিন্ন ব্যয় ফাংশন ব্যবহার করুন। বাইনারি প্রতিক্রিয়ার বিষয়টি হ'ল জিএলএম 0 এবং 1 এর মধ্যে একটি আসল সংখ্যার পূর্বাভাস দেবে, যদিও প্রতিক্রিয়া সর্বদা 0 বা 1 এর মধ্যে থাকে তবে এই সংখ্যাটি যতটা কাছাকাছি সঠিক প্রতিক্রিয়ায় ততই ভাল বলে বলা ঠিক হবে পূর্বাভাস, তবে প্রায়শই লোকেরা এটি চায় না। যুক্তি হ'ল একজনকে প্রায়শই 0 বা 1 এর মতো আচরণ করা আবশ্যক এবং তাই 0 এর পূর্বাভাস হিসাবে 0.5 এর চেয়ে কম কিছু গ্রহণ করবে। সেক্ষেত্রে এটি "ভুল" পূর্বাভাসের সংখ্যা গণনা করা সহজভাবে বোঝায়। এখানে যুক্তিটি হ'ল সত্য / মিথ্যা প্রশ্নের জন্য আপনি কেবল সঠিক বা ভুল হতে পারেন - অন্যায়ের কোনও গ্রেড নেই।
Y^
cv.glmnet
প্যাকেজের মধ্যেglmnet
ব্যবহারtype.measure="deviance"
পইসন পরিবারের জন্য।