আমার রিগ্রেশন মডেলটি ভাল কিনা তা কীভাবে পরীক্ষা করবেন


10

'গ্ল্যাম' ব্যবহার করে লজিস্টিক রিগ্রেশন মডেলের যথার্থতা খুঁজে পাওয়ার একটি উপায় হ'ল এটিউ প্লটটি। ক্রমাগত প্রতিক্রিয়া পরিবর্তনশীল (পরিবার = 'গাউসিয়ান') এর সাথে পাওয়া রিগ্রেশন মডেলের জন্য একইটি কীভাবে পরীক্ষা করবেন?

আমার রিগ্রেশন মডেলটি ডেটার সাথে কতটা ফিট করে তা পরীক্ষা করতে কোন পদ্ধতি ব্যবহার করা হয়?


আপনি r-squaredট্যাগ এবং ট্যাগটি একবার দেখতে চান goodness-of-fit..
ম্যাক্রো

2
রৈখিক লিঙ্কযুক্ত "গাউসিয়ান" পরিবারটি কেবলমাত্র সর্বনিম্ন স্কোয়ার (ওএলএস) রিগ্রেশন; এই জাতীয় ফিটগুলি পরীক্ষা করার পদ্ধতিগুলি সম্ভবত এই সাইটের হাজার প্রশ্নে আলোচনা করা হয়েছে (আমি অত্যুক্তি করব না)।
whuber

এই থ্রেডটি প্রাসঙ্গিক: stats.stackexchange.com/q/414349/121522
মনিকা

উত্তর:


15

আমি একটি সূচনা হিসাবে " লিনিয়ার রিগ্রেশন মডেল ডায়াগনস্টিকস " এ একটি সংক্ষিপ্ত অনুসন্ধানের পরামর্শ দেব । তবে এখানে কয়েকটি যা আমি আপনাকে চেক করার পরামর্শ দিচ্ছি:

অনুমানগুলি সন্তোষজনকভাবে পূরণ হয়েছে তা নিশ্চিত করুন

  • স্বতন্ত্র পূর্বাভাসকারী এবং নির্ভরশীল ভেরিয়েবলের মধ্যে লিনিয়ার সম্পর্ক পরীক্ষা করার জন্য স্ক্যাটারপ্লট বা উপাদান প্লাস অবশিষ্টাংশ প্লট ব্যবহার করুন।

  • পূর্বাভাসিত মানের তুলনায় মানসম্পন্ন অবশিষ্টাংশ বনাম একটি প্লট রচনা করুন এবং নিশ্চিত করুন যে খুব উচ্চ অবশিষ্টাংশের সাথে চূড়ান্ত বিন্দু নেই এবং অবশিষ্টাংশের বিস্তারটি মূলত পূর্বাভাসিত মানের পাশাপাশি একইরকম, পাশাপাশি অবশিষ্টাংশের গড়ের উপরে এবং নীচেও সমানভাবে প্রসারিত হয়, শূন্য।

  • আপনি y- অক্ষকে অবশিষ্ট পরিবর্তন করতে পারেন । এই প্লটটি অসম বৈকল্পিক সনাক্তকরণে সহায়তা করে।2

  • স্বাধীনতার অনুমান যুক্তিসঙ্গত হয় তা নিশ্চিত করার জন্য অধ্যয়নের নকশাটি পুনরায় পরীক্ষা করুন।

  • সম্ভাব্য প্রান্তিকতা পরীক্ষা করতে ভেরিয়েন্স মুদ্রাস্ফীতি ফ্যাক্টর (ভিআইএফ) বা সহনশীলতার পরিসংখ্যান পুনরুদ্ধার করুন।

সম্ভাব্য প্রভাবশালী পয়েন্টগুলি পরীক্ষা করুন

  • কোনও নির্দিষ্ট ডেটা পয়েন্ট আপনার নিয়ন্ত্রণের ফলাফলগুলিতে মারাত্মকভাবে পরিবর্তন করছে কিনা তা জানতে কুকের ডি, ডিফিটস বা ডিএফ বিটা হিসাবে পরিসংখ্যানগুলি পরীক্ষা করুন। আপনি এখানে আরও জানতে পারেন ।

এবং অ্যাডজাস্টেড পরিসংখ্যানগুলির পরিবর্তন পরীক্ষা করুনR2R2

  • বর্গক্ষেত্রের মোট যোগফলের সংমিশ্রণের অনুপাত হওয়ায় আপনাকে বলতে পারবেন যে আপনার নির্ভরশীল ভেরিয়েবলের কতগুলি পরিবর্তনশীলতা মডেল দ্বারা ব্যাখ্যা করা হয়েছে।R2
  • অ্যাডজাস্টেড আমার অতিরিক্ত প্রেডিক্টর (গুলি) সম্পর্কে অতিরিক্ত স্কোয়ারের যোগফলগুলি তাদের যে পরিমাণ স্বাধীনতা গ্রহণ করবে তা সত্যিই মূল্যবান কিনা তা পরীক্ষা করতে ব্যবহার করা যেতে পারে।R2

প্রয়োজনীয় মিথস্ক্রিয়া পরীক্ষা করুন

  • যদি কোনও প্রধান স্বতন্ত্র পূর্বাভাসক থাকে, এর স্বতন্ত্র প্রভাব সম্পর্কে কোনও ব্যাখ্যা দেওয়ার আগে, এটি অন্যান্য স্বতন্ত্র ভেরিয়েবলের সাথে ইন্টারঅ্যাক্ট করছে কিনা তা পরীক্ষা করে দেখুন। মিথস্ক্রিয়া, যদি অযৌক্তিকভাবে ছেড়ে যায় তবে আপনার অনুমানটিকে পক্ষপাতিত্ব করতে পারে।

আপনার মডেলটিকে অন্য কোনও ডেটা সেটে প্রয়োগ করুন এবং এর কার্যকারিতা পরীক্ষা করুন

  • আপনি অন্যান্য পৃথক ডেটাতেও রিগ্রেশন সূত্রটি প্রয়োগ করতে পারেন এবং এটি কতটা পূর্বাভাস করেছে তা দেখতে পারেন। স্ক্যাটার প্লটের মতো গ্রাফ এবং পর্যবেক্ষণকৃত মান থেকে% পার্থক্যের মতো পরিসংখ্যানগুলি একটি ভাল সূচনা হিসাবে কাজ করতে পারে।

2
(+1): খুব সম্পূর্ণ উত্তর! আপনি যদি আর ব্যবহার করছেন plot.lmতবে পেনগুইন_কাইটের উল্লেখ করা বেশিরভাগ ডায়গনিস্টিক প্লট দিতে পারেন।
Zach

4

আমি আমার রিগ্রেশন মডেলগুলিকে নতুন ডেটাতে কতটা জেনারালাইজ করে তা দেখতে ক্রস-বৈধ করতে চাই । আমার পছন্দের মেট্রিক মানে ক্রস-বৈধতাযুক্ত ডেটাতে নিখুঁত ত্রুটি , তবে রুট মানে স্কোয়ার্ড ত্রুটি আরও সাধারণ এবং সমানভাবে কার্যকর।

আপনার মডেলটি প্রশিক্ষণের ডেটা কতটা ফিট করে তার একটি ভাল মেট্রিক হিসাবে আমি আর 2-কে খুঁজে পাই না, কারণ প্রশিক্ষণের ডেটাতে গণনা করা প্রায় কোনও ত্রুটি মেট্রিক ওভার ফিটিংয়ের ঝুঁকিতে পড়বে। আপনার যদি প্রশিক্ষণ সেটে অবশ্যই আর 2 গণনা করতে চান তবে আমি অ্যাডজাস্টেড আর 2 ব্যবহার করার পরামর্শ দিচ্ছি ।


1

আপনার মডেল প্রশিক্ষণের ডেটা কতটা ফিট করে তা পরীক্ষা করতে আপনি ব্যবহার করতে পারেন । এটি আপনাকে বলে দেবে যে ডেটাগুলির বৈধতার কত শতাংশ মডেল দ্বারা ব্যাখ্যা করা হয়েছে।R2

প্রকৃত মানটির সাথে তুলনা করার সময় আমি আপনার পরীক্ষার সেটটিতে আপনার পূর্বাভাসগুলির আরএমএসই (মূল অর্থ বর্গ ত্রুটি) ব্যবহার করার পরামর্শ দিই। এটি একটি অবিচ্ছিন্ন ভেরিয়েবলের পূর্বাভাস ত্রুটির প্রতিবেদন করার একটি স্ট্যান্ডার্ড পদ্ধতি।


1
@ ম্যাক্রো তবে প্রশ্নটি মূলত গাউসীয় ত্রুটিযুক্ত একটি ওএলএস নিগ্রহের জন্য পারফরম্যান্স মেট্রিকের জন্য জিজ্ঞাসা করেছিল। তিনি আসছেন লজিস্টিক রিগ্রেশন থেকে।
এরিক

@ এরিক, ধন্যবাদ, আমি ভুল পড়েছি যাইহোক, প্রথম অংশটি সম্পর্কে, আমি ভাবি না যে , বিচ্ছিন্নভাবে, "আমার রিগ্রেশন মডেলটি ভাল কিনা তা পরীক্ষা করতে", ওপি এর শব্দ ব্যবহার করতে ব্যবহার করা যেতে পারে। আপনার মডেলটি উচ্চতর থাকার পরেও বিস্তৃত পরিমাণে ডেটা সম্পর্কে কার্যকরভাবে পূর্বাভাস দিতে খারাপভাবে ব্যর্থ হতে পারে । একটি উদাহরণের জন্য এখানে দেখুন - উদাহরণস্বরূপ (1), প্রায় কোনও ভবিষ্যদ্বাণীপূর্ণ শক্তি নেই তবে এখনও বেশি। আর 2 আর 2R2R2R2
ম্যাক্রো

@ ম্যাক্রো, আমি আপনার মন্তব্যের সাথে একমত হয়েছি কিন্তু
ওপিকে

0

আমি একটি ষড়যন্ত্র করে আমার প্যারামিটার মূল্নির্ধারক কার্যকরী ফর্ম চেক ব্যবহার করছি অ স্থিতিমাপ (যেমন একটি কার্নেল রিগ্রেশন) অথবা আধা স্থিতিমাপ প্রাক্কলন এবং স্থিতিমাপ লাগানো বক্ররেখায় তুলনা। আমি মনে করি এটি ইন্টারঅ্যাকশন শর্তাদি বা উচ্চতর-আদেশের শর্তাদি অন্তর্ভুক্ত করার চেয়ে প্রায়শই দ্রুত (এবং সম্ভবত আরও অন্তর্দৃষ্টিযুক্ত) হয় step

আর প্যাকেজ এনপি অনেকগুলি নন-প্যারাম্যাট্রিক এবং আধা-প্যারামেট্রিক ফাংশন সরবরাহ করে এবং এর ভিগনেটটি ভাল লেখা আছে: http://cran.r-project.org/web/packages/np/vignettes/np.pdf

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.