একাধিক রিগ্রেশন-এ অ্যাডেড ভেরিয়েবল প্লট (আংশিক রিগ্রেশন প্লট) কী ব্যাখ্যা করে?


18

আমার কাছে মুভিজ ডেটাসেটের একটি মডেল রয়েছে এবং আমি রিগ্রেশনটি ব্যবহার করেছি:

model <- lm(imdbVotes ~ imdbRating + tomatoRating + tomatoUserReviews+ I(genre1 ** 3.0) +I(genre2 ** 2.0)+I(genre3 ** 1.0), data = movies)
library(ggplot2)
res <- qplot(fitted(model), resid(model))
res+geom_hline(yintercept=0)

যা আউটপুট দিয়েছে:

এখানে চিত্র বর্ণনা লিখুন

এখন আমি প্রথমবারে অ্যাডেড ভেরিয়েবল প্লট নামে কাজ করার চেষ্টা করেছি এবং নিম্নলিখিত ফলাফলটি পেয়েছি:

car::avPlots(model, id.n=2, id.cex=0.7)

ভেরিয়েবল প্লট যুক্ত হয়েছে

সমস্যাটি আমি গুগল ব্যবহার করে অ্যাডেড ভেরিয়েবল প্লট বুঝতে চেষ্টা করেছি তবে এর গভীরতা বুঝতে পারি না, প্লটটি দেখে আমি বুঝতে পারি যে আউটপুট সম্পর্কিত প্রতিটি ইনপুট ভেরিয়েবলের উপর ভিত্তি করে স্কিউংয়ের এটির প্রতিনিধিত্ব of

এটি কীভাবে ডেটা সাধারণকরণকে ন্যায্যতা দেয় তার মতো আমি আরও কিছু বিশদ পেতে পারি?


4
@ সিলভারফিশ আপনার প্রশ্নের সুন্দর উত্তর দিয়েছে। আপনার নির্দিষ্ট ডেটাসেটের সাথে কী করবেন তার ছোট্ট বিবরণে, একটি লিনিয়ার মডেল দেখতে খুব খারাপ ধারণা বলে মনে হয়। ভোটগুলি স্পষ্টতই একটি উচ্চ স্কিউল অ-নেতিবাচক পরিবর্তনশীল, তাই পইসন মডেলের মতো কিছু নির্দেশিত হয়। উদাহরণস্বরূপ দেখুন blog.stata.com/tag/poisson-regression নোট করুন যে এই জাতীয় মডেল আপনাকে এমন ধারনা দেওয়ার জন্য প্রতিশ্রুতি দেয় না যে প্রতিক্রিয়াটির প্রান্তিক বিতরণ হ'ল কোনও প্রমিত রৈখিক মডেলের তুলনায় পোইসন হ'ল প্রান্তিক স্বাভাবিকতা পোস্ট করার জন্য আপনাকে প্রতিশ্রুতিবদ্ধ।
নিক কক্স

2
রৈখিক মডেলটি খারাপভাবে কাজ করে না এমন দেখার একটি উপায় এটি লক্ষণীয় যে এটি ক্ষেত্রে যথেষ্ট পরিমাণে ভগ্নাংশের জন্য নেতিবাচক মানগুলির পূর্বাভাস দেয়। প্রথম অবশিষ্ট অবধি প্লটের উপর লাগানো বাম অঞ্চলটি দেখুন । =0
নিক কক্স

ধন্যবাদ নিক কক্স, এখানে আমি দেখতে পেলাম যে সেখানে অত্যন্ত স্কিউড অ-নেতিবাচক প্রকৃতি রয়েছে, আমাকে অবশ্যই পোইসন মডেলটি বিবেচনা করতে হবে, তাই কোনও লিঙ্ক আছে যা আমাকে কোন মডেলটি ব্যবহার করতে হবে সে সম্পর্কে ডেটাসেটের ভিত্তিতে কোন দৃশ্যের সঠিক ধারণা দেয় এবং আমি ব্যবহার করার চেষ্টা করেছি আমার ডেটাসেটের জন্য বহুপদী রিগ্রেশন, এটি কি এখানে সঠিক পছন্দ হবে ...
অভিষেক চৌধুরী ২ '

1
আমি ইতিমধ্যে একটি লিঙ্ক দিয়েছি যা পরিবর্তে আরও রেফারেন্স দেয়। দুঃখিত, তবে আমি "ডেটাসেটের উপর ভিত্তি করে দৃশ্যের" এবং "বহুভিত্তিক রিগ্রেশন" এর প্রসঙ্গে আপনার প্রশ্নের দ্বিতীয়ার্ধ বুঝতে পারি না। আমার সন্দেহ হয় আপনাকে আরও বিস্তারিতভাবে একটি নতুন প্রশ্ন জিজ্ঞাসা করতে হবে।
নিক কক্স

আপনি কোন প্যাকেজটি ইনস্টল করেছেন যাতে আর ফাংশনটি সনাক্ত করতে পারে avPlots?
ইসা

উত্তর:


36

উদাহরণের জন্য আমি কম জটিল রিগ্রেশন মডেল নেব Y=β1+β2X2+β3X3+ϵ যেখানে ভবিষ্যদ্বাণী ভেরিয়েবল X2 এবং X3 হতে পারে। এর sayালু β2 এবং β3 উভয়ই ধনাত্মক তাই আমরা বলতে পারি যে (i) এক্স 2 বৃদ্ধি পাওয়ার সাথে Y বৃদ্ধি পায়, যদি এক্স 3 ধ্রুবক ধরে থাকে, যেহেতু β 2 ইতিবাচক; (ii) ওয়াইX2X3β2Yযেমন বাড়ে X3 বেড়ে যায়, যদি X2 , অনুষ্ঠিত ধ্রুবক যেহেতু β3 ইতিবাচক হয়।

নোট করুন যে যখন অন্যান্য ভেরিয়েবলগুলি ধ্রুবকভাবে অনুষ্ঠিত হয় তখন কী ঘটে যায় তা বিবেচনা করে একাধিক রিগ্রেশন সহগের ব্যাখ্যা করা গুরুত্বপূর্ণ ("সেটারিস পেরিবাস")। ধরুন আমি শুধু regressed Y বিরুদ্ধে X2 একটি মডেল সঙ্গে Y=β1+β2X2+ϵ । ঢাল সহগ জন্য আমার অনুমান β2 , যা থেকে কার্যকর পরিমাপ Y একটি এক ইউনিট বৃদ্ধির X2 ছাড়া অধিষ্ঠিত X3ধ্রুবক, একাধিক রিগ্রেশন থেকে আমার β2 অনুমানের থেকে আলাদা হতে পারে - এটি এক্স 2 এর একক Y উপর প্রভাবও পরিমাপ করে , তবে এটি এক্স 3 ধ্রুবক ধারণ করে । আমার অনুমান সঙ্গে সমস্যা ^ β ' 2 এটি ভুগছেন হয় বাদ দেওয়া-পরিবর্তনশীল পক্ষপাত যদি এক্স 2 এবং এক্স 3 সম্পর্কিত করা হয়।X2X3β2^X2X3

কেন তা বুঝতে, X2 এবং X3 কল্পনা করুন ly ণাত্মকভাবে সম্পর্কিত। এখন যখন আমি বৃদ্ধি X2 এক ইউনিট দ্বারা, আমি জানি গড় মান Y যেহেতু বৃদ্ধি করা উচিত β2>0 । তবে X2 বাড়ার সাথে সাথে আমরা যদি X3 ধ্রুবক ধরে না রাখি তবে X3 হ্রাস পেতে থাকে এবং β3>0 যেহেতু এটি Y গড় মান হ্রাস করবে । সুতরাং X2 এ এক ইউনিট বৃদ্ধির সামগ্রিক প্রভাবটি যদি আমি এক্সকে অনুমতি দিই তবে কম প্রদর্শিত হবেX3 এছাড়াও পৃথক, তাইβ2<β2 । থিংস খারাপ আরও জোরালোভাবে পেতেX2 এবংX3 সম্পর্কিত করা হয়, এবং বৃহত্তর প্রভাবX3 মাধ্যমেβ3 - একটি সত্যিই তীব্র ক্ষেত্রে আমরা এমনকি খুঁজে পেতে পারেনβ2<0 যদিও আমরা জানি যে, paribus ceteris,X2 এরY উপর ইতিবাচক প্রভাব রয়েছে!

আশা করি আপনি এখন দেখতে পাচ্ছেন যে এক্স 2 এর বিরুদ্ধে Y গ্রাফ আঁকাই আপনার মডেলের ওয়াই এবং এক্স 2 এর মধ্যে সম্পর্কটি কল্পনা করার জন্য একটি দুর্বল উপায় । আমার উদাহরণে, আপনার চোখ ঢাল সঙ্গে ভাল হইয়া একটি লাইন প্রতি আকৃষ্ট হবেন ^ β ' 2 যে প্রতিফলিত না ^ β 2 আপনার রিগ্রেশন মডেল থেকে। সবচেয়ে খারাপ ক্ষেত্রে, আপনার মডেলটি অনুমান করতে পারে যে এক্স 2 বৃদ্ধি পাওয়ার সাথে সাথে ওয়াই বৃদ্ধি পায় (অন্যান্য ভেরিয়েবলগুলি ধ্রুবক হিসাবে ধরে থাকে) এবং গ্রাফের পয়েন্টগুলি নির্দেশ করে যে এক্স 2 বৃদ্ধি পাওয়ার সাথে সাথে ওয়াই হ্রাস পাবে।X2YX2β2^β2^YX2YX2

সমস্যাটি হ'ল এক্স 2 এর বিপরীতে Y এর সহজ গ্রাফের মধ্যে অন্যান্য ভেরিয়েবলগুলি ধ্রুবক হিসাবে ধরে রাখা হয় না। এটি একটি যুক্ত ভেরিয়েবল প্লটের (যেটিকে একটি আংশিক রিগ্রেশন প্লটও বলা হয়) সুবিধার জন্য গুরুত্বপূর্ণ অন্তর্দৃষ্টি - এটি অন্যান্য ভবিষ্যদ্বাণীকারীদের প্রভাবকে "আংশিকভাবে আউট" করার জন্য ফ্রিসচ-ওয়া-লাভল উপপাদ্যকে ব্যবহার করে। চক্রান্ত উপর horizonal এবং উল্লম্ব অক্ষ সম্ভবত হয় সবচেয়ে সহজে "হিসাবে * বোধগম্য এক্স 2 এবং পরে অন্যান্য ভবিষ্যতবক্তা জন্য দায়ী করা হয়" " ওয়াই পর অন্যান্য ভবিষ্যতবক্তা জন্য দায়ী করা হয়"। আপনি এখন ওয়াই এবং এক্স 2 এর মধ্যে সম্পর্কের দিকে একবার অন্য সমস্ত ভবিষ্যদ্বাণীকারী হিসাবে বিবেচিত হয়ে যেতে পারেনX2X2YYX2 । উদাহরণস্বরূপ, প্রতিটি প্লটে আপনি যে slাল দেখতে পাচ্ছেন তা এখন আপনার মূল একাধিক রিগ্রেশন মডেল থেকে আংশিক রিগ্রেশন সহগকে প্রতিফলিত করে।

অ্যাডিশনড ভেরিয়েবল প্লটের বেশিরভাগ মান রিগ্রেশন ডায়াগোনস্টিক পর্যায়ে আসে, বিশেষত যেহেতু যুক্ত ভেরিয়েবল প্লটের অবশিষ্টাংশগুলি মূল একাধিক রিগ্রেশন থেকে অবিকল থাকে। এর অর্থ বহিরাগত এবং হেটেরোসকেস্টাস্টিটি একাধিক রিগ্রেশন মডেলের চেয়ে সাধারণের প্লটটি দেখার সময় একইভাবে চিহ্নিত করা যেতে পারে। প্রভাবশালী পয়েন্টগুলিও দেখা যায় - এটি একাধিক প্রতিরোধে কার্যকর কারণ কিছু অন্যান্য প্রভাবশালী পয়েন্টগুলি অন্যান্য ভেরিয়েবলগুলিকে বিবেচনায় নেওয়ার আগে মূল তথ্যটিতে সুস্পষ্ট নয়। আমার উদাহরণস্বরূপ, একটি মাঝারি আকারের বড় X2 মান তথ্যের টেবিলের জায়গার বাইরে দেখতে না পারে তবে এক্স 3 এবং এক্স সত্ত্বেও যদি X3 মানটি বড় হয়X2X3 নেতিবাচকভাবে সংযুক্ত হচ্ছে তবে সংমিশ্রণটি বিরল। "অন্যান্য ভবিষ্যদ্বাণীকারীদের জন্য অ্যাকাউন্টিং", যেX2 মানটি অস্বাভাবিক আকারে বড় এবং আপনার যুক্ত ভেরিয়েবল প্লটটির উপরে আরও স্পষ্টভাবে আঁকড়ে থাকবে।

আরো টেকনিক্যালি তারা অপর দুই একাধিক রিগ্রেশন চালু করা থেকে অবশিষ্টাংশ হবে: regressing থেকে অবশিষ্টাংশY ছাড়া অন্য সব ভবিষ্যতবক্তা বিরুদ্ধেX2 উল্লম্ব অক্ষ নেভিগেশন এড়িয়ে যান, যখন রিগ্রেশনের থেকে অবশিষ্টাংশX2 সব অন্যান্য ভবিষ্যতবক্তা বিরুদ্ধে অনুভূমিক অক্ষের উপর যান। "Y অন্যকে দিয়েছেন" এবং "X2 অন্যকে দেওয়া হয়েছে" এরকিংবদন্তিগুলিআপনাকে এটি বলছে। যেহেতু এই উভয় পদক্ষেপের মধ্য থেকে গড় অবশিষ্টটি শূন্য, এর বিন্দু (X2 অন্যকে প্রদত্ত,Yঅন্যদের দেওয়া) ঠিক (0, 0) হবে যা ব্যাখ্যা করে যে কেন যুক্ত ভেরিয়েবল প্লটের রিগ্রেশন লাইন সর্বদা উত্সের মধ্য দিয়ে যায়। তবে আমি প্রায়শই দেখতে পাই যে অক্ষগুলি উল্লেখ করা অন্য সংবেদনগুলির কেবলমাত্র অবশিষ্টাংশই মানুষকে বিভ্রান্ত করে (অবাক করা সম্ভবত যেহেতু আমরা এখন চারটি ভিন্ন ভিন্ন প্রকারের কথা বলছি!) তাই আমি বিষয়টি নিয়ে মনোযোগ না দেওয়ার চেষ্টা করেছি। এগুলি " অন্যদের প্রদত্ত X2 " এবং " Y অন্যকে দিয়েছেন " হিসাবে তুলনা করুন এবং আপনার ভাল হওয়া উচিত।


এটি কীভাবে জিজ্ঞাসা করবেন তা নিশ্চিত নন, তবে প্লটগুলিতে দেখা ট্রেন্ডগুলি সম্পর্কে সত্যই কিছু বলা যেতে পারে? উদাহরণস্বরূপ, প্রতিটি প্রবণতার উপযুক্ততার সদ্ব্যবহারের সাথে ভবিষ্যদ্বাণীকারীদের প্রত্যেকটি কতটা স্বাধীন, বা এর মতো কিছুর সাথে সম্পর্কিত?
nnot101

3
অনুভূমিক এবং উল্লম্ব অক্ষের অবশেষের ইউনিটগুলিকে অন্তর্নিহিত ভেরিয়েবলগুলির ইউনিটে অনুবাদ করার জন্য কি কোনও পদ্ধতি বিদ্যমান?
নিকোলাস জি

এটি একটি দুর্দান্ত উত্তর। কিন্তু আপনার প্রথম অনুচ্ছেদে কোনও টাইপো আছে (ভবিষ্যদ্বাণী ভেরিয়েবল)? তাদের এক্স 2 এবং এক্স 3 হওয়া উচিত?
স্পষ্টত

@ ডেটলি ধন্যবাদ, পরিবর্তিত!
সিলভারফিশ 21

সিলভারফিশ, আপনি কি নিকোলাসজি প্রশ্নের উত্তর জানেন? এক্স-ভেরিয়েবলের ইউনিটগুলির ক্ষেত্রে বাকীগুলি কীভাবে ব্যাখ্যাযোগ্য হবে?
পার্সেলটাংয়ে

-1

প্লটগুলিতে দেখা ট্রেন্ডগুলি সম্পর্কে সত্যই কিছু বলা যেতে পারে is

নিশ্চিত যে, তাদের opালু হ'ল আসল মডেল থেকে আধিপত্য সহগ (আংশিক রিগ্রেশন সহগ, অন্যান্য সমস্ত ভবিষ্যদ্বাণী স্থির ছিল)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.