নির্ভরশীল ভেরিয়েবলের সাথে সম্পর্কিত অবশেষের প্লটগুলি অধ্যয়ন করার অর্থ কী?


11

আমি জানতে চাই যে আমি যখন অবিচ্ছিন্ন রিগ্রেশন পেয়েছি তখন নির্ভরশীল ভেরিয়েবলের প্রতি শ্রদ্ধা রেখে অবশিষ্টাংশের প্লটগুলি অধ্যয়ন করা কি বুদ্ধিমান? যদি তা বোঝা যায়, তবে অবশিষ্টাংশগুলির (y- অক্ষের উপর) এবং নির্ভরশীল ভেরিয়েবলের আনুমানিক মানগুলির (এক্স-অক্ষের উপরে) একটি শক্তিশালী, রৈখিক, ক্রমবর্ধমান পারস্পরিক সম্পর্ক কী বোঝায়?

এখানে চিত্র বর্ণনা লিখুন


3
আপনি "শক্তিশালী, লিনিয়ার, ক্রমবর্ধমান পারস্পরিক সম্পর্ক" বলতে কী বুঝছেন তা আমি নিশ্চিত নই। আপনি প্লটটি দেখাতে পারবেন? লাগানো মানগুলির বিরুদ্ধে অবশিষ্টাংশ প্লট করা পুরোপুরি যুক্তিসঙ্গত। সাধারণভাবে, আপনি চান যেন কোনও সম্পর্ক না হয় - কেন্দ্রের মধ্য দিয়ে চলমান একটি সমতল অনুভূমিক লাইন। এছাড়াও, আপনি চান আপনার প্লটের বাম দিক থেকে ডানদিকে অবশিষ্টাংশগুলির উল্লম্ব বিচ্ছুরণ স্থির থাকে।
গুং - মনিকা পুনরায়

ওহে. আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ। এটি প্লট: img100.imageshack.us/img100/7414/bwages.png
লুইজি

এটাই হতবাক। আমি বুঝতে পেরেছি যে আমি বুঝতে পেরেছি: আপনি একটি রিগ্রেশন মডেল চালিয়েছিলেন, তারপরে অবশিষ্টাংশগুলি বনাম উপযুক্ত মানগুলি প্লট করেছিলেন এবং আপনি যা পেয়েছেন তা কি ঠিক? এটি দেখতে দেখতে হবে না। আপনি কী নিজের প্রশ্নটি সম্পাদনা করতে পারবেন এবং মডেল এবং প্লটের জন্য আপনি যে কোডটি ব্যবহার করেছেন তা পেস্ট করতে পারবেন?
গুং - মনিকা পুনরায়

আপনি ঠিক বুঝতে পেরেছেন। আমি দুঃখিত, কিন্তু কোডটি কীভাবে পুনরুদ্ধার করতে হয় তা আমি জানি না, আমি রিগ্রেশন চালিয়েছিলাম এবং গ্রিটল প্রোগ্রামটি দিয়ে অবশিষ্টাংশগুলি প্লট করেছি।
লুইজি

2
আমি নীচে আমার উত্তরটি লিখতে গিয়ে প্রথমে @ চিহ্ন 999 দ্বারা মন্তব্যটি দেখিনি। আমি মনে করি যে তাঁর সন্দেহটি সঠিক, এটি হ'ল বনাম ওয়াই-মান। লুইজি, আপনার গ্রাফটি আবার করুন - ভেরিয়েবলগুলি কী কী সম্পর্কে ভুল হতে পারে যখন এটি ব্যাখ্যা করার চেষ্টা করবেন না।
মাইকেল বিশপ

উত্তর:


12

মনে করুন যে আপনার কাছে রিগ্রেশন রয়েছে , যেখানে β 10 । তারপরে, y i - β 0ϵ iY এর মান যত বেশি , অবশিষ্টগুলি তত বড়। বিপরীতে, এক্স এর বিরুদ্ধে অবশিষ্টাংশের একটি প্লট কোনও নিয়মতান্ত্রিক সম্পর্ক প্রদর্শন করা উচিত। এছাড়াও, পূর্বাভাস মান Y আমি প্রায় হওয়া উচিত β 0yi=β0+β1xi+ϵiβ10yiβ0ϵiyxy^iβ^0--- প্রতিটি পর্যবেক্ষণের জন্য একই। যদি পূর্বাভাসকৃত মানগুলি মোটামুটি একই হয় তবে সেগুলি ত্রুটিগুলির সাথে সংযুক্ত থাকতে হবে।

প্লটটি আমাকে যা বলছে তা হ'ল এবং y মূলত সম্পর্কিত নয় (অবশ্যই এটি দেখানোর আরও ভাল উপায় আছে)। তাহলে আমাদের জানতে আপনার সহগ যাক বিটা 1 0 পাসে নয়।xyβ^1

আরও ভাল ডায়াগনস্টিক হিসাবে, পূর্বাভাস দেওয়া মজুরি বা মানের বিপরীতে অবশিষ্টাংশের প্লট ব্যবহার করুন । এই প্লটগুলিতে আপনার কোনও স্বতন্ত্র প্যাটার্ন পর্যবেক্ষণ করা উচিত নয়।x

আপনি যদি একটু আর বিক্ষোভ চান তবে এখানে যান:

y      <- rnorm(100, 0, 5)
x      <- rnorm(100, 0, 2)
res    <- lm(y ~ x)$residuals
fitted <- lm(y ~ x)$fitted.values
plot(y, res)
plot(x, res)
plot(fitted, res)

β1=0

5

অনুমান করা মডেলটি সঠিকভাবে নির্দিষ্ট করা হয়েছে ...

PX=X(XX)1XPXPX2=PXPX=PX

Cov(Y^,e^)=Cov(PXY,(IPX)Y)=PXCov(Y,Y)(IPX)=σ2PX(IPX)=0

সুতরাং পূর্বাভাসভিত্তিক নির্ভরশীল ভেরিয়েবলের বিপরীতে অবশিষ্টাংশগুলির বিক্ষিপ্ত-প্লটের কোনও সম্পর্ক নেই।

কিন্ত!

Cov(Y,e^)=Cov(Y,(IPX)Y)=Cov(Y,Y)(IPX)=σ2(IPX)

σ2(IPX)

আমি যতদূর জানি গ্রেট মূলত নির্ভরশীল পরিবর্তনশীল (পূর্বাভাসহীন নয়!) এর বিপরীতে অবশিষ্টাংশের গ্রাফটি ডিফল্টরূপে উত্পাদন করে।


আমি বিভিন্ন সম্ভাবনার প্রশংসা করি। এই জায়গা থেকে গ্রিটলের কিছু জ্ঞান সহায়ক। তবে আমি আশ্চর্য হই, এটি কতটা প্রশংসনীয় যে এটি আসল উত্তর হিসাবে। আমার সিমুলেটেড ডেটা ব্যবহার করে, আমি মূল ডিভি বনাম অবশিষ্টাংশগুলি সম্পর্কিত এবং প্লট করেছি; r = .22 এবং প্লটটি অনেকটা আমার তৃতীয় প্লটের মতো দেখায়, প্রশ্ন প্লটের মতো নয়। অবশ্যই, আমি আমার গল্পের বিশ্বাসযোগ্যতা যাচাই করার জন্য এই ডেটাগুলি তৈরি করেছি - সেগুলি আপনার নিজেরাই চেক করা উপযুক্ত নাও হতে পারে।
গুং - মনিকা পুনরায়

@ গুং মানে কি আপনি নিজের সিমুলেটেড ডেটা ব্যবহার করেছেন?
মাইকেল বিশপ

@ মিশেলবিশপ যদি আপনি আমার উত্তরটি দেখুন, আপনি দেখতে পাচ্ছেন যে আমি আমার গল্পটি পোস্টের প্লটের মতো দেখতে লাগবে কিনা তা দেখার জন্য ডেটা সিমুলেট করেছিলাম। আমার কোড এবং প্লট উপস্থাপন করা হয়। যেহেতু আমি বীজটি নির্দিষ্ট করেছি, তাই এটি আর
- মনিকা

4

আপনি কি লাগানো / পূর্বাভাসিত মানগুলি আসল মানগুলির সাথে বিভ্রান্ত করছেন তা সম্ভব?

@ গং এবং @ বিওস্টাত যেমন বলেছে, আপনি আশা করি উপযুক্ত মান এবং অবশিষ্টাংশগুলির মধ্যে কোনও সম্পর্ক নেই। অন্যদিকে, নির্ভরশীল / ফলাফল পরিবর্তনশীল এবং অবশিষ্টাংশের প্রকৃত মূল্যবোধগুলির মধ্যে একটি লিনিয়ার সম্পর্ক সন্ধান করা প্রত্যাশিত এবং এটি বিশেষ তথ্যবহুল নয়।

পূর্ববর্তী বাক্যটি স্পষ্ট করার জন্য যুক্ত করা হয়েছে: কেবলমাত্র অবশিষ্টাংশ এবং আসল মানগুলির মধ্যে যে কোনও লিনিয়ার সম্পর্ক আসবে তা প্রত্যাশিত নয় ... ওয়াইয়ের কম পরিমাপক মানের জন্য, দরকারী মডেল থেকে Y এর পূর্বাভাসকৃত মানগুলি তার চেয়ে বেশি হতে পারে প্রকৃত পরিমাপ করা মান এবং তদ্বিপরীত।


আপনি যা বলছেন তার নিদর্শনটি হ'ল, যদি মানগুলি Y এর নিম্ন মানেরগুলিতে ধারাবাহিকভাবে নিম্নোক্ত হয় এবং Y এর উচ্চ মানগুলিতে ধারাবাহিকভাবে অতিরিক্ত অনুমান করা হয় তবে তা ঠিক। এটা সমস্যা, তাই না?
রোল্যান্ডো 2

@ রোল্যান্ডো 2, আপনি যা বলেছিলেন তা আমি ইমপ্লিট করি নি তবে সম্ভবত আমার উত্তরটি পরিষ্কার করা উচিত। যেমনটি আপনি বলেছেন, ওয়াই এর কম ভেলগুলিতে ধারাবাহিকভাবে আন্ডারপ্রেডিক্টিকেশন করা এবং ওয়াইয়ের উচ্চ মানেরগুলিতে অত্যধিক ভবিষ্যদ্বাণী করা একটি খুব খারাপ মডেলের চিহ্ন হবে। আমি বিপরীতে কল্পনা করেছিলাম, ওয়াইয়ের স্বল্পমূল্যে অতিরিক্ত ধারণা করা এবং ওয়াইয়ের উচ্চ মানেরগুলিকে অনুমান করা This এই ঘটনাটি সাধারণ এবং আপনি যে নির্ভরশীল পরিবর্তনশীলটির ব্যাখ্যা দিতে সক্ষম হবেন তার অনুপাতের মধ্যে মোটামুটি আশা করা যায়। ভাবুন যে আপনার কোনও পরিবর্তনকের অভাব রয়েছে যা ওয়াইয়ের পূর্বাভাস দেয়, তাই আপনি সর্বদা আপনার ভবিষ্যদ্বাণী হিসাবে
মাইকেল বিশপ

1
আপনি যা বলেছেন তা আমার কাছে একটি জিনিস ব্যতীত তা উপলব্ধি করে। আমার কল্পনা করতে সমস্যা হচ্ছে যে লুইজি যতটা প্রবণতা দেখিয়েছে ততই প্রবণতা একটি শব্দ বা আকাঙ্ক্ষিত সমাধানে প্রদর্শিত হবে, এমনকি ট্রেন্ডটি উপরের বাম থেকে নীচে ডান দিকে চলে গেলেও।
Rolando2

1
@ রোল্যান্ডো 2, অবশিষ্টাংশগুলি সাধারণত পর্যবেক্ষণ - লাগানো হিসাবে সংজ্ঞায়িত করা হয়, তাই নেতিবাচক অবশিষ্টাংশগুলি অত্যধিক পূর্বাভাস। সামান্য ব্যাখ্যামূলক শক্তির সাথে একটি সঠিকভাবে নির্দিষ্ট মডেলটিতে - আমি একজন সামাজিক বিজ্ঞানী তাই আমি এই সব সময় দেখি - অবশিষ্টাংশ এবং পর্যবেক্ষণের ফলাফলের মানগুলির মধ্যে একটি দৃ a় ইতিবাচক সম্পর্ক থাকবে। যদি এটি একটি অবশিষ্টাংশ বনাম প্রকৃত প্লট হয়, তবে উপরের বাম থেকে নীচের দিকে ডানদিকে প্রবণতাটি কোনও খারাপভাবে চিহ্নিত নির্দিষ্ট মডেলের সংকেত হবে যা আপনি প্রাথমিকভাবে উদ্বিগ্ন হয়েছিলেন।
মাইকেল বিশপ

ঠিক আছে, আমার দোষ মাইকেল বিশপ এবং রোহ যেমন লিখেছেন, গ্রেটল পর্যবেক্ষণ করা y এর প্রতি শ্রদ্ধা রেখে প্লট করেছেন , পূর্বাভাসের সাথে নয়। আমি এই সমস্ত গণ্ডগোলের জন্য খুব দুঃখিত, আমি সত্যিই এই সমস্ত উত্তর আশা করিনি। আমি একজন শিক্ষানবিস এবং আমি এই ত্রুটিটি করেছি, তাই আমি আশা করি আপনি আমাকে "ক্ষমা" করতে পারেন। যাইহোক, আমি মনে করি যে এটি আমাকে নির্দেশ করে যে আমার আরও ব্যাখ্যামূলক ভেরিয়েবল ব্যবহার করা উচিত ছিল। সবাইকে ধন্যবাদ!
লুইজি

3

দেওয়া উত্তরগুলি আমাকে এখানে কী চলছে সে সম্পর্কে কিছু ধারণা দেয়। আমি বিশ্বাস করি দুর্ঘটনার কারণে কিছু ভুল হয়েছে। নীচের গল্পটি বোধগম্য হয়েছে কিনা তা দেখুন: শুরু করার জন্য, আমি মনে করি ডেটাতে এক্স এবং ওয়াইয়ের মধ্যে সম্ভবত একটি দৃ relationship় সম্পর্ক রয়েছে (এখানে কিছু কোড এবং একটি প্লট রয়েছে):

set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")

এখানে চিত্র বর্ণনা লিখুন

তবে ভুল করে ওয়াইয়ের ঠিক আগে থেকেই ভবিষ্যদ্বাণী করা হয়েছিল। এটিকে জটিল করে, কেবলমাত্র মডেলের অবশিষ্টাংশগুলি এক্স এর বিরুদ্ধে ষড়যন্ত্র করা হয়েছিল, যদিও যা উদ্দেশ্য ছিল তা লাগানো মানগুলির (কোড এবং প্লট) বিরুদ্ধে প্লট করা হয়েছিল:

meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red", 
    main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")

এখানে চিত্র বর্ণনা লিখুন

আমরা উপযুক্ত মডেলটি ফিট করে এবং সেই (কোড ও প্লট) থেকে অবশিষ্টাংশ প্লট করে এটি ঠিক করতে পারি:

appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))

এখানে চিত্র বর্ণনা লিখুন

এটি শুরু করার সময় আমি যে ধরণের গোফ-আপগুলি তৈরি করেছি তার মতো মনে হচ্ছে।


0

এই গ্রাফটি নির্দেশ করে যে আপনি যে মডেলটি ফিট করেছেন তা ভাল নয়। যেমন @ গুং মূল প্রশ্নের প্রথম মন্তব্যে বলেছিল যে পূর্বাভাস দেওয়া প্রতিক্রিয়া এবং অবশিষ্টাংশের মধ্যে কোনও সম্পর্ক থাকা উচিত নয়।

"একটি বিশ্লেষক একটি র্যান্ডম ফ্যাশন একটি প্রতিক্রিয়া পূর্বাভাসের ভুল করার জন্য একটি রিগ্রেশন মডেল আশা করা উচিত; মডেল প্রকৃত বেশী মান ভবিষ্যদ্বাণী করা ও সমান সম্ভাবনা সঙ্গে প্রকৃত কম উচিত দেখুন। এই "

তাদের মধ্যে সম্পর্কটি দেখার জন্য আমি প্রথম চক্রান্তের প্রতিক্রিয়া বনাম স্বতন্ত্র ভেরিয়েবলের প্রস্তাব দেব। মডেলটিতে বহুপদী পদ যুক্ত করা যুক্তিসঙ্গত হতে পারে।


0

এক্স-ওয়াই ভেরিয়েবলের মধ্যে সম্পর্ক না থাকলে এটিই কি হয় না? এই গ্রাফটি দেখার থেকে, এটি প্রতীয়মান হয় যে আপনি মূলত Y এর সাথে এর মধ্য দিয়ে ভবিষ্যদ্বাণী করছেন।


0

আমি মনে করি ওপি মূল রেসপন্স ভেরিয়েবল বনাম অবশিষ্টাংশ প্লট করেছে (মডেল থেকে লাগানো প্রতিক্রিয়ার ভেরিয়েবল নয়)। আমি প্রায় একই একই নিদর্শন সহ এরকম প্লটগুলি সর্বদা দেখি। নিশ্চিত করুন যে আপনি অবশিষ্টগুলি বনাম ফিটেড মানগুলি প্লট করেছেন, কারণ আমি নিশ্চিত নই যে আপনি কীসের অর্থপূর্ণ অনুমানের ভার্সনগুলি বনাম মূল ওয়াইয়ের কাছ থেকে সংগ্রহ করতে পারেন তবে আমি অবশ্যই ভুল হতে পারি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.