রৈখিক মডেলের অনুমান যাচাই করার জন্য অবশিষ্টাংশ বনাম ফিটেড ভ্যালু প্লটটির ব্যাখ্যা


34

আর (2005, পৃষ্ঠা 59) দিয়ে ফারাওয়ের লিনিয়ার মডেলগুলির নিম্নলিখিত চিত্রটি বিবেচনা করুন।

এখানে চিত্র বর্ণনা লিখুন

প্রথম প্লটটি মনে হয় যে অবশিষ্টাংশ এবং লাগানো মানগুলি অসংলগ্ন, কারণ তারা সাধারণত বিতরণ করা ত্রুটিযুক্ত হোমোসিস্টেস্টিক লিনিয়ার মডেলে থাকতে হবে। সুতরাং, দ্বিতীয় এবং তৃতীয় প্লটগুলি, যা অবশিষ্টাংশ এবং লাগানো মানগুলির মধ্যে নির্ভরতা নির্দেশ করে বলে মনে হয়, একটি ভিন্ন মডেল প্রস্তাব করে।

তবে দ্বিতীয় প্লটটি কেন ফ্যারাওয়ে নোট হিসাবে, হেটেরোসেসটাস্টিক লিনিয়ার মডেল হিসাবে পরামর্শ দেয়, যখন তৃতীয় প্লটটি একটি অ-রৈখিক মডেল প্রস্তাব করে?

দ্বিতীয় চক্রান্তটি ইঙ্গিত দেয় বলে মনে হয় যে অবশিষ্টাংশের পরম মান দৃ positive়ভাবে যথাযথভাবে লাগানো মানগুলির সাথে সম্পৃক্ত, যেখানে তৃতীয় চক্রান্তে এ জাতীয় কোনও প্রবণতা স্পষ্ট হয় না। সুতরাং যদি এটি হয় তবে তাত্ত্বিকভাবে বলা যায় যে সাধারণভাবে বিতরণ করা ত্রুটিযুক্ত একটি হেটেরোসেসটেস্টিক লিনিয়ার মডেলটিতে

করি(,Y^)=[1111]

(যেখানে বাম দিকের বাকী অংশটি অবশিষ্টাংশ এবং লাগানো মানগুলির মধ্যে ভেরিয়েন্স-কোভেরিয়েন্স ম্যাট্রিক্স রয়েছে) দ্বিতীয় এবং তৃতীয় প্লট কেন ফ্যারাওয়ের ব্যাখ্যার সাথে একমত বলে ব্যাখ্যা করবে।

তবে এটাই কি? যদি তা না হয় তবে দ্বিতীয় এবং তৃতীয় প্লটের ফ্যারাওয়ের ব্যাখ্যা কীভাবে ন্যায়সঙ্গত হতে পারে? এছাড়াও, তৃতীয় প্লটটি অ-লিনিয়ারিটি অগত্যা কেন নির্দেশ করে? এটি কি লিনিয়ার এটি সম্ভব নয়, তবে ত্রুটিগুলি হয় সাধারণত বিতরণ করা হয় না, অন্যথায় সেগুলি সাধারণত বিতরণ করা হয়, তবে শূন্যের মাঝখানে হয় না?


3
তিনটি প্লটের মধ্যে কোনওটিই পারস্পরিক সম্পর্ক দেখায় না (কমপক্ষে লিনিয়ার পারস্পরিক সম্পর্ক নয়, এটি " অবশিষ্টাংশ এবং লাগানো মানগুলি অসংলগ্ন )" অর্থে 'পারস্পরিক সম্পর্ক' এর প্রাসঙ্গিক অর্থ )
গ্লেন_বি -রিনস্টেট মনিকা

1
@ গ্লেন_বি: ধন্যবাদ "অনুচ্ছেদ" এর জন্য "নির্ভরতা" প্রতিস্থাপন করে আপনি যে অনুচ্ছেদটি উল্লেখ করছেন তা আমি সংশোধন করেছি।
ইভান আড

উত্তর:


46

নীচে চিহ্নিত চিহ্নযুক্ত প্রতিটি মান (এবং এর ফলে ) পয়েন্টগুলির আনুমানিক গড় এবং স্প্রেড সহ আনুষাঙ্গিক প্লটগুলি রয়েছে - শর্তযুক্ত গড় (লাল) এবং শর্তসাপেক্ষ বোঝার জন্য একটি মোটামুটিভাবে ( (মোটামুটি!) শর্তসাপেক্ষ স্ট্যান্ডার্ড বিচ্যুতি (বেগুনি) এর দ্বিগুণ:±এক্স±

আনুমানিক গড় সঙ্গে ডায়াগনস্টিক প্লট এবং চিহ্নিত প্রতিটি মান হিসাবে ছড়িয়ে পড়ে

  • দ্বিতীয় প্লটটি দেখায় যে গড় অবশিষ্টাংশগুলি উপযুক্ত মানগুলির সাথে পরিবর্তিত হয় না (এবং এটি পরিবর্তিত হয় না ), তবে অবশিষ্টাংশগুলির প্রসার (এবং তাই লাগানো লাইনের বিষয়ে এর) বৃদ্ধি পাওয়ায় লাগানো মান (বা ) পরিবর্তন। অর্থাৎ, বিস্তারটি ধ্রুবক নয়। Heteroskedasticity।y xএক্সYএক্স

  • তৃতীয় প্লটটি দেখায় যে লাগানো মানটি যখন ছোট থাকে তখন চাপাগুলি বেশিরভাগ নেতিবাচক থাকে, যখন লাগানো মানটি বড় হয় যখন সজ্জিত মান মাঝখানে হয় এবং negativeণাত্মক হয়। যে বিস্তার প্রায় ধ্রুবক, হয়, কিন্তু শর্তসাপেক্ষ গড় নয় - লাগানো লাইন বর্ণনা কীভাবে রূপে আচরণ করবে পরিবর্তন, যেহেতু সম্পর্ক বাঁকা হয়।xYএক্স

এটি কি লিনিয়ার এটি সম্ভব নয়, তবে ত্রুটিগুলি হয় সাধারণত বিতরণ করা হয় না, অন্যথায় সেগুলি সাধারণত বিতরণ করা হয়, তবে শূন্যের মাঝখানে হয় না?

আসলেই নয় *, এই পরিস্থিতিতে প্লটগুলি তৃতীয় প্লটের চেয়ে আলাদা দেখায়।

(i) ত্রুটিগুলি যদি স্বাভাবিক থাকে তবে শূন্যকে কেন্দ্র করে না, তবে say বলুন, তবে মধ্যবর্তী ত্রুটিটি বেছে নেবে এবং সুতরাং অনুমান করা ইন্টারসেপ্টটি (এটি হবে প্রত্যাশিত মান, তবে এটি ত্রুটির সাথে অনুমান করা হয়)। ফলস্বরূপ, আপনার অবশিষ্টাংশগুলির এখনও শর্তসাপেক্ষ শূন্য শূন্য থাকবে এবং সুতরাং প্লটটি উপরের প্রথম প্লটের মতো দেখাবে।β 0 + θθβ0+ +θ

(ii) ত্রুটিগুলি সাধারণত বিন্দুগুলিকে বিতরণ না করা হলে কেন্দ্রের লাইন ছাড়া অন্য কোথাও বিন্দুর প্যাটার্নটি ঘন হতে পারে (যদি ডেটা আঁকানো থাকে) তবে বলুন, তবে স্থানীয় গড় অবশিষ্টগুলি এখনও 0 এর কাছাকাছি থাকবে।

অ-স্বাভাবিক ত্রুটি

এখানে বেগুনি রেখাগুলি এখনও একটি (খুব) প্রায় 95% ব্যবধানের প্রতিনিধিত্ব করে, তবে এটি আর প্রতিসম নয়। (আমি এখানে মূল বিষয়টিকে অস্পষ্ট করা এড়াতে কয়েকটি বিষয় নিয়ে চকচকে করছি))

* এটি অগত্যা অসম্ভব নয় - যদি আপনার "ত্রুটি" শব্দটি থাকে যা সত্যই ত্রুটির মতো আচরণ করে না - বলুন যেখানে এবং এর সাথে সঠিকভাবে যুক্ত রয়েছে - আপনি এ জাতীয় কিছু তৈরি করতে সক্ষম হতে পারেন। তবে আমরা ত্রুটি শব্দটি সম্পর্কে অনুমান করি, যেমন এটি এর সাথে সম্পর্কিত নয় , উদাহরণস্বরূপ, এবং এর শূন্য অর্থ আছে; এটি করার জন্য আমাদের কমপক্ষে সেই ধরণের কিছু অনুমান ভাঙতে হবে। (অনেক ক্ষেত্রে আপনার এই সিদ্ধান্তের অনুপস্থিতির কারণ থাকতে পারে যে এ জাতীয় প্রভাবগুলি অনুপস্থিত বা কমপক্ষে তুলনামূলকভাবে কম হওয়া উচিত))y xএক্সYএক্স


1
আমি সঠিকভাবে বুঝতে পারি কিনা তা আমাকে দেখতে দিন। Homoscedasticity গড় যা ত্রুটির বিস্তারের এক্স উপর নির্ভর করে না করে (এবং অত: পর উপর নির্ভর করে না পারেন, যেহেতু একটি ফাংশন )? Y এক্সY^Y^এক্স
ইভান এড

2
হোমসকেডাস্টিকটির আক্ষরিক অর্থ "একই স্প্রেড"। প্রতিটি ডাটা পয়েন্টে প্রতিক্রিয়াটির (জনসংখ্যা) বৈকল্পিক একই হওয়া উচিত। এটি সমান হতে পৃথক হতে পারে এমন পর্যবেক্ষণযোগ্য উপায়গুলির মধ্যে একটি হ'ল যদি এটি গড়ের সাথে পরিবর্তিত হয় (লাগানো অনুসারে অনুমান); অন্য উপায়টি হ'ল যদি এটি কিছু স্বতন্ত্র ভেরিয়েবলের সাথে পরিবর্তিত হয় (যদিও সাধারণ প্রতিরোধের জন্য সম্ভবত বেশিরভাগ ক্ষেত্রে কেবলমাত্র একটি স্বাধীন ভেরিয়েবল পাওয়া যায়, সুতরাং দুটি মূলত একই জিনিস হবে)। আপনি একটি অবস্থা যেখানে সঙ্গে গড় পরিবর্তন কল্পনা করতে পারে কিন্তু বিস্তার পরিবর্তন , যা নিজেই এর সাথে সম্পর্কিত নয় । x 2 x 1এক্স1এক্স2এক্স1
গ্লেন_বি -রিনস্টেট মনিকা

1
(সিটিডি) ... এটি এখনও একই স্প্রেড থাকা সমস্ত পর্যবেক্ষণের লঙ্ঘন হবে। [আমি এবং লাগানো মানগুলির মধ্যে পার্থক্য নিয়ে একটু আলগা হয়ে যাচ্ছিলাম ; আমি এটি পরিষ্কার করার চেষ্টা করব]]এক্স
গ্লেন_বি -রিনস্টেট মনিকা

ধন্যবাদ. পরিস্থিতি এখন আরও পরিষ্কার। আমি ভেবেছিলাম যে সমকামিতা বলতে বোঝায় যে ত্রুটির ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্সের ফর্মটি এবং তাই, বিশেষত, যদি ত্রুটি ভেক্টরটি হিসাবে বিতরণ করা হয় কিছু স্বেচ্ছাচারী, প্রতিসম মেট্রিক্স , মডেলটি হেটেরোসেসটেস্টিক ছিল। এখন আমি বুঝতে পারি যে এটি কেস নয়। তবে এখন যেহেতু আমি সমকামিতার অর্থ বুঝতে পেরেছি, আমার আরও একটি প্রশ্ন রয়েছে। ফ্যারাওয়ের প্রথম চক্রান্ত থেকে এটি কি বলা সম্ভব যে ত্রুটির ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্সের ফর্মটি ? এটি কিছু নির্বিচারে হতে পারে ? N ( 0 , V ) V σ 2 I Vσ2আমিএন(0,ভী)ভীσ2আমিভী
ইভান এড

1
(সিটিডি) ... যেমন আপনি আমার উত্তরের নীচে আমার প্রথম মন্তব্যটি দেখতে সক্ষম হবেন, বিশেষত বাক্যটি "আপনি কল্পনা করতে পারেন ..." শুরুর ফলস্বরূপ - তবে এটি সম্পর্কিত যে ভিন্নধর্মী গড়
গ্লেন_বি -রিনস্টেট মনিকা

2

তুমি লিখেছিলে

দ্বিতীয় প্লটটি বোঝায় যে অবশিষ্টাংশগুলির পরম মানটি দৃted়ভাবে যথাযথভাবে লাগানো মানগুলির সাথে সম্পর্কযুক্ত,

এটি "মনে হয় না", এটি করে। এবং এটি হেটেরোস্কেস্টিক মানে।

তারপরে আপনি সমস্ত 1 এর একটি ম্যাট্রিক্স দেন যা অপ্রাসঙ্গিক; পারস্পরিক সম্পর্ক বিদ্যমান এবং 1 এর চেয়ে কম হতে পারে।

তাহলে আপনি লিখুন

এছাড়াও, তৃতীয় প্লটটি অ-লিনিয়ারিটি অগত্যা কেন নির্দেশ করে? এটি কি লিনিয়ার এটি সম্ভব নয়, তবে ত্রুটিগুলি হয় সাধারণত বিতরণ করা হয় না, অন্যথায় সেগুলি সাধারণত বিতরণ করা হয়, তবে শূন্যের মাঝখানে হয় না?

তারা কি অর্ধেক উপরে প্রায় 0. হাফ সেন্টার বা তাই 0 থেকে কম হয়। এগুলি প্লট থেকে সাধারণত বিতরণ করা হয় কিনা তা বলা শক্ত, তবে অন্য যে প্লট সাধারণত সুপারিশ করা হয় তা হ'ল অবশিষ্টাংশগুলির একটি কোয়ান্টাইল স্বাভাবিক প্লট, এবং এটি প্রদর্শিত হবে যে তারা স্বাভাবিক কিনা or


এন(0,ভী)ভীσ2আমি

1
একটি কোয়ান্টাইল সাধারণ প্লটটি কেবল স্বাভাবিকতা দেখায়। প্রথম চক্রান্তে সমকামী হওয়ার প্রমাণটি দৃশ্যমান
পিটার ফ্লুম - মনিকা পুনরায়

@ পিটারফ্লোম: নেক্রোপোস্টের জন্য দুঃখিত: প্রমানের বিষয়ে আমি কিছুটা বিভ্রান্ত হয়েছি যার দ্বারা আমরা প্রতিটি বিন্দুতে ত্রুটি বিবেচনা করি (xi, yi): আমরা কি বেশ কয়েকটি প্রতিক্রিয়া (xi, y1_1), (xi, yi_2) বিবেচনা করি ... , (xi, yi_m) ইনপুট এক্স এর জন্য; i = 1,2, ..., n (ডাটা পয়েন্টের সংখ্যা) এবং তারপরে yi_j মানগুলির জন্য গড় এবং তারতম্যটি সন্ধান করবেন? আমি কেন লিনিয়ার রিগ্রেশন y = ax + b, x, y, a (বা এক বহুমাত্রিক এক y + a1x1 + a2x2 + ... উদ্দীপনা তারপর আই, xi) এলোমেলো পরিবর্তনশীল এবং স্থির। মানগুলি কেন ঠিক তা নিয়ে আমি বিভ্রান্ত হয়ে পড়েছি। এছাড়াও, আমরা কি প্রতিটি জোড় ভবিষ্যদ্বাণী এবং প্রতিটি জোড়া (y, x_i) এর জন্য স্বতন্ত্র মূল্যের সাথে এই বিশ্লেষণ করি?
গ্যারি

আপনি কী সম্পর্কে বিভ্রান্ত তা আমি বুঝতে পারি না। প্রতিটি পর্যবেক্ষণের জন্য y এর পূর্বাভাসকৃত মান এবং y এর প্রকৃত মান রয়েছে। অবশিষ্ট তাদের মধ্যে পার্থক্য।
পিটার ফ্লুম - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.