রৈখিক মডেলগুলির অনুমান এবং যদি অবশিষ্টাংশগুলি সাধারণত বিতরণ না করা হয় তবে কী করবেন


22

রৈখিক প্রতিরোধের অনুমানগুলি কী তা নিয়ে আমি কিছুটা বিভ্রান্ত।

এখনও পর্যন্ত আমি যাচাই করেছি কিনা:

  • সমস্ত ব্যাখ্যামূলক ভেরিয়েবল প্রতিক্রিয়া ভেরিয়েবলের সাথে রৈখিকভাবে সম্পর্কযুক্ত। (এটি ছিল)
  • ব্যাখ্যামূলক ভেরিয়েবলগুলির মধ্যে কোনও মিল ছিল। (সামান্য তাত্পর্য ছিল)।
  • আমার মডেলের ডেটাপয়েন্টগুলির কুকের দূরত্ব 1 এর নীচে (এটি হ'ল, সমস্ত দূরত্ব 0.4 এর নীচে, সুতরাং কোনও প্রভাব বিন্দু নেই)।
  • অবশিষ্টাংশ সাধারণত বিতরণ করা হয়। (এই ক্ষেত্রে নাও হতে পারে)

তবে আমি তখন নিম্নলিখিতটি পড়ি:

স্বাভাবিকতার লঙ্ঘন প্রায়শই ঘটে কারণ (ক) নির্ভরশীল এবং / অথবা স্বতন্ত্র ভেরিয়েবলগুলির বিতরণগুলি এগুলি উল্লেখযোগ্যভাবে অস্বাভাবিক এবং / অথবা (খ) লিনিয়ারিটি অনুমান লঙ্ঘন করা হয়।

প্রশ্ন 1 এটি এটিকে শোনায় যেন স্বতন্ত্র এবং নির্ভরশীল ভেরিয়েবলগুলি সাধারণত বিতরণ করা প্রয়োজন তবে আমি যতদূর জানি এটি তেমন নয়। আমার নির্ভরশীল পরিবর্তনশীল পাশাপাশি আমার একটি স্বাধীন ভেরিয়েবল সাধারণত বিতরণ করা হয় না। তাদের থাকা উচিত?

প্রশ্ন 2 আমার কিউকিউনিকাল প্লটটি অবশিষ্টাংশগুলির মতো দেখাচ্ছে:

অবশিষ্টাংশের স্বাভাবিকতা চেক

এটি একটি সাধারণ বিতরণ থেকে কিছুটা পৃথক এবং shapiro.testনাল অনুমানকেও প্রত্যাখ্যান করে যে অবশিষ্টাংশগুলি একটি সাধারণ বিতরণ থেকে:

> shapiro.test(residuals(lmresult))
W = 0.9171, p-value = 3.618e-06

লাগানো মানগুলির তুলনায় অবশিষ্টাংশগুলি দেখতে দেখতে:

অবশিষ্টাংশ বনাম লাগানো

আমার অবশিষ্টাংশগুলি সাধারণত বিতরণ না করা হলে আমি কী করতে পারি? এর অর্থ লিনিয়ার মডেলটি সম্পূর্ণ অকেজো?


3
আপনার অবশিষ্টাংশ বনাম ফিটেড প্লট পরামর্শ দেয় যে আপনার নির্ভরশীল ভেরিয়েবলের নিম্ন সীমা রয়েছে has এটি আপনার দেখতে প্যাটার্নগুলি চালনা করতে পারে। এটি আপনাকে বিবেচনা করতে পারে এমন বিকল্প মডেলের জন্য একটি ইঙ্গিত দিতে পারে।
মার্টেন বুইস

উত্তর:


25

প্রথমে, আমি নিজের কাছে এই ক্লাসিক এবং পৌঁছনীয় নিবন্ধটির একটি অনুলিপি পেয়েছি এবং এটি পড়তে পারি: আনসকম্ব এফজে। (1973) পরিসংখ্যান বিশ্লেষণ গ্রাফ আমেরিকান পরিসংখ্যানবিদ । 27: 17-21।

আপনার প্রশ্নে:

উত্তর 1: নির্ভরশীল বা স্বতন্ত্র ভেরিয়েবলের সাধারণত বিতরণ করা দরকার না। আসলে তারা সমস্ত ধরণের লুপ বিতরণ করতে পারে। স্বাভাবিকতা অনুমান ত্রুটিগুলির বিতরণে প্রযোজ্য ( YiY^i)।

উত্তর ২: আপনি সাধারণ ন্যূনতম স্কোয়ার (ওএলএস) রিগ্রেশন সম্পর্কিত দুটি পৃথক অনুমান সম্পর্কে জিজ্ঞাসা করছেন:

  1. একটি হ'ল রৈখিকতার অনুমান । এর অর্থ হ'ল Y এবং X মধ্যে সম্পর্কটি একটি সরলরেখার দ্বারা প্রকাশ করা হয় (ডান? সোজা পিছনে বীজগণিত: y=a+bx , যেখানে a হ'ল y -intercept, এবং b লাইনটির of াল ।) লঙ্ঘন এই অনুমানের সহজ অর্থ হল যে সম্পর্কটি কোনও সরলরেখার দ্বারা ভালভাবে বর্ণিত হয় না (যেমন, Yএক্স এর একটি সাইনোসাইডাল ফাংশনX , বা চতুর্ভুজ ফাংশন, বা এমনকি একটি সোজা লাইন যা কোনও সময়ে opeাল পরিবর্তন করে)। অ-রৈখিকতার জন্য আমার নিজস্ব দ্বি-পদক্ষেপের পদ্ধতিটি হল (১) Y এবং X মধ্যে নির্দিষ্ট ননরেখা সংক্রান্ত কার্যকারিতা সম্পর্কিত সম্পর্কগুলি বোঝার জন্য কিছু ধরণের নন-প্যারাম্যাট্রিক স্মুথিং রিগ্রেশন করা (উদাহরণস্বরূপ, স্বল্পতা বা জিএএম ব্যবহার করে)গুলি, ইত্যাদি), এবং (2) একটি কার্মিক সম্পর্ক হয় একটি একাধিক রিগ্রেশন যে nonlinearities অন্তর্ভুক্ত ব্যবহার নির্দিষ্ট করতে X , (যেমন, YX+X2 ), অথবা অরৈখিক লিস্ট স্কোয়ার রিগ্রেশন মডেল যে এক্স (যেমন পরামিতি মধ্যে nonlinearities অন্তর্ভুক্ত YX+max(Xθ,0) , যেখানেtheএমনθ প্রতিনিধিত্ব করে যেখানে এক্স-এর উপরY রিগ্রেশন রেখাchangesাল পরিবর্তন করে।X

  2. আরেকটি হ'ল সাধারণত বিতরণকৃত অবশিষ্টাংশের অনুমান। কখনও কখনও কেউ বৈধতার সাথে ওএলএস প্রসঙ্গে অ-স্বাভাবিক অবশিষ্টাংশগুলি নিয়ে চলে যেতে পারেন; উদাহরণস্বরূপ, লামলে টি, এমারসন এস। (2002) বৃহত্তর জনস্বাস্থ্যের ডেটা সেটগুলিতে স্বাভাবিকতা অনুমানের গুরুত্বজনস্বাস্থ্যের বার্ষিক পর্যালোচনা । 23: 151-69। কখনও কখনও, কেউ পারবেন না (আবার, আনসকম্ব নিবন্ধটি দেখুন)।

তবে, আমি ওএলএস-তে অনুমানগুলি সম্পর্কে আপনার ডেটার পছন্দসই বৈশিষ্ট্যগুলির চেয়ে বেশি নয়, বরং প্রকৃতি বর্ণনা করার জন্য প্রস্থানের আকর্ষণীয় পয়েন্ট হিসাবে চিন্তা করার পরামর্শ দেব। সর্বোপরি, আমরা বিশ্বে যা যত্ন করি তার বেশিরভাগই এর চেয়ে আকর্ষণীয়y ইন্টেরসেপ্ট এবং opeালের। সৃজনশীলভাবে ওএলএস অনুমানগুলি (যথাযথ পদ্ধতি সহ) লঙ্ঘন করা আমাদের আরও আকর্ষণীয় প্রশ্ন জিজ্ঞাসা ও উত্তর দিতে দেয়।


2
ধন্যবাদ! কিছু পরিসংখ্যান কোর্সের স্লাইডগুলিতে এটি বলেছে যে অনুমানগুলি ব্যর্থ হলে আপনি Y এর রূপান্তর করতে বা ব্যাখ্যামূলক ভেরিয়েবলগুলিকে রূপান্তর করতে চেষ্টা করতে পারেন। আমি যখন উদাহরণস্বরূপ lm (Y ^ 0.3 ~ + X1 + X2 + ...) এর মাধ্যমে যখন Y এর রূপান্তর করি তখন আমার অবশিষ্টাংশগুলি সাধারণত বিতরণে পরিণত হয়। এটি কি বৈধ জিনিস?
স্টিফান

@ স্টেফান হ্যাঁ! প্রতিক্রিয়ার রূপান্তর করা প্রায়শই একটি ভাল জিনিস logএবং সাধারণ পাওয়ার ট্রান্সফর্মগুলি সাধারণ।
গ্রেগর

Var(f(x)f(Var(x))lnY=β0+βXX+εβXeβXβXeCIβX

@ অ্যালেক্সিস: এই পৃষ্ঠাগুলি কেন বলে যে ভেরিয়েবলগুলি সাধারণত বিতরণ করতে হয়? (1) pareonline.net/getvn.asp?n=2&v=8 (2) statisticssolutions.com/...
stackoverflowuser2010

7
Y=β0+βXX+εεN(0,σ)Y=3+0.5×X+N(0,1)YXβ03,βX0.5XY

11

আপনার প্রথম সমস্যাগুলি হ'ল

  • আপনার নিশ্চয়তা সত্ত্বেও, অবশিষ্ট প্লটটি দেখায় যে শর্তাধীন প্রত্যাশিত প্রতিক্রিয়া লাগানো মানগুলিতে লিনিয়ার নয়; গড় জন্য মডেল ভুল।

  • আপনার ধ্রুব বৈকল্পিকতা নেই। বৈকল্পিকের জন্য মডেলটি ভুল।

এমনকি সেখানে সমস্যাগুলির সাথে আপনি স্বাভাবিকতাও মূল্যায়ন করতে পারবেন না ।


প্লটগুলি দেখে আপনি কীভাবে রৈখিকতার বিষয়ে সিদ্ধান্ত নিয়েছেন তা বিস্তারিতভাবে বর্ণনা করুন? আমি বুঝতে পারি যে এখানে সমকামিতা অনুমানটি পূরণ হয় নি।
ডাঃ নিশা অরোরা

y^y^=30060<00303060>60), একটি সরলরেখার আপনার সেরা অনুমান আঁকুন। আমার জন্য মাঝের দুটো তাই আমি তাদের লাইন সংযুক্ত, ভালো কিছু দান, প্রায় সমাপতনিক হয় এই
Glen_b -Reinstate মনিকা

মাঝের অর্ধেক, প্রায় সমস্ত অবশিষ্টাংশ নেতিবাচক, বাইরের অংশগুলিতে প্রায় সমস্ত অবশিষ্টাংশ ইতিবাচক। এগুলি এলোমেলোভাবে অবশিষ্টাংশগুলি দেখতে কেমন তা নয়।
গ্লেন_বি -রাইনস্টেট মনিকা

ধন্যবাদ, @ গ্লেন_ বি। দীর্ঘ ব্যবধানের পরে, আমি আমার ধারণাগুলি পুনর্বিবেচনা করছি যাতে প্রথম স্থানে ভিজ্যুয়ালাইজ করা যায় না।
ডা নিশা অরোরা

যদিও এখানে খুব বেশি কিছু করার দরকার নেই, আমি প্রত্যাশা করি যে মূল তথ্যটি নেতিবাচক হবে এবং একটি সাধারণীকরণীয় রৈখিক মডেল (সম্ভবত লগ-লিঙ্কযুক্ত একটি গামা) বা কোনও রূপান্তর (সম্ভবত লগ-রূপান্তর) আরও উপযুক্ত পছন্দ হবে ।
গ্লেন_বি-রিনস্টেট মনিকা

3

আমি বলব না যে লিনিয়ার মডেলটি সম্পূর্ণ অকেজো। তবে এর অর্থ হ'ল আপনার মডেল আপনার ডেটা সঠিকভাবে / সম্পূর্ণরূপে ব্যাখ্যা করে না। একটি অংশ রয়েছে যেখানে আপনাকে সিদ্ধান্ত নিতে হবে যে মডেলটি "যথেষ্ট ভাল" কিনা।

আপনার প্রথম প্রশ্নের জন্য, আমি মনে করি না যে একটি লিনিয়ার রিগ্রেশন মডেল ধরে নেয় যে আপনার নির্ভরশীল এবং স্বাধীন ভেরিয়েবলগুলি স্বাভাবিক হতে হবে। তবে অবশিষ্টাংশের স্বাভাবিকতা সম্পর্কে ধারণা রয়েছে।

আপনার দ্বিতীয় প্রশ্নের জন্য, দুটি ভিন্ন বিষয় আপনি বিবেচনা করতে পারেন:

  1. বিভিন্ন ধরণের মডেল পরীক্ষা করুন। আর একটি মডেল আপনার ডেটা ব্যাখ্যা করার জন্য ভাল হতে পারে (উদাহরণস্বরূপ, অ-লিনিয়ার রিগ্রেশন ইত্যাদি)। আপনাকে এখনও পরীক্ষা করে দেখতে হবে যে এই "নতুন মডেল" এর অনুমানগুলি লঙ্ঘিত হয়নি।
  2. প্রতিক্রিয়া (ফলাফল) ব্যাখ্যা করার জন্য আপনার ডেটাতে পর্যাপ্ত পরিমাণে কোভারিয়েট (নির্ভরশীল ভেরিয়েবল) না থাকতে পারে। এই ক্ষেত্রে, আপনি অন্য কিছু করতে পারবেন না। কখনও কখনও, আমরা অবশিষ্টাংশগুলি কোনও ভিন্ন বিতরণ (যেমন টি-বিতরণ) অনুসরণ করে কিনা তা পরীক্ষা করে নিতে মেনে নিতে পারি তবে এটি আপনার ক্ষেত্রে মনে হয় না।

আপনার প্রশ্নটি ছাড়াও, আমি দেখতে পাচ্ছি যে আপনার কিউকিউপ্লোটটি "নরমালাইজড" নয়। সাধারণত যখন আপনার অবশিষ্টাংশগুলি মানক করা হয় তখন প্লটের দিকে নজর দেওয়া আরও সহজ, স্ট্রেডগুলি দেখুন

stdres(lmobject)

আমি আশা করি এটি আপনাকে সহায়তা করে, সম্ভবত আমার চেয়ে অন্য কেউ এটি ব্যাখ্যা করবে।


0

পূর্ববর্তী উত্তর ছাড়াও, আমি আপনার মডেলটি উন্নত করতে কিছু পয়েন্ট যুক্ত করতে চাই:

  1. কখনও কখনও অবশিষ্টদের অ-স্বাভাবিকতা বহিরাগতদের উপস্থিতি নির্দেশ করে। যদি এটি হয় তবে প্রথমে আউটলিয়ারদের পরিচালনা করুন।

  2. কিছু রূপান্তর ব্যবহার করে উদ্দেশ্যটির সমাধান করতে পারে।

  3. অতিরিক্তভাবে, বহু-কোলিনারিটির সাথে মোকাবিলা করার জন্য, আপনি https://www.researchgate.net/post/My_data_has_t__bleble_of_multicolinearity_Removing_unique_variables_ using_variance_inflation_factor_VIF_didnt_work_Any_solution উল্লেখ করতে পারেন


-1

আপনার দ্বিতীয় প্রশ্নের জন্য,

অনুশীলনে আমার সাথে ঘটেছিল এমন কিছু হ'ল আমি আমার প্রতিক্রিয়াটিকে অনেক স্বতন্ত্র ভেরিয়েবলের সাথে মানিয়ে নিই। ওভারফিটেড মডেলটিতে আমার নরমাল অবশিষ্ট ছিল না। তবুও, ফলাফলগুলি প্রমাণিত করেছিল যে কিছু সহগতি শূন্য ছিল (২.২-এর চেয়ে বেশি পি-ভ্যালু সহ) এই সম্ভাবনাময়তাটি প্রবর্তনের পক্ষে প্রমাণ গ্রহণ করা যায়নি। সুতরাং একটি দ্বিতীয় মডেলটিতে, একটি পশ্চাদপদ নির্বাচন পদ্ধতি অনুসরণ করে ভেরিয়েবলগুলি খারিজ করে আমি স্বাভাবিক অবশিষ্টাংশগুলি উভয়ই একটি QQplot দ্বারা গ্রাফিকভাবে এবং শাপিরো-উইলক পরীক্ষার মাধ্যমে হাইপোপিসিস পরীক্ষার দ্বারা বৈধ হয়েছি। এটি আপনার ক্ষেত্রে হতে পারে কিনা তা পরীক্ষা করে দেখুন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.