লিনিয়ার রিগ্রেশন মডেলের আত্মবিশ্বাস এবং পূর্বাভাস অন্তর


9

ঠিক আছে, তাই আমি লিনিয়ার রিগ্রেশন বোঝার চেষ্টা করছি। আমি একটি ডেটা সেট পেয়েছি এবং এটি দেখতে বেশ ঠিক আছে, তবে আমি বিভ্রান্ত। এটি আমার লিনিয়ার মডেল-সারসংক্ষেপ:

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 0.2068621  0.0247002   8.375 4.13e-09 ***
temp        0.0031074  0.0004779   6.502 4.79e-07 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Residual standard error: 0.04226 on 28 degrees of freedom
Multiple R-squared: 0.6016, Adjusted R-squared: 0.5874 
F-statistic: 42.28 on 1 and 28 DF,  p-value: 4.789e-07 

সুতরাং, পি-মানটি সত্যিই কম, যার অর্থ x সুযোগের সাথে কেবল x, y এর মধ্যে পারস্পরিক সম্পর্ক পাওয়া খুব সম্ভব নয়। যদি আমি এটি ষড়যন্ত্র করি এবং তারপরে রিগ্রেশন লাইনটি এটিকে দেখায়: http://s14.directupload.net/images/120923/l83eellv.png (এটি ছবিতে থাকলেও আমি ছিলাম - নতুন ব্যবহারকারী হিসাবে - বর্তমানে নেই এটি পোস্ট করার অনুমতি দেওয়া হয়েছে) নীল লাইনগুলি = আত্মবিশ্বাসের ব্যবধান সবুজ রেখাগুলি = পূর্বাভাস অন্তর

এখন অনেক পয়েন্ট আত্মবিশ্বাসের ব্যবধানে পড়ে না, কেন এমন হবে? আমি মনে করি যে ডেটাপয়েন্টগুলির মধ্যে কোনওটিই রেগ্রেশন লাইনে পড়ে না খ / তারা একে অপর থেকে একেবারে দূরে, তবে আমি যে সম্পর্কে নিশ্চিত নই: এটি কি আসল সমস্যা? তারা এখনও রিগ্রেশন লাইনের চারপাশে রয়েছে এবং আপনি সম্পূর্ণরূপে একটি প্যাটার্ন দেখতে পারেন। তবে কি যথেষ্ট? আমি এটি বের করার চেষ্টা করছি, তবে আমি বারবার নিজেকে একই প্রশ্ন জিজ্ঞাসা করি।

আমি এতক্ষণ যা ভেবেছিলাম: আত্মবিশ্বাসের ব্যবধান বলে যে আপনি যদি সিআই এর বারবার গণনা করেন তবে 95% বারে সত্যিকার গড়টি সিআইয়ের মধ্যে পড়ে। সুতরাং: এটি কোনও সমস্যা নয় যে ডিপি এটির মধ্যে পড়ে না কারণ এগুলি সত্যই উপায় নয়। অন্যদিকে ভবিষ্যদ্বাণী ব্যবস্থায় বলা হয়েছে যে আপনি যদি পিআই এর বার বার গণনা করেন তবে 95% বারে সত্যিকারের ভ্যালু ব্যবধানের মধ্যে পড়ে। সুতরাং, এটিতে পয়েন্টগুলি থাকা (যা আমার কাছে রয়েছে) হওয়া বেশ গুরুত্বপূর্ণ। তারপরে আমি পড়েছি পিআই সর্বদা সিআই এর চেয়ে বিস্তৃত পরিসর থাকা উচিত। কেন এমন? এটি আমিই করেছি:

conf<-predict(fm, interval=c("confidence"))
prd<-predict(fm, interval=c("prediction"))

এবং তারপরে আমি এটির মাধ্যমে প্লট করেছি:

matlines(temp,conf[,c("lwr","upr")], col="red")
matlines(temp,prd[,c("lwr","upr")], col="red")

এখন, আমি যদি অতিরিক্ত ডেটার জন্য সিআই এবং পিআই গণনা করি তবে আমি পরিসরটি কতটা প্রশস্তভাবে বেছে নেব তা বিবেচ্য নয়, আমি উপরের মতো ঠিক একই লাইন পেয়েছি। আমি বুঝতে পারছি না. ওটার মানে কি? এটি তখন হবে:

conf<-predict(fm,newdata=data.frame(x=newx), interval=c("confidence"))
prd<-predict(fm,newdata=data.frame(x=newx), interval=c("prediction"))

নতুন এক্সের জন্য আমি বিভিন্ন সিকোয়েন্স বেছে নিয়েছি। যদি ক্রমটি আমার রিগ্রেশনের ভেরিয়েবলগুলির চেয়ে আলাদা # পর্যবেক্ষণ করে থাকে, আমি একটি সতর্কতা পাচ্ছি। কেন হবে?

উত্তর:


3

আমি আপনার কয়েকটি প্রশ্ন বুঝতে পারি তবে অন্যরা পরিষ্কার হয় না। আমাকে উত্তর দিন এবং কিছু তথ্য জানাতে দিন এবং সম্ভবত এটি আপনার সমস্ত বিভ্রান্তি দূর করবে।

আপনার কাছে থাকা ফিটটি খুব ভাল। আত্মবিশ্বাসের ব্যবধানগুলি খুব শক্ত হওয়া উচিত। আত্মবিশ্বাসের অঞ্চলগুলির দুটি টাইপ রয়েছে যা বিবেচনা করা যেতে পারে, বিসিমুলনউইস অঞ্চল যা পুরো সত্যিকারের রিগ্রেশন ফাংশন প্রদত্ত আত্মবিশ্বাসের স্তরের সাথে আচ্ছন্ন করার উদ্দেশ্যে।

আপনি যা খুঁজছেন সেগুলি হ'ল ফিটেড রিগ্রেশন পয়েন্টগুলির জন্য আস্থা অন্তর inter তারা কেবল covariate (গুলি) এর প্রদত্ত মান (গুলি) এর y এর মানযুক্ত মান coverাকা দেওয়ার উদ্দেশ্যে। তারা covariates অন্যান্য মান y এর মান আবরণ করার উদ্দেশ্যে নয়। প্রকৃতপক্ষে যদি অন্তরগুলি আপনার ক্ষেত্রে হওয়া উচিত হিসাবে খুব শক্ত হয় তবে তারা কোভারিয়েট (গুলি) এর নির্দিষ্ট মান (গুলি) থেকে দূরে সরে যাওয়ার সাথে সাথে যদি কোনও তথ্য পয়েন্ট থাকে তবে তারা অনেকগুলি কভার করবে না। এই ধরণের কভারেজের জন্য আপনাকে একযোগে আত্মবিশ্বাসের বক্ররেখা (উপরের এবং নীচের দিকের বাঁকানো) পেতে হবে।

এখন এটি সত্য যে আপনি যদি কোয়ারিয়েটের একটি প্রদত্ত মূল্যে আয়ের পূর্বাভাস দেন এবং আপনি কোভারিয়েটের প্রদত্ত মূল্যে y এর জন্য আস্থার ব্যবধানের জন্য যেমন পূর্বাভাস ব্যবধানের জন্য একই আত্মবিশ্বাসের স্তরটি চান তা আরও বিস্তৃত হবে। কারণটি হ'ল মডেলটি আপনাকে বলবে যে এখানে পরিবর্তনশীলতা যুক্ত হবে কারণ একটি নতুন ওয়াইয়ের নিজস্ব স্বতন্ত্র ত্রুটি থাকবে যা অবশ্যই অন্তরালে জবাবদিহি করতে হবে। সেই ত্রুটির উপাদানটি ফিটগুলিতে ব্যবহৃত ডেটার ভিত্তিতে অনুমানগুলিতে প্রবেশ করে না।


আমি দুঃখিত, আমি এখনও বেশ বুঝতে পারি না। আপনি 2 প্রকারের আত্মবিশ্বাসের ব্যবধান ব্যাখ্যা করেছেন, তবে আপনি "আমি যাদের দিকে তাকিয়ে আছি" বললে কোনটি বোঝায়? খ / সি আমি পূর্বাভাস এবং আত্মবিশ্বাসের বিরতি উভয়ই চক্রান্ত করেছি এবং পার্থক্যটি বুঝতে আমার সমস্যা হচ্ছে। এছাড়াও, আমি কী করছি তা স্পষ্ট করতে আমার পূর্বের পোস্টে কিছু আর-কমান্ড যুক্ত করেছি
লিসা

একসাথে আত্মবিশ্বাসের বক্ররেখা তৈরি করে আত্মবিশ্বাস ব্যান্ডগুলি অর্জিত হয়েছে বা স্বতন্ত্র আত্মবিশ্বাসের অন্তরগুলির একটি মসৃণ সংযোগ তৈরি করে বা বক্ররেখাগুলি এটি পরিষ্কার করে না। যদি তারা একসাথে হয় তবে আপনি বক্ররেখার বাইরে লাগানো অনেকগুলি পয়েন্ট দেখতে পাবেন না। তবে আমি যেমনটি উল্লেখ করেছি স্বতন্ত্র অন্তরগুলির সাথে এটি ঘটতে পারে। আমি এখনও সম্পাদনার দিকে নজর দিইনি যাতে আর কোডটি অন্তর্ভুক্ত রয়েছে।
মাইকেল আর চেরনিক

আর-র নির্দিষ্ট প্রশ্নগুলির উত্তর দেওয়ার জন্য আমি যথেষ্টভাবে জানি না। আমি কী জানি না যে কোনও আর বিশেষজ্ঞ আপনাকে বলতে পারেন তা হ'ল আত্মবিশ্বাস বক্ররেখা এবং পূর্বাভাস বক্ররেখাগুলি স্বতন্ত্র আত্মবিশ্বাসের অন্তরগুলিকে সংযুক্ত করছে বা যুগপত বক্ররেখা উত্পন্ন করছে। এছাড়াও আপনার কোডটি আপনি যা করতে চান তা করে?
মাইকেল আর চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.