শক্তিশালী রৈখিক মডেলের একটি ওজনযুক্ত


19

আমি এমএসএস প্যাকেজটিতে Rএমএম ওজন ব্যবহার করে একটি শক্তিশালী রৈখিক মডেল অনুমান করেছি rlm()। `R`` মডেলের জন্য কোনও মান সরবরাহ করে না , তবে এটি অর্থবোধক পরিমাণের মতো হলে আমি এটি পেতে চাই। আমি আরও জানতে আগ্রহী যে আর -2 মানের যে মোট ও অবশিষ্টাংশগুলি ওজন হিসাবে একইভাবে পর্যবেক্ষণগুলি শক্তিশালী রিগ্রেশনটিতে ওজন করা হয়েছিল তার ওজন রাখার কোনও অর্থ আছে কিনা । আমার সাধারণ চিন্তাভাবনাটি হ'ল, যদি প্রতিরোধের উদ্দেশ্যে, আমরা মূলত ওজনগুলির সাথে কিছু অনুমানকে কম প্রভাব দেয় কারণ তারা কোনও উপায়ে বিদেশী হয়, তবে সম্ভবত আর 2 গণনার উদ্দেশ্যে আমাদেরও সেগুলি দেওয়া উচিত একই অনুমান কম প্রভাব?আর2আর2R2

আমি এবং ওজনযুক্ত আর 2 এর জন্য দুটি সহজ ফাংশন লিখেছি , সেগুলি নীচে। আমি আমার মডেলটির জন্য এই ফাংশনগুলি চালনার ফলাফলগুলিও অন্তর্ভুক্ত করেছি যার নাম HI9। সম্পাদনা: আমি ইউএনএসডাব্লিউর অ্যাডেল কাস্টারের ওয়েব পৃষ্ঠা পেয়েছি যা এর জন্য একটি সূত্র দেয় যা উভয়ের গণনা গণনা করার ক্ষেত্রে ওজন ভেক্টরকে অন্তর্ভুক্ত করে এবং আমি যেমন করেছিলাম, এবং তাকে আরও একটি আনুষ্ঠানিক রেফারেন্স চেয়েছি : http: //web.maths ma unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html (এখনও কিভাবে এই ভরযুক্ত ব্যাখ্যা করা উপর ক্রস যাচাই কাছ থেকে সাহায্য খুঁজছেন R 2 ।)আর2আর2R2SSeSStR2

#I used this function to calculate a basic r-squared from the robust linear model
r2 <- function(x){  
+ SSe <- sum((x$resid)^2);  
+ observed <- x$resid+x$fitted;  
+ SSt <- sum((observed-mean(observed))^2);  
+ value <- 1-SSe/SSt;  
+ return(value);  
+ }  
r2(HI9)  
[1] 0.2061147

#I used this function to calculate a weighted r-squared from the robust linear model
> r2ww <- function(x){
+ SSe <- sum((x$w*x$resid)^2); #the residual sum of squares is weighted
+ observed <- x$resid+x$fitted;
+ SSt <- sum((x$w*(observed-mean(observed)))^2); #the total sum of squares is weighted      
+ value <- 1-SSe/SSt;
+ return(value);
+ }
 > r2ww(HI9)
[1] 0.7716264

যে কেউ এই উত্তর দিতে সময় ব্যয় করে ধন্যবাদ। আমি মিস করেছি কিনা সে সম্পর্কে ইতিমধ্যে কিছু খুব ভাল রেফারেন্স থাকলে বা উপরের আমার কোডটি পড়তে খুব কঠিন হয় (আমি কোনও কোড লোক নই) দয়া করে আমার ক্ষমা প্রার্থনা করুন।


lm এর ভিতরে ওজন রাখুন () এবং সেখান থেকে আর-স্কোয়ারটি নিয়ে যান (চাকাটি পুনরায় উদ্ভাবন কেন?)
ব্যবহারকারী 603

1
আমি আরও দক্ষতার সাথে যা করেছি তা করার উপায় সম্পর্কে টিপটির জন্য ধন্যবাদ। আমি বর্ণনা / প্রস্তাবিত ওজনযুক্ত আর-স্কোয়ারের অর্থ সম্পর্কে কেউ মন্তব্য করতে পারেন?
ক্রেগমিলিগান

@ ইউজার 603: আপনি আসলে এলএম () এর মধ্যে ওজন স্থাপন সম্পর্কে কীভাবে যাবেন?
হিসেলহাইম

কেবল একটি প্রশংসা করার জন্য, আর মধ্যে লাগানো ওজনযুক্ত সর্বনিম্ন বর্গক্ষেত্র হ'ল পরিমাণ হ্রাস করে (ডাব্লু * ই ^ 2), যেখানে ই অবশিষ্টাংশ। সুতরাং আপনার গণনার কোডের জন্য, সমস্ত ওজন ডাব্লু বর্গমূল করা উচিত।
ইউয়ানাহাও লাই

আমি জোর দিয়ে বলতে চাই যে আমাদের একটি ওজনযুক্ত গড় গ্রহণ করতে হবে না, কমপক্ষে আমি বিশ্বাস করি যেহেতু আমি যে প্রোগ্রামটি লিখেছি তা একটি আর-স্কোয়ারের সাথে 1 প্রদান করে: ক্লাসিক আর-স্কোয়ার্ড ওয়েটেড আর-স্কোয়ার্ডযুক্ত তবে ওয়েটড আর- ছক যেখানে গড় খুব পরিমেয় হয়, আমি খুঁজে -6 এটা পাল্টা স্বজ্ঞাত এমনকি আমার জন্য, কিন্তু আমি বিশ্বাস করি অভিজ্ঞতা যদিও
Pierre

উত্তর:


22

নিম্নলিখিত উত্তরটি এর উপর ভিত্তি করে: (১) উইলেট এবং সিঙ্গার সম্পর্কে আমার ব্যাখ্যা (1988) আর-স্কোয়ার সম্পর্কিত আরও একটি সতর্কতা নোট: এটি ওজনযুক্ত সর্বনিম্ন স্কোয়েট রিগ্রেশন বিশ্লেষণে ব্যবহৃত হয়েছে। আমেরিকান পরিসংখ্যানবিদ। 42 (3)। pp236-238, এবং (২) দৃise় ভিত্তিতে যে শক্তিশালী লিনিয়ার রিগ্রেশন হ'ল একটি পুনরাবৃত্ত প্রক্রিয়া দ্বারা অনুমান করা ওজন সহ নূন্যতম বর্গক্ষেত্রের রিগ্রেশন হয়।

আর 2 ডাব্লুটির জন্য আমি যে সূত্রটি প্রশ্নটিতে দিয়েছিলাম তাতে আরলেটওয়ালের জন্য উইলেট এবং সিঙ্গার (1988) এর 4 সমীকরণের সাথে সামঞ্জস্য করার জন্য একটি ছোট সংশোধন প্রয়োজন: এসএসটি গণনার ক্ষেত্রেও একটি ওজনযুক্ত গড় ব্যবহার করা উচিত:

the correction is SSt <- sum((x$w*observed-mean(x$w*observed))^2)].

এর (সংশোধন) ওজনযুক্ত আর-স্কোয়ারের অর্থ কী? উইলেট এবং সিঙ্গার এটিকে ব্যাখ্যা করে: "রূপান্তরিত [ওজনযুক্ত] ডেটাসেটে দৃ determination় সংকল্পের সহগ। এটি ভারী ওয়াইডের পরিবর্তনের অনুপাতের একটি পরিমাপ যা ভারী এক্স দ্বারা গণনা করা যেতে পারে , এবং এটিই পরিমাণ হিসাবে আউটপুট যখন ডাব্লুএলএস রিগ্রেশন হয় তখন প্রধান পরিসংখ্যানীয় কম্পিউটার প্যাকেজগুলি দ্বারা আর 2 "।

এটি ফিটের ধার্মিকতার একটি পরিমাপ হিসাবে অর্থবহ? এটি কীভাবে উপস্থাপিত হয় এবং ব্যাখ্যা করা হয় তার উপর নির্ভর করে। উইলেট এবং সিঙ্গারের সতর্কতা যে এটি সাধারণত ন্যূনতম স্কোয়ার রিগ্রেশন প্রাপ্ত আর-স্কোয়ারের তুলনায় বেশ খানিকটা বেশি এবং উচ্চ মানের বিশিষ্ট প্রদর্শনকে উত্সাহ দেয় ... তবে এই প্রদর্শনটি প্রতারণামূলক হতে পারে যদি এটি আর এর প্রচলিত অর্থে ব্যাখ্যা করা হয় -squared (এর অনুপাতে unweightedএকটি মডেল দ্বারা ব্যাখ্যা ব্যাখ্যা)। উইলেট এবং সিঙ্গার প্রস্তাব দিয়েছেন যে একটি কম 'বিভ্রান্তিকর' বিকল্পটি সিউডোআর 2 ডাব্লু (তাদের সমীকরণ 7), যা মূল প্রশ্নে আমার ফাংশন আর 2 এর সমান। সাধারণভাবে, উইলেট এবং সিঙ্গারও সাবধান করে দেয় যে কোনও কোনও আর 2 (এমনকি তাদের সিউডর 2 ডাব্লু) এর উপর নির্ভর করা ভাল নয় not এই সতর্কতা থাকা সত্ত্বেও, দৃ reg়তাপ্রবণতার পুরো ভিত্তিটি হ'ল কিছু কিছু ক্ষেত্রে 'ততটা ভাল নয়' হিসাবে বিচার করা হয় এবং মডেল ফিটিংয়ের ক্ষেত্রে এটি তেমন গণনা করা হয় না, এবং এটি মডেল মূল্যায়ন প্রক্রিয়ার অংশে প্রতিফলিত করা ভাল be ওজনযুক্ত আর-স্কোয়ার বর্ণিত, উপযুক্ততার ধার্মিকতার জন্য একটি ভাল পরিমাপ হতে পারে - যতক্ষণ না সঠিক ব্যাখ্যাটি উপস্থাপনায় স্পষ্টভাবে দেওয়া হয় এবং এটি ফিটের সৎতার একমাত্র মূল্যায়ন হিসাবে নির্ভর করা হয় না।


1
(+1 টি)। উত্তর দেওয়ার জন্য সময় দেওয়ার জন্য ধন্যবাদ।
ব্যবহারকারী 60

1

@CraigMilligan। করা উচিত নয়:

  • ওজন স্কোয়ার প্রথম বন্ধকের বাইরে হওয়া উচিত
  • ভারিত গড় গণনা করা হবে যার জন্য আমরা ব্যবহার করতে পারিsum(x$w*observed)/sum(x$w)weighted.mean(observed,x$w)

এটার মতো কিছু:

r2ww <- function(x){
  SSe <- sum(x$w*(x$resid)^2)
  observed <- x$resid+x$fitted
  SSt <- sum(x$w*(observed-weighted.mean(observed,x$w))^2)
  value <- 1-SSe/SSt;
  return(value);
}
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.