আর এর কারণগুলির সাথে লিনিয়ার রিগ্রেশন


10

আমি আরে ঠিক কীভাবে উপাদানগুলি কাজ করে তা বোঝার চেষ্টা করছি Let's আসুন আমরা R তে কিছু নমুনা তথ্য ব্যবহার করে একটি রিগ্রেশন চালাতে চাই:

> data(CO2)
> colnames(CO2)
[1] "Plant"     "Type"      "Treatment" "conc"      "uptake"   
> levels(CO2$Type)
[1] "Quebec"      "Mississippi"
> levels(CO2$Treatment)
[1] "nonchilled" "chilled"   
> lm(uptake ~ Type + Treatment, data = CO2)

Call:
lm(formula = uptake ~ Type + Treatment, data = CO2)

Coefficients:
 (Intercept)   TypeMississippi  Treatmentchilled  
       36.97            -12.66             -6.86  

আমি তা বুঝতে পেরেছি TypeMississippiএবং Treatmentchilledবুলিয়ান হিসাবে বিবেচনা করা হচ্ছে: প্রতিটি সারির জন্য প্রাথমিক উত্সাহ গ্রহণ করা হয় 36.97, এবং আমরা 12.66এটি বিয়োগ করি যদি এটি মিসিসিপি টাইপের হয় এবং 6.86এটি শীতল হয় কিনা। এই জাতীয় কিছু বুঝতে আমার সমস্যা হচ্ছে:

 > lm(uptake ~ Type * Treatment, data = CO2)

 Call:
 lm(formula = uptake ~ Type * Treatment, data = CO2)

 Coefficients:
                 (Intercept)                   TypeMississippi  
                      35.333                            -9.381  
            Treatmentchilled  TypeMississippi:Treatmentchilled  
                      -3.581                            -6.557  

একটিতে দুটি গুণকে এক সাথে গুণ করার অর্থ কী lm?

উত্তর:


17

@ জন এর জবাবটি বিস্তারিতভাবে বর্ণনা করতে: আর এর সূত্রগুলিতে, আপনার কাছে কয়েকটি অপারেটর রয়েছে যা আপনি এই পদগুলিতে প্রয়োগ করতে পারেন: "+" কেবল তাদের যুক্ত করে, ":" এর অর্থ আপনি একটি পদ যুক্ত করেন (বা বেশ কয়েকটি শর্ত) যা তাদের মিথস্ক্রিয়াকে বোঝায় ( নীচে দেখুন), "*" এর অর্থ উভয়ই, এটি: "মূল প্রভাবগুলি" যুক্ত করা হয়েছে এবং ইন্টারঅ্যাকশন শব্দটিও যুক্ত করা হয়েছে।

সুতরাং এই মিথস্ক্রিয়া মানে কি? ঠিক আছে, অবিচ্ছিন্ন ভেরিয়েবলের ক্ষেত্রে এটি আসলে একটি পদ যা যুক্ত হয় যা কেবল দুটি ভেরিয়েবলের একাধিক। আপনার যদি ভবিষ্যদ্বাণী হিসাবে উচ্চতা এবং ওজন থাকে এবং out ~ height * weightসূত্র হিসাবে ব্যবহার করেন, লিনিয়ার মডেলটিতে এভাবে তিনটি 'ভেরিয়েবল' থাকবে, নাম ওজন, উচ্চতা এবং তাদের পণ্য (এটিতে ইন্টারঅ্যাকশনও রয়েছে তবে এটি এখানে কম আগ্রহী নয়)।

যদিও আমি উপরে অন্যথায় প্রস্তাব দিই: এটি শ্রেণিবদ্ধ ভেরিয়েবলগুলির জন্য ঠিক একইভাবে কাজ করে তবে এখন 'পণ্য' প্রতিটি শ্রেণিবদ্ধ ভেরিয়েবলের জন্য (সেট) ডামি ভেরিয়েবল (গুলি) প্রযোজ্য। ধরুন আপনার উচ্চতা এবং ওজন এখন শ্রেণিবদ্ধ, প্রতিটি তিনটি বিভাগ (এস (মল), এম (এডিয়াম) এবং এল (আরজ) সহ। তারপরে লিনিয়ার মডেলগুলিতে, এর প্রত্যেকটি দুটি ডামি ভেরিয়েবলের সেট দ্বারা প্রতিনিধিত্ব করা হয় যা হয় 0 বা 1 (কোডিংয়ের অন্যান্য উপায় রয়েছে, তবে এটি আর এর মধ্যে ডিফল্ট এবং সর্বাধিক ব্যবহৃত হয়)। আসুন ধরা যাক আমরা উভয়ের জন্য রেফারেন্স বিভাগ হিসাবে এস ব্যবহার করি, তারপরে প্রতিবার দুটি ডামি উচ্চতা M এম এবং উচ্চতা। এল (এবং ওজনের ক্ষেত্রে সমান) থাকে।

সুতরাং এখন, মডেলটিতে out ~ height * weight4 টি ডামি + সমস্ত ডামি-সংমিশ্রনের সমস্ত পণ্য রয়েছে (আমি এখানে স্পষ্টভাবে সহগগুলি লিখছি না, সেগুলি বোঝানো হয়েছে):

(intercept) + height.M + height.L + weight.M + weight.L + height.M * weight.M + height.L * weight.M + height.M * weight.L + height.L * weight.L.

উপরের লাইনে, '*' এখন আবার একটি সাধারণ পণ্য বোঝায়, তবে এবার ডামিগুলির সময়, তাই প্রতিটি পণ্য নিজেই হয় হয় 1 (যখন সমস্ত কারণ 1 হয়) বা 0 (যখন কমপক্ষে এক নয়)।

এই ক্ষেত্রে 8 'ভেরিয়েবল' দুটি ভেরিয়েবলের সমস্ত সংমিশ্রণে পৃথক (গড়) ফলাফল সক্ষম করে: বড় ওজন থাকার প্রভাব এখন ছোট লোকের জন্য একই রকম হয় না (তাদের জন্য এফেক্টটি কেবল শব্দ দ্বারা গঠিত হয় weight.L) হিসাবে বড় মানুষের জন্য (এখানে, প্রভাবটি weight.L + height.L * weight.L)


7

জনের উত্তর অনুসরণ করতে, এলএম-এর সূত্রগুলি গাণিতিক স্বরলিপি ব্যবহার করে না, তারা রৈখিক মডেলগুলি বর্ণনা করার জন্য একটি সংক্ষিপ্ত প্রতীকী চিহ্ন ব্যবহার করছে (বিশেষত উইলকিনসন-রজারস স্বরলিপি, এখানে একটি ভাল সংক্ষিপ্ত সংক্ষিপ্তসার রয়েছে http: //www.physiol .ox.ac.uk / ~ raac / R.shtml )।

মূলত, মডেল সূত্রে এ * বি অন্তর্ভুক্ত করার অর্থ আপনি এ, বি এবং এ: বি বি ফিট করছেন (এ এবং বি এর ইন্টারঅ্যাকশন)। যদি ইন্টারঅ্যাকশন শব্দটি পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ হয় তবে এটি পরামর্শ দেয় যে প্রতিটি ধরণের জন্য চিকিত্সার প্রভাবটি আলাদা।


3

সম্ভবত সহায়তার জন্য 'সূত্র' সন্ধান করা সহায়ক হবে। আপনি গুণ করছেন না, আপনি বলছেন যে আপনি দুটি প্রধান প্রভাব এবং তাদের ইন্টারঅ্যাকশনটিও চান।


1
(+1) যদিও এটি আমার কাছে মন্তব্যের মতো বলে মনে হচ্ছে।
দিমিত্রিজ কেলভ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.