আর এর এলএম () আমার পাঠ্যপুস্তকের চেয়ে পৃথক সহগের অনুমান কেন দেয়?


13

পটভূমি

আমি ফিটিং মডেলগুলির একটি কোর্সে প্রথম উদাহরণটি বোঝার চেষ্টা করছি (যাতে এটি হাস্যকরভাবে সহজ মনে হতে পারে)। আমি হাতে হাতে গণনা করেছি এবং সেগুলি উদাহরণের সাথে মেলে তবে আমি যখন আরগুলিতে তাদের পুনরাবৃত্তি করি তখন মডেল সহগগুলি বন্ধ থাকে। আমি ভেবেছিলাম পার্থক্যটি পাঠ্যপুস্তকের কারণে জনসংখ্যার বৈকল্পের ( ) ব্যবহারের কারণে হতে পারে যেখানে আর স্যাম্পল ভেরিয়েন্স ( ) ব্যবহার করছেন তবে আমি দেখতে পাচ্ছি না যেগুলি গণনাগুলিতে ব্যবহৃত হয়। উদাহরণস্বরূপ, যদি কোথাও ব্যবহার হয় তবে নোটগুলিতে সহায়তা বিভাগ :σ2S2lm()var()var()

ডিনোমিনেটর এন - 1 ব্যবহার করা হয় যা আইড পর্যবেক্ষণের জন্য (কো) প্রকরণের একটি নিরপেক্ষ अनुमानক দেয়।

আমি উভয়টির জন্য কোডটি দেখেছি lm()এবং উভয়ই lm.fit()ব্যবহার করি না var(), তবে lm.fit()সেই কোডটি সি কোড ( z <- .Call(C_Cdqrls, x, y, tol, FALSE)) প্রবেশ করে যা আমার অ্যাক্সেস নেই।

প্রশ্ন

কেউ কেন ব্যাখ্যা করতে পারে যে আর কেন বিভিন্ন ফলাফল দিচ্ছে? এমনকি নমুনা বনাম জনসংখ্যার বৈকল্পিক ব্যবহারে পার্থক্য থাকলেও সহগের হিসাবগুলি কেন পৃথক হয়?

উপাত্ত

স্কুলে গ্রেড থেকে জুতোর আকার পূর্বাভাস দেওয়ার জন্য একটি লাইন ফিট করুন।

# model data
mod.dat <- read.table(
    text = 'grade shoe
                1    1
                2    5
                4    9'
    , header = T);

# mean
mod.mu  <- mean(mod.dat$shoe);
# variability 
mod.var <- sum((mod.dat$shoe - mod.mu)^2)

# model coefficients from textbook
mod.m  <- 8/3;
mod.b  <- -1;

# predicted values  ( 1.666667 4.333333 9.666667 )
mod.man.pred       <- mod.dat$grade * mod.m + mod.b;
# residuals         ( -0.6666667  0.6666667 -0.6666667 )
mod.man.resid      <- (mod.dat$shoe - mod.man.pred)
# residual variance ( 1.333333 )
mod.man.unexpl.var <- sum(mod.man.resid^2);
# r^2               ( 0.9583333 )
mod.man.expl.var   <- 1 - mod.man.unexpl.var / mod.var;

# but lm() gives different results:
summary(lm(shoe ~ grade, data = mod.dat))
Call:
lm(formula = shoe ~ grade, data = mod.dat)

Residuals:
      1       2       3 
-0.5714  0.8571 -0.2857 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)  -1.0000     1.3093  -0.764    0.585
grade         2.5714     0.4949   5.196    0.121

Residual standard error: 1.069 on 1 degrees of freedom
Multiple R-squared:  0.9643,    Adjusted R-squared:  0.9286 
F-statistic:    27 on 1 and 1 DF,  p-value: 0.121

সম্পাদন করা

হিসাবে বেন Bolker দেখিয়েছেন, এটা দেখে মনে হচ্ছে শিক্ষক কখনও কখনও ভুল করি। দেখে মনে হচ্ছে আর গণনাগুলি সঠিক। গল্পটির নৈতিকতা: কোনও কিছু বিশ্বাস করবেন না কেবল কারণ একজন শিক্ষক বলেছেন যে এটি সত্য। এটি নিজের জন্য যাচাই করুন!


2
ডাবল চেক mod.m=8/3। কারণ আপনি যদি সেট করেন mod.m=2.5714তবে সেগুলি অভিন্ন বলে মনে হচ্ছে।
স্ট্যাট

2
আমি বুঝতে পারছি এমন মন্তব্যগুলির কোথাও মড.এম = 8/3 এবং মোড.বি = -1 এর কোথাও গণনা করা হয়নি, সুতরাং এটি সুস্পষ্ট নয়। উপরে @ স্টেটের মতামত হিসাবে, ত্রুটিটি মোড.এম. কম্পিউটিংয়ে রয়েছে বলে মনে হচ্ছে।
জুহো কোক্কলা

2
এটা তোলে মনে রাখা যে গুরুত্বপূর্ণ যে কেউ ভুল করতে পারি - আপনার শিক্ষক, আপনি এখানে answerers, আর প্রোগ্রামারদের - যে কেউ। সুতরাং যখন বিষয়গুলি অসম্মতি হয় তখন ভুলগুলি কোথায় থাকতে পারে তা নির্ধারণের চেষ্টা করার সময়, বিবেচনা করুন যে আরও কত লোক প্রতিটি জিনিস পরীক্ষা করছে। আর এর মধ্যে lmফাংশনটির ক্ষেত্রে, কয়েক হাজার মানুষ আক্ষরিক অর্থেই অন্যান্য জিনিসগুলির সাথে তুলনা করে ফলাফলগুলি পরীক্ষা করে দেখেছেন এবং lmকোডে প্রতিবার যে কোনও পরিবর্তন আসে তা জ্ঞাত উদাহরণগুলির বিরুদ্ধে পরীক্ষা করা হয়। এখানে উত্তর সহ, কমপক্ষে কয়েক জন লোক চেক করতে পারে (আপনার প্রশ্নটি 29 বার দেখা হয়েছে)।
গ্লেন_বি -রিনস্টেট মনিকা

1
@ গ্লেেন_বি আপনার বক্তব্য আসলে আমি এখানে জিজ্ঞাসা করতে এসেছি কারণ। আমি বুঝতে পারি না যে এই জাতীয় মৌলিক গণনায় আর কীভাবে ভুল হতে পারে তবে তারা কেন আলাদা ছিল তা আমি বুঝতে পারি না। আমি উত্স কোডটি কাছাকাছি স্নোপড ইভেন্ট। তবে শেষ পর্যন্ত, ত্রুটিটি আমি দেখতে চেয়েছিলাম এমন শেষ স্থানে ছিল, বেশিরভাগ কারণ ক্যালকুলাস অংশটি আমার জ্ঞানের সীমাতে। আমি যদিও উত্তর থেকে অনেক কিছু শিখেছি!
পোস্ট-এইচ

2
হ্যাঁ, তারা কেন পার্থক্য করে তা বোঝার চেষ্টা করা গুরুত্বপূর্ণ; আপনি যদি এটি কাজ করে না করতে পারেন তবে এখানে জিজ্ঞাসা করা বুদ্ধিমানের কাজ। আমি প্রস্তাব দেওয়ার চেষ্টা করছিলাম আপনি কেন সর্বশেষ স্থানটিকে পরিবর্তে বিবেচনা করেছিলেন প্রথমে দেখার জায়গা। আমি নিজেই এক বা দুটি উপলক্ষে উদাহরণের সর্বনিম্ন 'সরলকরণ' পরিবর্তন করে ধরা পড়েছি।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


25

দেখে মনে হচ্ছে লেখক কোথাও গাণিতিক ত্রুটি করেছেন।

যদি আপনি স্কোয়ারের বিচ্যুতির যোগফল প্রসারিত করেন

S=((b+m)1)2+((b+2m)5)2+((b+4m)9)2
আপনি পাবেন
S=b2+2bm+m2+12b2m+b2+4bm+4m2+2510b20m+b2+8bm+16m2+8118b72m

যা হ্রাস করে যা লেখকের অভিব্যক্তির সমান, ধ্রুবক শব্দ বাদে যা কোনওভাবেই আসে না)।

3b2+14bm+21m2+10730b94m

এখন আমাদের এবং শূন্যের সাথে এর ডেরিভেটিভগুলি সেট করে এবং সিস্টেমটি সমাধান করে এটি হ্রাস করার চেষ্টা করা উচিত । Sbm

dS/db=6b+14m303b+7m15=0
dS/dm=14b+42m947b+21m47=0

সমাধান

b=(157m)/30=7(157m)/3+21m474735=(49/3+21)mm=(4735)/(2149/3)=18/7

আর বলেছে এটি আসলে 2.571429 ...

এই লিঙ্কের উপর ভিত্তি করে এটি কোর্সেরা কোর্স থেকে মনে হচ্ছে ...? কোথাও কোথাও কোথাও ডেটা ভুল ট্রান্সক্রিপশন ছিল?

অন্য, এই গণনাটি করার স্বাধীন উপায়টি জেনে রাখা উচিত যে অনুমিত রিগ্রেশন ক্রস পণ্যগুলির ) বর্গের যোগফল দ্বারা বিভক্ত ( )।(yy¯)(xx¯)(xx¯)2

g <- c(1,2,4)
g0 <- g - mean(g)
s <- c(1,5,9)
s0 <- s- mean(s)
sum(g0*s0)/(sum(g0^2))
## [1] 2.571429

যদি মনে করেন জুতো মাপ ছিল পরিবর্তে তারপর ঢাল হবে আউট 8/3 আসা ...{1,11/3,9}{1,5,9}


2
কি দারুন. হ্যাঁ তুমিই ঠিক. এটি একটি কোর্সেরা কোর্স থেকে এবং এটি ভিডিও থেকে, প্রতিলিপি নয়। সুতরাং আমি অনুমান করছি যে তিনি ভিডিওটির জন্য গণনাগুলি আরও সহজ করার জন্য এটি এটিকে আরও সরল করেছেন এবং কেউ এটিকে চেষ্টা এবং পুনরাবৃত্তি করবে বলে আশা করেনি। এটি কেবল প্রথম ভিডিও হিসাবে দেখা গেছে যা আমি দেখেছি তাই আমি অনুসরণ করার চেষ্টা করেছি। এটা স্পষ্ট যে গণিতে আসে যখন আমার আপস্কিল করা দরকার। আমি মনে করি যদিও ত্রুটিটি খুঁজে পেয়েছি। অবিচ্ছিন্ন শব্দটি, যা আপনি বলছেন তাতে কিছু আসে যায় না, সম্ভবত সঠিক মূল্য যা তার হিসাব বন্ধ করে দেয়। নিজেকে শেখানোর জন্য আমি আরও কয়েকবার আপনার উত্তরটি সন্ধান করব। আমি সত্যিই এটার প্রশংসা করছি!
পোস্ট-হক

আমি মনে করি না ধ্রুবক শব্দটি গণনাগুলি ফেলে দেবে। এটি opeাল এবং আটকানোর অনুমানগুলিকে প্রভাবিত করবে না (এটি যখন আমরা ডেরাইভেটিভ নেব তখন তা অদৃশ্য হয়ে যায়), কেবলমাত্র অবশিষ্ট এসএসকিউ / স্ট্যান্ডার্ড বিচ্যুতির অনুমান।
বেন বলকার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.