স্বাধীনতার ডিগ্রি কি একটি অ-পূর্ণসংখ্যার সংখ্যা হতে পারে?


27

আমি যখন জিএএম ব্যবহার করি তখন এটি আমাকে অবশিষ্ট ডিএফ (কোডের শেষ লাইন)। ওটার মানে কি? জিএএম উদাহরণ ছাড়িয়ে যান, সাধারণভাবে, স্বাধীনতার ডিগ্রির সংখ্যাটি একটি অ-পূর্ণসংখ্যার সংখ্যা হতে পারে?26.6

> library(gam)
> summary(gam(mpg~lo(wt),data=mtcars))

Call: gam(formula = mpg ~ lo(wt), data = mtcars)
Deviance Residuals:
    Min      1Q  Median      3Q     Max 
-4.1470 -1.6217 -0.8971  1.2445  6.0516 

(Dispersion Parameter for gaussian family taken to be 6.6717)

    Null Deviance: 1126.047 on 31 degrees of freedom
Residual Deviance: 177.4662 on 26.6 degrees of freedom
AIC: 158.4294 

Number of Local Scoring Iterations: 2 

Anova for Parametric Effects
            Df Sum Sq Mean Sq F value    Pr(>F)    
lo(wt)     1.0 847.73  847.73  127.06 1.239e-11 ***
Residuals 26.6 177.47    6.67                      
r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

3
সাধারণভাবে, হ্যাঁ, ডিএফ একটি ভাসমান পয়েন্ট নম্বর হতে পারে।
ডেভিড লেন

6
আপনি সম্ভবত আসল নম্বর সম্পর্কে জিজ্ঞাসা করতে চান (বা এমন কোনও সংখ্যা যা অসংখ্যার নয়); একটি ভাসমান পয়েন্ট নম্বর হ'ল একটি কম্পিউটার ধারণা (বাস্তব সংখ্যা আনুমানিক করার একটি উপায়) যা বাস্তবায়নের সাথে সম্পর্কিত তবে আপনি সত্যই অন্তর্নিহিত গাণিতিক ধারণা সম্পর্কে জিজ্ঞাসা করছেন (এবং আরও একটি গাণিতিক প্রশ্ন জিজ্ঞাসা করা আরও ভাল)। একটি প্রায়শই এমন পরিস্থিতির মুখোমুখি হয় যেখানে (এক কারণে বা অন্য কারণে, সবসময় ভাল নয়) একটি পরিমাণ যা ধারণাগতভাবে একটি পূর্ণসংখ্যা তবুও বাস্তবের ক্ষেত্রে একটি ভাসমান পয়েন্ট সংখ্যা হিসাবে সঞ্চিত থাকে। আমি প্রস্তাব দিই "কোনও মডেলটির কি স্বতন্ত্র-পূর্ণ ডিগ্রি থাকতে পারে?" শিরোনাম জন্য।
গ্লেন_বি

উত্তর:


40

স্বাধীনতার ডিগ্রিগুলি অনেকগুলি প্রসঙ্গে প্রচ্ছন্ন নয়। প্রকৃতপক্ষে কয়েকটি পরিস্থিতিতে আপনি প্রতিষ্ঠিত করতে পারেন যে কিছু নির্দিষ্ট মডেলের ডেটা ফিট করার জন্য স্বাধীনতার ডিগ্রি অবশ্যই কিছু মান এবং মধ্যে থাকতে হবে ।kk+1

আমরা ফ্রি প্যারামিটারের সংখ্যা হিসাবে স্বাধীনতার ডিগ্রিগুলি প্রায়শই ভাবি, তবে এমন পরিস্থিতি রয়েছে যেখানে পরামিতিগুলি সম্পূর্ণ নিখরচায় নয় এবং সেগুলি গণনা করা শক্ত হতে পারে। স্মুথিং / নিয়মিত করার সময় এটি ঘটতে পারে, উদাহরণস্বরূপ।

স্থানীয়ভাবে ওজনিত রিগ্রেশন / কার্নেল পদ্ধতির ক্ষেত্রে একটি স্মুথ স্প্লাইমগুলি এমন পরিস্থিতির উদাহরণ - মোটামুটি বিনামূল্যে প্যারামিটার এমন কিছু নয় যা আপনি সহজেই ভবিষ্যদ্বাণী যুক্ত করে গণনা করতে পারেন, তাই স্বাধীনতার ডিগ্রির আরও সাধারণ ধারণা প্রয়োজন।

ইন জেনারেলাইজড যুত মডেল যার উপর gamআংশিকভাবে ভিত্তিক হয়, Hastie এবং Tibshirani (1990) [1] (এবং প্রকৃতপক্ষে অনেক অন্য রেফারেন্স মধ্যে) কিছু মডেলের যেখানে আমরা লিখতে পারেন জন্য , স্বাধীন ডিগ্রীগুলির কখনও কখনও করা থেকে নেওয়া হয় (তারা also বা ) নিয়েও আলোচনা করে । প্রথমটি আরও স্বাভাবিক পদ্ধতির সাথে সামঞ্জস্যপূর্ণ যেখানে উভয়ই কাজ করে (উদাহরণস্বরূপ রিগ্রেশন, যেখানে সাধারণ পরিস্থিতিতে এর কলামের মাত্রা হবে ), তবে যখন প্রতিসম ও আদর্শবান, তখন তিনটিই সূত্র একই।y^=Aytr(A)tr(AAT)tr(2AAAT)tr(A)XA

[পর্যাপ্ত বিশদটি যাচাই করার জন্য আমার কাছে এই রেফারেন্সটি কার্যকর নেই; একই লেখকের একটি বিকল্প (প্লাস ফ্রিডম্যান) যা সহজেই ধরে রাখা যায় এটি হল স্ট্যাটিস্টিকাল লার্নিং এর উপাদানসমূহ [২]; উদাহরণস্বরূপ 5.16 সমীকরণটি দেখুন, যা একটি স্মুথিং স্প্লিনের স্বাধীনতার কার্যকর ডিগ্রিকে (আমার স্বীকৃতিতে) হিসাবে সংজ্ঞায়িত করে]tr(A)

আরও সাধারণভাবে এখনও, ইয়ে (1998) [3] স্বাধীনতার সাধারণ ডিগ্রিগুলিকে as হিসাবে সংজ্ঞায়িত করে , যা তাদের সম্পর্কিত পর্যবেক্ষণগুলির সাথে লাগানো মানগুলির সংবেদনশীলতার যোগফল। পরিবর্তে, এটি this সাথে সামঞ্জস্যপূর্ণ যেখানে সেই সংজ্ঞাটি কাজ করে। ইয়ের সংজ্ঞা ব্যবহার করতে আপনার কেবলমাত্র গণনা করতে এবং কিছুটা অল্প পরিমাণ দ্বারা ডেটাটিবার করতে সক্ষম হতে হবে ( টু সংখ্যাগতভাবে গণনা করার জন্য )। এটি এটি খুব বিস্তৃতভাবে প্রযোজ্য করে তোলে।iy^iyitr(A)y^y^iyi

লাগানো মডেলগুলির জন্য gam, এই বিভিন্ন ব্যবস্থা সাধারণত পূর্ণসংখ্যার হয় না।

(আমি এই ইস্যুতে এই রেফারেন্সগুলির আলোচনাটি পড়ার জন্য অত্যন্ত প্রস্তাব দিই, যদিও কিছু পরিস্থিতিতে গল্পটি আরও জটিল হয়ে উঠতে পারে। উদাহরণস্বরূপ, [৪])

[1] হস্টি, টি। এবং তিবশিরানী, আর। (1990), জেনারেটাইজড অ্যাডেটিভ
মডেলস
লন্ডন: চ্যাপম্যান এবং হল।

[২] হস্টি, টি।, তিবশিরানী, আর এবং ফ্রেডম্যান, জে। (২০০৯),
পরিসংখ্যান শিক্ষার উপাদানসমূহ: ডেটা মাইনিং, ইনফারেন্সেশন এবং প্রেডিকশন , ২ য়এড স্প্রিংজার
- ভারলাগ ।
https://statweb.stanford.edu/~tibs/ElemStatLearn/

[3] ইয়ে, জে। (1998),
"ডেটা মাইনিং এবং মডেল নির্বাচনের প্রভাব পরিমাপ ও সংশোধন করার জন্য"
আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল , খণ্ড। 93, নং 441, পিপি 120-131

[৪] জ্যানসন, এল।, ফিথিয়ান, ডাব্লু। এবং হাস্টি, টি। (2013),
"স্বাধীনতার কার্যকর ডিগ্রি: একটি ত্রুটিযুক্ত রূপক"
https://arxiv.org/abs/1312.7851


7
এটি এই ক্ষেত্রে প্রাসঙ্গিক নয় তবে যখন ভেরিয়েন্সগুলি অসম হয় তখন ওয়েলচ দুটি স্যাম্পল টি টেস্টের একটি অ-পূর্ণসংখ্যার সংখ্যক স্বাধীনতার ডিগ্রি থাকতে পারে।
মাইকেল আর। চেরনিক

5
এপিওলন সংশোধন ডিএফ হিসাবে পুনরাবৃত্তি ব্যবস্থা এএনওওএ করতে পারে।
ডেভিড লেন

2
আর একটি রেফারেন্স হ'ল স্টেট্বেব.স্তানফোর্ড.ইডু / এ্যাটিবস / এলমেস্ট্যাটলার্ন / প্রিন্টিংস / ২ বিভাগ 5.4.1 ফ্রিডম এবং স্মুথ ম্যাট্রিক্সের ডিগ্রি
অ্যাড্রিয়ান

1
@ অ্যাড্রিয়ান ধন্যবাদ; আমি ঠিক সেই রেফারেন্সটি যুক্ত করব কিনা (এবং বিশেষত আপনি যে অংশটি দেখিয়েছেন সে অংশে eqn 5.16 উল্লেখ করতে হবে কিনা) আমি টস করছিলাম। আমি এই সিদ্ধান্তে
পৌঁছেছি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.