ক্যারেটে সিভি এবং রিডেন্টসিভির মধ্যে আসল পার্থক্য কী?


26

এটি ক্যারেটের পুনরায় স্যাম্পলিং পদ্ধতির প্রশ্নের অনুরূপ , যদিও এটি সম্মতিযুক্ত কোনওভাবেই প্রশ্নের এই অংশটির উত্তর দেয় না।

ক্যারেটের ট্রেন ফাংশন অফার করে cvএবং repeatedcv। বলতে পার্থক্য কি:

MyTrainControl=trainControl(
    method = "cv",
    number=5,
    repeats=5
)

বনাম

MyTrainControl=trainControl(
   method = "repeatedcv",
   number=5,
   repeats=5
)

আমি বুঝতে পেরেছি cvসেট কে কে-ফোল্ডস (পরামিতি number) এ বিভক্ত করে , এবং তারপরে শুরু হয়ে এটি পরামিতিগুলির repeatsসংখ্যা কয়েকবার চালায় ।

আমি শুধু মনে করতে পারে যে হয়তো নিয়মিত হয় cvসঙ্গে repeatsব্যবহারসমূহ একই সঠিক ইনডেক্স প্রতিটি সময় folds জন্য? মূলত cvপ্রতিটি সময় একই সঠিক ভাঁজগুলিতে চলমান , বনাম সম্ভবত repeatedcvপ্রতিবার নতুন ভাঁজ নির্বাচন করে?

কেউ কি স্পষ্ট করতে পারেন?


আমি আরও কিছু পদ্ধতিও অবাক করে দেখছি .. প্রত্যেকের কিছু প্রাথমিক স্তরের বোঝাপড়া দরকার, আমি কোথাও খুঁজে পাচ্ছি? ধন্যবাদ।
মনোজ কুমার

বহু ভাঁজ তৈরিতে, Control()প্রতিটি কে ক্রস ভাঁজ (সংখ্যার দ্বারা প্রদত্ত) জন্য একাধিকবার কোড পুনরাবৃত্তি হয় (আরে ট্রেন সিনট্যাক্সে পুনরাবৃত্তি দ্বারা দেওয়া হয়)। ক্রস ফোল্ডে, সিভি ব্যবহার করার সময়, এটি প্রতিটি ভাঁজে (ট্রেনে সংখ্যা ব্যবহার করে সেট করা control()) এক সময় প্রক্রিয়া ।
নীতেশ জিন্দাল

উত্তর:


29

মতে ক্যারেট ম্যানুয়াল, পৃষ্ঠা 22 , প্যারামিটার repeatsশুধুমাত্র যখন প্রযোজ্য methodসেট করা হয় repeatedcv, তাই কোনও পুনরাবৃত্তি যখন সঞ্চালিত হয় methodসেট করা হয় cv। সুতরাং উভয় পদ্ধতির মধ্যে পার্থক্য হ'ল repeatedcvপুনরাবৃত্তি এবং cvনা।


একদিকে: ঠিক একই বিভাজনের সাথে ক্রসওয়েডিয়েশন পুনরাবৃত্তি করলে প্রতিটি পুনরাবৃত্তির জন্য ঠিক একই ফল পাওয়া যাবে (ধরে নিই যে মডেলটি একটি ডিটারমিনিস্টিক পদ্ধতিতে প্রশিক্ষিত হয়), যা কেবল অকার্যকরই নয়, বিপজ্জনকও যখন এটির জন্য বৈধতার ফলাফলের সাথে তুলনা করার বিষয়টি আসে একটি পরিসংখ্যানগত পদ্ধতিতে বিভিন্ন মডেল অ্যালগরিদম। তাই আপনি যদি নিজেই কোনও বৈধতা প্রোগ্রাম করতে হয় তবে এটি সম্পর্কে সচেতন হন।


@ ব্রায়ানফিনি সাহায্য করতে পেরে আনন্দিত। উত্তরটি সন্তোষজনক হলে দয়া করে ভোট আপ / ডাউন বোতামের নীচে চেক চিহ্নটি ক্লিক করতে বিবেচনা করুন। বিশদ জানতে প্রশ্ন জিজ্ঞাসার প্রশ্নাবলী দেখুন :)
স্টেফেন

ভাঙ্গা লিঙ্ক, এখন এটি cran.r-project.org/web/packages/care/vignettes/care.pdf এছাড়াও , এখন এটি পৃষ্ঠা 4 এ। কেবল 'পুনরাবৃত্তি' অনুসন্ধান করুন
শব্দস্বরে

3

এই প্যারামিটারের পিছনে আসল কোডটি প্যাকেজের `যত্ন / আর / 'ফোল্ডারে selectByFilter.Rএবং createDataPartition.R(পূর্বে createFolds.R) উত্স ফাইলগুলিতে পাওয়া যাবে ।

উদাহরণস্বরূপ এই ফাইলগুলি এখানে এবং এখানে দেখুন (সাবধান থাকুন এই পারমিলিকগুলি শেষ পর্যন্ত কোডটির পুরানো সংস্করণে নির্দেশ করতে পারে)। সুবিধার্থে সম্পর্কিত স্নিপেটগুলি (সংস্করণ 6.0-78 গ। নভেম্বর 2017) নীচে দেখানো হয়েছে

সিলেক্টবাইফিল্টার.আর গ। লাইন 157

sbf <- function (x, ...) UseMethod("sbf")
... 

"sbf.default" <-
  function(x, y,
           sbfControl = sbfControl(), ...)
  {
    ...

    if(is.null(sbfControl$index)) sbfControl$index <- switch(
      tolower(sbfControl$method),
      cv = createFolds(y, sbfControl$number, returnTrain = TRUE),
      repeatedcv = createMultiFolds(y, sbfControl$number, sbfControl$repeats),
      loocv = createFolds(y, length(y), returnTrain = TRUE),
      boot =, boot632 = createResample(y, sbfControl$number),
      test = createDataPartition(y, 1, sbfControl$p),
      lgocv = createDataPartition(y, sbfControl$number, sbfControl$p))
...

CreateDataPartition.R গ। লাইন 227

createMultiFolds <- function(y, k = 10, times = 5) {
  if(class(y)[1] == "Surv") y <- y[,"time"]
  prettyNums <- paste("Rep", gsub(" ", "0", format(1:times)), sep = "")
  for(i in 1:times) {
    tmp <- createFolds(y, k = k, list = TRUE, returnTrain = TRUE)
    names(tmp) <- paste("Fold",
                        gsub(" ", "0", format(seq(along = tmp))),
                        ".",
                        prettyNums[i],
                        sep = "")
    out <- if(i == 1) tmp else c(out, tmp)

  }
  out
}

তাদের ফাংশনগুলি একবার দেখুন .... github.com/tonglu/care/blob/master/pkg/care/R/…
ব্যবহারকারী 3466398

7
আপনি দয়া করে আপনার উত্তরে আরও প্রসঙ্গ দিতে পারেন? লিঙ্কগুলি ভাল, তবে আমরা নিজেরাই দাঁড়াবে না এমন উত্তরগুলি এড়াতে চেষ্টা করি - লিঙ্কগুলি অদৃশ্য হয়ে যেতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.