প্রশ্ন ট্যাগ «cross-validation»

মডেল ফিটিং চলাকালীন উপস্থাপিত ডাটা সাবসেটগুলিতে মডেলটির কার্যকারিতা পরিমাপ করার জন্য বারবার ডেটা সাবটেলগুলি হোল্ড করে।

1
হাইপারপ্যারামিটারগুলি টিউন করার সময় যদি আমি বৈধতা ডেটাতে মডেল পারফরম্যান্সের মূল্যায়ন করি তবে কেন বৈধতা ডেটা সম্পর্কিত তথ্য ফাঁস হবে?
পাইথনের সাথে ফ্রেঞ্চোইস চোল্টের ডিপ লার্নিংয়ে এটি বলে: ফলস্বরূপ, বৈধতা সেটটিতে পারফরম্যান্সের ভিত্তিতে মডেলটির কনফিগারেশনটি টিউন করার ফলে খুব শীঘ্রই বৈধতা সেটটিতে অতিরিক্ত মানানসই ফলাফল আসতে পারে যদিও আপনার মডেলটি এতে সরাসরি প্রশিক্ষণপ্রাপ্ত না হয়। এই ঘটনার কেন্দ্রবিন্দু হ'ল তথ্য ফাঁসের ধারণা। যখনই আপনি বৈধতা সেটটিতে মডেলটির পারফরম্যান্সের ভিত্তিতে আপনার …

2
সত্য কি বেইসিয়ানদের টেস্ট সেটের দরকার নেই?
আমি সম্প্রতি এরিক জে মা এর এই আলোচনাটি দেখেছি এবং তার ব্লগের এন্ট্রি পরীক্ষা করেছি , যেখানে তিনি র‌্যাডফোর্ড নীলের উদ্ধৃতি দিয়েছিলেন যে বায়েশিয়ান মডেলগুলি বেশি মানায় না (তবে তারা তুলনামূলকভাবে পারে ) এবং সেগুলি ব্যবহার করার সময় আমাদের সেগুলি বৈধ করার জন্য পরীক্ষার সেটগুলির প্রয়োজন হয় না (কারণ আমার …

1
কোন গভীর শিক্ষণ মডেল এমন বিভাগগুলিকে শ্রেণিবদ্ধ করতে পারে যা পারস্পরিক একচেটিয়া নয়
উদাহরণ: আমার কাজের বাক্যে একটি বাক্য রয়েছে: "যুক্তরাজ্যের জাভা সিনিয়র ইঞ্জিনিয়ার"। আমি এটি 2 বিভাগ: English এবং হিসাবে পূর্বাভাস দেওয়ার জন্য একটি গভীর শিক্ষার মডেল ব্যবহার করতে চাই IT jobs। যদি আমি traditionalতিহ্যগত শ্রেণিবদ্ধকরণ মডেল ব্যবহার করি তবে এটি কেবল softmaxসর্বশেষ স্তরে ফাংশন সহ 1 টি লেবেল পূর্বাভাস দিতে পারে …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
ক্রস-বৈধকরণের আগে নিরীক্ষণ করা বৈশিষ্ট্য নির্বাচন করা কি আসলেই ভাল?
ইন পরিসংখ্যান শেখার উপাদানসমূহ , আমি নিম্নোক্ত বিবৃতি পেয়েছি: একটি যোগ্যতা রয়েছে: নমুনাগুলি বাদ দেওয়ার আগে প্রাথমিক আপত্তিহীন স্ক্রিনিং পদক্ষেপগুলি করা যেতে পারে। উদাহরণস্বরূপ, আমরা ক্রস-বৈধকরণ শুরু করার আগে, 50 টি সমস্ত নমুনা জুড়ে সর্বাধিক বৈকল্পিক সহ 1000 ভবিষ্যদ্বাণীকে নির্বাচন করতে পারি। যেহেতু এই ফিল্টারিংয়ে শ্রেণিবদ্ধ লেবেল জড়িত না তাই …

2
আমাদের সবসময় সিভি করা উচিত?
আমার প্রশ্ন: তুলনামূলকভাবে বড় ডেটা সেট করার জন্যও কি সিভি করা উচিত? আমার তুলনামূলকভাবে বড় ডেটা সেট রয়েছে এবং আমি ডেটা সেটে একটি মেশিন লার্নিং অ্যালগরিদম প্রয়োগ করব। যেহেতু আমার পিসি দ্রুত নয়, সিভি (এবং গ্রিড অনুসন্ধান) মাঝে মাঝে খুব দীর্ঘ সময় নেয়। বিশেষত একটি এসভিএম কখনই প্রচুর সুরের পরামিতিগুলির …

1
বীজগণিত শ্রেণিবদ্ধ, আরও তথ্য?
আমি বীজগণিত শ্রেণিবদ্ধগুলি পড়েছি : দ্রুত ক্রস-বৈধকরণ, অনলাইন প্রশিক্ষণ এবং সমান্তরাল প্রশিক্ষণের একটি জেনেরিক পদ্ধতির এবং উত্পন্ন অ্যালগরিদমের কার্যকারিতা দেখে অবাক হয়েছি। তবে, মনে হয় নাইভ বেয়েস (এবং জিবিএম) এর বাইরে কাঠামোর সাথে খাপ খায় এমন অনেক অ্যালগরিদম নেই। অন্য কোন কাগজপত্র রয়েছে যারা বিভিন্ন শ্রেণিবদ্ধে কাজ করেছিলেন? (এসভিএম, র্যান্ডম …

1
কে-ফোল্ড সিভি সহ মূল (?) মডেল নির্বাচন
রিগ্রেশন মডেলগুলির মধ্যে নির্বাচন করতে কে-ফোল্ড সিভি ব্যবহার করার সময়, আমি সাধারণত প্রতিটি মডেলের সিভি ত্রুটি আলাদাভাবে তার স্ট্যান্ডার্ড ত্রুটি এসই সহ গণনা করি এবং আমি সর্বনিম্ন সিভি ত্রুটি সহ মডেলটির 1 এসি মধ্যে সর্বাধিকতম মডেল নির্বাচন করি (1 স্ট্যান্ডার্ড ত্রুটি বিধি, উদাহরণস্বরূপ এখানে দেখুন )। যাইহোক, আমাকে সম্প্রতি বলা …

2
মডেল-বিল্ডিং প্রক্রিয়া ইন্টারেক্টিভ ছিল যখন ব্যাক-টেস্টিং বা ক্রস-বৈধকরণ valid
আমার কাছে কিছু ভবিষ্যদ্বাণীপূর্ণ মডেল রয়েছে যার পারফরম্যান্সটি আমি ব্যাক-টেস্ট করতে চাই (অর্থাত, আমার ডেটাসেটটি নিতে, এটি সময়ের সাথে পূর্ববর্তী সময়ে "রিওয়াইন্ড করুন" এবং দেখুন মডেলটি কীভাবে সম্ভাব্য পারফরম্যান্স করত)। সমস্যাটি হ'ল আমার কয়েকটি মডেল একটি ইন্টারেক্টিভ প্রক্রিয়া দ্বারা নির্মিত হয়েছিল। উদাহরণস্বরূপ, ফ্র্যাঙ্ক হ্যারেলের রেগ্রেশন মডেলিং কৌশলগুলির পরামর্শ অনুসরণ করে …

2
উন্নত করার জন্য ব্যাগের বাইরে থাকা ত্রুটি অনুমান?
র্যান্ডম ফরেস্টে, প্রতিটি গাছের সমান্তরালভাবে ডেটার এক অনন্য বুস্ট্র্যাপ নমুনায় উত্থিত হয়। যেহেতু প্রতিটি বুস্ট্র্যাপ নমুনায় প্রায়% 63% অনন্য পর্যবেক্ষণ রয়েছে বলে আশা করা যায়, এটি প্রায় পর্যবেক্ষণের প্রায় 37% ছেড়ে দেয় যা গাছ পরীক্ষার জন্য ব্যবহার করা যেতে পারে। এখন, মনে হচ্ছে স্টোকাস্টিক গ্রেডিয়েন্ট বুস্টিং-এ, আরএফ-এর মতো একটি :ও …

3
আর ব্যবহার করে রিজ রিগ্রেশনের জন্য কে-ফোল্ড বা হোল্ড-আউট ক্রস বৈধকরণ
আমি 200 সাবজেক্ট এবং 1000 ভেরিয়েবলের সাথে আমার ডেটা পূর্বাভাসের ক্রস-বৈধকরণের কাজ করছি। আমি আগ্রহী রিজ রিগ্রেশনটি ভেরিয়েবলের সংখ্যা হিসাবে (আমি ব্যবহার করতে চাই) নমুনার সংখ্যার চেয়ে বেশি। সুতরাং আমি সঙ্কুচিত অনুমানকারী ব্যবহার করতে চাই। নীচে উদাহরণস্বরূপ ডেটা তৈরি করা হয়েছে: #random population of 200 subjects with 1000 variables M …

2
গাছ বাড়ানোর ক্ষেত্রে টিউনিং পরামিতিগুলির অনুকূল মানগুলি কীভাবে সন্ধান করবেন?
আমি বুঝতে পারি বুস্টিং ট্রি মডেলের 3 টি সুর করার প্যারামিটার রয়েছে, অর্থাত্‍ গাছের সংখ্যা (পুনরাবৃত্তির সংখ্যা) সঙ্কুচিত পরামিতি বিভাজনের সংখ্যা (প্রতিটি উপাদান গাছের আকার) আমার প্রশ্ন: টিউনিংয়ের প্রতিটি পরামিতিগুলির জন্য, আমি এর সর্বোত্তম মানটি কীভাবে খুঁজে পাব? আর কী পদ্ধতি? দ্রষ্টব্য: সঙ্কুচিত প্যারামিটার এবং গাছের প্যারামিটারের সংখ্যা এক সাথে …

1
আর / ক্যারেট: ট্রেন এবং পরীক্ষা সেট বনাম ক্রস-বৈধতা?
এটি সম্ভবত একটি নির্বোধ প্রশ্ন হতে পারে, তবে ক্যারেটের সাথে একটি মডেল তৈরি করার সময় এবং এর মতো কিছু LOOCVবা (এমনকি আরও বেশি কিছু) ব্যবহার করার সময় LGOCV, ট্রেন এবং পরীক্ষার সেটগুলিতে ডেটা বিভক্ত করার কী সুবিধা যদি এটি মূলত ক্রস-বৈধকরণের পদক্ষেপের হয় তবে যাইহোক না? আমি সম্পর্কিত কিছু প্রশ্ন …

1
প্রত্যাশিত ইভেন্টগুলি কীভাবে পর্যবেক্ষণ করা যায়?
ধরুন আমার কাছে 4 টি সম্ভাব্য ইভেন্টের ফ্রিকোয়েন্সিগুলির একটি নমুনা রয়েছে: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 এবং আমার ঘটনার প্রত্যাশিত সম্ভাবনা রয়েছে: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 আমার চারটি ইভেন্টের পর্যবেক্ষণের ফ্রিকোয়েন্সিগুলির যোগফলের সাথে (18) আমি …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 

4
মডেল নির্বাচন এবং লজিস্টিক রিগ্রেশন মডেল কর্মক্ষমতা
মডেল নির্বাচন এবং লজিস্টিক রিগ্রেশনে মডেল কর্মক্ষমতা সম্পর্কে আমার একটি প্রশ্ন আছে। আমার কাছে তিনটি মডেল রয়েছে যা তিনটি পৃথক অনুমানের ভিত্তিতে তৈরি। প্রথম দুটি মডেলের (তাদের নাম জেড এবং এক্স রাখুন) প্রতিটি মডেলে কেবল একটি বর্ণনামূলক পরিবর্তনশীল থাকে এবং তৃতীয়টি (এর নাম ডাব্লু) আরও জটিল। আমি ডব্লিউ মডেলের জন্য …

2
মিশ্র মডেলগুলির জন্য ক্রস বৈধকরণ?
আমার সহকর্মী এবং আমি আর-তে বেশ কয়েকটি লিনিয়ার এবং ননলাইনার মিশ্রিত ইফেক্ট মডেলগুলিকে ফিট করছি the আমাদের লাগানো মডেলগুলিতে ক্রস-বৈধকরণ করতে বলা হচ্ছে যাতে কেউ যাচাই করতে পারে যে প্রভাবগুলি তুলনামূলকভাবে সাধারণীকরণযোগ্য। এটি সাধারণত একটি তুচ্ছ কাজ, তবে আমাদের ক্ষেত্রে, আমাদের পুরো তথ্যকে একটি প্রশিক্ষণের অংশ এবং একটি পরীক্ষার অংশে …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.