প্রশ্ন ট্যাগ «cross-validation»

মডেল ফিটিং চলাকালীন উপস্থাপিত ডাটা সাবসেটগুলিতে মডেলটির কার্যকারিতা পরিমাপ করার জন্য বারবার ডেটা সাবটেলগুলি হোল্ড করে।

2
আমরা যদি কেবলমাত্র মডেলিংয়ে আগ্রহী, পূর্বাভাস না দিয়ে নিয়মিতকরণ কার্যকর হতে পারে?
আমরা যদি কেবলমাত্র পূর্বাভাস বা ভবিষ্যদ্বাণীতে না হয়ে মডেল প্যারামিটারগুলি অনুমান করতে (এবং ব্যাখ্যা করতে) আগ্রহী তবেই নিয়মিতকরণ কার্যকর হতে পারে? আমি লক্ষ্য করি যে যদি আপনার লক্ষ্যটি নতুন ডেটাতে ভাল পূর্বাভাস দেওয়া হয় তবে নিয়মিতকরণ / ক্রস-বৈধকরণ কীভাবে চূড়ান্ত কার্যকর। তবে আপনি যদি traditionalতিহ্যবাহী অর্থনীতি করছেন এবং আপনার যত্ন …

1
ক্রস-বৈধকরণের (সিভি) ভিত্তিক ভবিষ্যদ্বাণী ব্যবধান
পাঠ্য বই এবং ইউটিউব লেকচারগুলিতে আমি উত্সাহ দেওয়ার মতো পুনরাবৃত্ত মডেলগুলি সম্পর্কে অনেক কিছু শিখেছি, তবে পূর্বাভাস অন্তরালে প্রাপ্তির বিষয়ে আমি কিছুই দেখিনি। ক্রস বৈধকরণ নিম্নলিখিতগুলির জন্য ব্যবহৃত হয়: মডেল নির্বাচন : বিভিন্ন মডেল ব্যবহার করে দেখুন এবং সবচেয়ে ভাল ফিট করুন এমন একটি চয়ন করুন। উত্সাহ দেওয়ার ক্ষেত্রে, টিউনিং …

2
বায়েশিয়ান মডেলগুলিতে ক্রস-বৈধকরণের স্থায়িত্ব
আমি কে-ফোল্ড ক্রস-বৈধকরণ (কে = 5) ব্যবহার করে জেজিএসে একটি বয়েসিয়ান এইচএলএম ফিট করছি। আমি জানতে চাই প্যারামিটারের অনুমান কিনা চাই সব ভাঁজ জুড়ে স্থিতিশীল আছে। এটি করার সর্বোত্তম উপায় কী?ββ\beta একটি ধারণা হ'ল পোস্টারিয়রগুলির পার্থক্যগুলি খুঁজে বের করা এবং 0 টি পার্থক্যের 95% সিআই-তে রয়েছে কিনা তা দেখতে। অন্য …

6
ডেটাসেটের নমুনায় হাইপারপ্যারামিটার টিউন করা কি খারাপ ধারণা?
আমার কাছে 140000 উদাহরণ এবং 30 টি বৈশিষ্ট্য রয়েছে যার জন্য আমি বাইনারি শ্রেণিবদ্ধকরণের জন্য বেশ কয়েকটি শ্রেণিবদ্ধকে প্রশিক্ষণ দিচ্ছি (এসভিএম, লজিস্টিক রিগ্রেশন, র্যান্ডম ফরেস্ট ইত্যাদি) অনেক ক্ষেত্রে গ্রিড বা র্যান্ডম অনুসন্ধান ব্যবহার করে পুরো ডেটাসেটে হাইপারপ্যারমিটার টিউন করা খুব ব্যয়বহুল time আমি নিম্নলিখিত কৌশলটি ব্যবহার শুরু করেছি সাব ডেটাবেস …

4
কেন প্রশিক্ষণ এবং পরীক্ষার সেটে ডেটা বিভক্ত করা যথেষ্ট নয়
আমি জানি যে শ্রেণিবদ্ধের কর্মক্ষমতা অ্যাক্সেস করতে আমাকে ডেটা প্রশিক্ষণ / পরীক্ষার সেটে বিভক্ত করতে হবে। তবে এটি পড়া : অনুমানকারীদের জন্য আলাদা আলাদা সেটিংস ("হাইপারপ্যারামিটার") মূল্যায়ন করার সময়, যেমন সি সেটিং যা ম্যানুয়ালি একটি এসভিএমের জন্য সেট করা উচিত, পরীক্ষার সেটটিতে ওভারফিট করার ঝুঁকি এখনও থাকে কারণ অনুমানকারী অনুকূলভাবে …

1
কে-ফোল্ড ক্রস-বৈধতা থেকে কনফিউশন ম্যাট্রিক্স কীভাবে প্রতিবেদন করা হয়েছে?
ধরুন আমি কে = 10 ভাঁজ সহ কে-ফোল্ড ক্রস-বৈধকরণ করছি। প্রতিটি ভাড়ার জন্য একটি বিভ্রান্তির ম্যাট্রিক্স থাকবে। ফলাফলগুলি প্রতিবেদন করার সময়, আমি কি গণনা করা উচিত যে গড় বিভ্রান্তির ম্যাট্রিক্স, বা কেবল বিভ্রান্তির ম্যাট্রিক্সের যোগফলটি করব?

1
এলইউসিভি সূত্রের প্রমাণ
থেকে পরিসংখ্যানগত শেখার ভূমিকা জেমস এট আল।, ছুটি এক-আউট ক্রস বৈধতা (LOOCV) অনুমান দ্বারা সংজ্ঞায়িত করা হয় যেখানে ।CV(n)=1n∑i=1nMSEiCV(n)=1n∑i=1nMSEi\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEi=(yi−y^i)2MSEi=(yi−y^i)2\text{MSE}_i = (y_i-\hat{y}_i)^2 প্রমাণ ছাড়াই সমীকরণ (৫.২) বলেছে যে সর্বনিম্ন-স্কোয়ার বা বহুবর্ষীয় রিগ্রেশন (এটি কেবলমাত্র একটি ভেরিয়েবলের ক্ষেত্রে রিগ্রেশন প্রযোজ্য কিনা তা আমার কাছে অজানা), যেখানে " \ টুপি {Y} …

3
ট্রেন ও পরীক্ষায় বিভক্ত হওয়ার আগে বা পরে অনুগতি?
আমার কাছে এন ~ 5000 দিয়ে একটি ডেটা সেট রয়েছে এবং কমপক্ষে একটি গুরুত্বপূর্ণ ভেরিয়েবলের প্রায় 1/2 অনুপস্থিত। মূল বিশ্লেষণ পদ্ধতিটি কক্স আনুপাতিক বিপদ হবে। আমি একাধিক অনুমান ব্যবহার করার পরিকল্পনা করছি plan আমি ট্রেন এবং পরীক্ষার সেটেও বিভক্ত হব। আমার কি ডেটা বিভক্ত করা উচিত এবং তারপরে পৃথকভাবে ইমপুট …

5
Cv.glmnet ফলাফলগুলিতে ভেরিয়েবলিটি
আমি cv.glmnetভবিষ্যদ্বাণীকারীদের খুঁজতে ব্যবহার করছি । আমি যে সেটআপটি ব্যবহার করি তা নিম্নরূপ: lassoResults<-cv.glmnet(x=countDiffs,y=responseDiffs,alpha=1,nfolds=cvfold) bestlambda<-lassoResults$lambda.min results<-predict(lassoResults,s=bestlambda,type="coefficients") choicePred<-rownames(results)[which(results !=0)] নিশ্চিত ফলাফল গঠনকর আমি হয় set.seed(1)। ফলাফল অত্যন্ত পরিবর্তনশীল। ফলাফলগুলি কতটা পরিবর্তনশীল তা দেখতে আমি একই কোডটি 100 চালিয়েছি। 98/100 রান একটি নির্দিষ্ট ভবিষ্যদ্বাণী সর্বদা নির্বাচিত ছিল (কখনও কখনও কেবল এটি নিজস্ব); …

4
ক্রস বৈধকরণ এবং প্যারামিটার টিউনিং
ক্রস-বৈধতা বিশ্লেষণের ফলস্বরূপ কি কেউ আমাকে বলতে পারে? এটি কি কেবলমাত্র গড় যথার্থতা বা এটি পরামিতিগুলির সাথে কোনও মডেল দেয়? কারণ, আমি কোথাও শুনেছি যে প্যারামিটার টিউনিংয়ের জন্য ক্রস-বৈধতা ব্যবহৃত হয়।

2
কে-ফোল্ড সিভি পুনর্বার কতবার করা উচিত?
আমি এই থ্রেডটি জুড়ে এসে বুটস্ট্র্যাপিং এবং ক্রস বৈধতার মধ্যে পার্থক্যগুলি দেখেছি - দারুণ উত্তর এবং উপায়। আমি এখন যা ভাবছি তা হ'ল, যদি আমি কোনও শ্রেণিবদ্ধের যথার্থতা গণনা করার জন্য বারবার 10-ভাঁজ সিভি সঞ্চালন করি, তবে আমি কতবার n এর পুনরাবৃত্তি করব? এন কি ভাঁজের সংখ্যার উপর নির্ভর করে? …

1
আমরা কি বিদেশীদের প্রকাশ করার জন্য এক ছাড়ের গড় এবং মানক বিচ্যুতি ব্যবহার করতে পারি?
মনে করুন আমি সাধারণত ডেটা বিতরণ করেছি। ডেটার প্রতিটি উপাদানের জন্য আমি এটি দেখতে চাই না যে এটি কতগুলি এসডি থেকে দূরে রয়েছে। ডেটাতে একটি আউটলেটর থাকতে পারে (সম্ভবত কেবলমাত্র একটি, তবে দুটি বা তিনটিও হতে পারে) বা নাও হতে পারে তবে এই আউটলেটটি মূলত আমি যা খুঁজছি তা। আমি …

5
এসভিএমের সেরা মেটাপ্যারামিটারগুলি খুঁজে পাওয়ার জন্য দ্রুত পদ্ধতি (এটি গ্রিড অনুসন্ধানের চেয়ে দ্রুত)
আমি বায়ু দূষণকারীদের স্বল্পমেয়াদী পূর্বাভাস করতে এসভিএম মডেলগুলি ব্যবহার করছি। একটি নতুন মডেলকে প্রশিক্ষণের জন্য আমার একটি এসভিএম মডেলের (যার অর্থ সি, গামা ইত্যাদি) এর জন্য উপযুক্ত মেটাপ্যারামিটারগুলি সন্ধান করতে হবে। Libsvm ডকুমেন্টেশন (এবং আরও অনেকগুলি বই আমি পড়েছি) এই পরামিতিগুলি সন্ধানের জন্য গ্রিড অনুসন্ধান ব্যবহার করার পরামর্শ দেয় - …

2
প্লাটের স্কেলিং কেন ব্যবহার করবেন?
তত্ত্বাবধানে পড়াশোনার সম্ভাব্যতায় আত্মবিশ্বাসের স্তরটি ক্যালব্রেট করার জন্য (কোনও এসভিএম বা সিদ্ধান্তের গাছের ওভারস্প্যাম্পলড ডেটা ব্যবহার করে আত্মবিশ্বাসের মানচিত্রের জন্য বলুন) একটি পদ্ধতি হ'ল প্লাটের স্কেলিং (উদাহরণস্বরূপ, বুস্টিংয়ের কাছ থেকে ক্যালিব্রেটেড সম্ভাব্যতা অর্জন ) use মূলত একজন মানচিত্রে লজিস্টিক রিগ্রেশন ব্যবহার করে থেকে [ 0 ; 1 ] । নির্ভরশীল …

3
নেস্টেড ক্রস বৈধকরণে হাইপার প্যারামিটারগুলি কীভাবে পাবেন?
নেস্টেড ক্রস বৈধকরণের জন্য আমি নিম্নলিখিত পোস্টগুলি পড়েছি এবং এখনও নেস্টেড ক্রস বৈধতা সহ মডেল নির্বাচনের জন্য আমি কী করব তা 100% নিশ্চিত নই: মডেল নির্বাচনের জন্য নেস্টেড ক্রস বৈধকরণ মডেল নির্বাচন এবং ক্রস-বৈধকরণ: সঠিক উপায় আমার বিভ্রান্তি ব্যাখ্যা করার জন্য, আমাকে নেস্টেড ক্রস বৈধকরণ পদ্ধতিটি ধাপে ধাপে মডেল নির্বাচনের …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.