প্রশ্ন ট্যাগ «out-of-sample»

মডেল বিল্ডিংয়ের জন্য ব্যবহৃত হয়নি এমন কিছু "পরীক্ষা" বা "হোল্ডআউট" বা "অফ-স্যাম্পল" ডেটার সেটটিতে মডেল পারফরম্যান্স মূল্যায়নের অনুশীলনকে বোঝায়।

8
পরীক্ষার ডেটা প্রশিক্ষণের ডেটা ফাঁস না হয় তা নিশ্চিত করতে আমি কীভাবে সাহায্য করতে পারি?
মনে করুন আমাদের কাছে কোনও ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করছে তবে কেউ সঠিকভাবে পরিসংখ্যান বা মেশিন লার্নিং নীতিগুলিতে পারদর্শী নয়। হতে পারে আমরা সেই ব্যক্তিকে তারা শেখার সাথে সাথে সহায়তা করছি বা হতে পারে সেই ব্যক্তি কোনও ধরণের সফ্টওয়্যার প্যাকেজ ব্যবহার করছেন যার ব্যবহার করার জন্য ন্যূনতম জ্ঞানের প্রয়োজন। এখন এই …

4
সায়েন্স জার্নালটি গার্ডেন অফ ফোরিং প্যাথসের বিশ্লেষণকে সমর্থন করেছে?
অভিযোজিত ডেটা বিশ্লেষণের ধারণাটি হ'ল ডেটা বিশ্লেষণের জন্য আপনার পরিকল্পনাটি পরিবর্তন করার সাথে সাথে আপনি আরও শিখবেন। অনুসন্ধানের তথ্য বিশ্লেষণের ক্ষেত্রে (ইডিএ), এটি সাধারণত একটি ভাল ধারণা (আপনি প্রায়শই ডেটাতে অপ্রত্যাশিত নিদর্শনগুলির সন্ধান করছেন), তবে একটি নিশ্চিত গবেষণার জন্য, বিশ্লেষণের খুব ত্রুটিযুক্ত পদ্ধতি হিসাবে এটি ব্যাপকভাবে গৃহীত হয় (যতক্ষণ না …

5
ডেটা মাইনিংয়ের নতুন বিপ্লবী উপায়?
নিম্নলিখিত অংশটি শোয়েজারের হেজ ফান্ড মার্কেট উইজার্ডস (মে ২০১২) এর ধারাবাহিকভাবে সফল হেজ ফান্ডের ব্যবস্থাপক জাফ্রে উড্রিফের একটি সাক্ষাত্কার: এই প্রশ্নের উত্তর: "ডেটা মাইনিংয়ের ক্ষেত্রে লোকেদের মধ্যে সবচেয়ে খারাপ ত্রুটিগুলি কী কী?": প্রচুর লোক মনে করে তারা ঠিক আছে কারণ তারা প্রশিক্ষণের জন্য নমুনা ডেটা এবং পরীক্ষার জন্য নমুনা ছাড়িয়ে …

3
কে-ফোল্ড ক্রস-বৈধতা ব্যবহার করার সময় আমাদের কি একটি পরীক্ষার সেট দরকার?
আমি কে-ফোল্ড বৈধতা সম্পর্কে পড়ছি এবং আমি কীভাবে এটি কাজ করে তা আমি নিশ্চিত করতে চাই। আমি জানি যে হোল্ডআউট পদ্ধতির জন্য, ডেটাটি তিনটি সেটে বিভক্ত হয়, এবং পরীক্ষার সেটটি কেবলমাত্র মডেলের কর্মক্ষমতা নির্ধারণের জন্য একেবারে শেষে ব্যবহৃত হয়, যখন বৈধতা সেটটি হাইপারপ্যারামিটারগুলি সুরকরণ ইত্যাদির জন্য ব্যবহৃত হয় ইত্যাদি etc. …

1
কেগলেলের ব্যক্তিগত লিডারবোর্ডটি কি বিজয়ী মডেলের আউট-অফ-স্যাম্পল পারফরম্যান্সের ভাল ভবিষ্যদ্বাণী?
প্রাইভেট টেস্ট সেটের ফলাফলগুলি আরও মডেলটিকে আরও পরিমার্জন করতে ব্যবহার করা যায় না, তবুও কি প্রাইভেট টেস্ট সেট ফলাফলের ভিত্তিতে বিপুল সংখ্যক মডেল সম্পাদন করা হচ্ছে না? আপনি কি একা এই প্রক্রিয়াটি না পেরে প্রাইভেট টেস্ট সেটে ওভারফিটিং শেষ করবেন না? মতে "ছদ্ম-গণিত ও আর্থিক চালিয়াতি: Backtest Overfitting প্রভাব অপ্রচলিত …

4
ভবিষ্যদ্বাণীপূর্ণ মডেল: পরিসংখ্যান সম্ভবত মেশিন লার্নিংকে বীট করতে পারে না? [বন্ধ]
বন্ধ । এই প্রশ্নটি আরও ফোকাস করা প্রয়োজন । এটি বর্তমানে উত্তর গ্রহণ করছে না। এই প্রশ্নটি উন্নত করতে চান? প্রশ্নটি আপডেট করুন যাতে এটি কেবলমাত্র এই পোস্টটি সম্পাদনা করে একটি সমস্যার উপর দৃষ্টি নিবদ্ধ করে । 2 বছর আগে বন্ধ । আমি বর্তমানে পরিসংখ্যান / একোমেট্রিক্সের উপর দৃষ্টি নিবদ্ধ …

3
শাস্ত্রীয় পরিসংখ্যানগুলিতে কেন হোল্ডআউট পদ্ধতি (প্রশিক্ষণ এবং পরীক্ষায় ডেটা বিভক্ত করা) ব্যবহৃত হয় না?
ডেটা মাইনিংয়ের সাথে আমার শ্রেণিকক্ষের সংস্পর্শে, হোল্ডআউট পদ্ধতিটি মডেল কর্মক্ষমতা মূল্যায়নের উপায় হিসাবে চালু হয়েছিল। যাইহোক, আমি যখন লিনিয়ার মডেলগুলিতে আমার প্রথম শ্রেণি নিয়েছিলাম তখন এটি মডেল বৈধতা বা মূল্যায়নের মাধ্যম হিসাবে চালু হয়নি। আমার অনলাইন গবেষণাও কোনও ধরণের ছেদ দেখায় না। শাস্ত্রীয় পরিসংখ্যানগুলিতে কেন হোল্ডআউট পদ্ধতি ব্যবহার করা হয় …

1
"ইন-নমুনা" এবং "সিউডো-অফ-স্যাম্পল" পূর্বাভাসের মধ্যে পার্থক্য
নমুনা পূর্বাভাস এবং সিউডোর বাইরে নমুনা পূর্বাভাসের মধ্যে একটি সুস্পষ্ট পার্থক্য আছে কি ? উভয়ই পূর্বাভাসের মডেলগুলির মূল্যায়ন ও তুলনা প্রসঙ্গে।

4
হোল্ড-আউট সেট তৈরি করার সর্বোত্তম উপায় কী: কিছু বিষয় সরিয়ে নেওয়া বা প্রতিটি বিষয় থেকে কিছু পর্যবেক্ষণ অপসারণ করা?
আমার 26 টি বৈশিষ্ট্য এবং 31000 সারি সহ একটি ডেটাসেট রয়েছে। এটি 38 টি বিষয়ের ডেটাসেট। এটি একটি বায়োমেট্রিক সিস্টেমের জন্য। তাই আমি বিষয়গুলি সনাক্ত করতে সক্ষম হতে চাই। পরীক্ষার সেট করার জন্য, আমি জানি যে আমাকে কিছু মান মুছে ফেলতে হবে। সুতরাং এটি করা ভাল কি এবং কেন? (ক) …

1
র্যান্ডম অরণ্যের সাথে মডেলিংয়ের কি ক্রস-বৈধতা প্রয়োজন?
যতদূর আমি দেখেছি, মতামতগুলি সম্পর্কে এই বিষয়ে পৃথক প্রবণতা রয়েছে। সেরা অনুশীলন অবশ্যই ক্রস-বৈধতা ব্যবহার করে নির্দেশ করবে (বিশেষত যদি একই ডেটাসেটের অন্যান্য অ্যালগরিদমের সাথে আরএফগুলির তুলনা করা হয়)। অন্যদিকে, মূল উত্সটি বলেছে যে মডেল প্রশিক্ষণের সময় ওওবি ত্রুটিটি গণনা করা হয় তা পরীক্ষার সেট পারফরম্যান্সের একটি সূচক যথেষ্ট। এমনকি …

2
একটি '' উল্লেখযোগ্য পরিবর্তনশীল '' যা নমুনার পূর্বাভাসের উন্নতি করে না - কীভাবে ব্যাখ্যা করব?
আমার একটি প্রশ্ন রয়েছে যা আমি মনে করি প্রচুর ব্যবহারকারীর কাছে একেবারে বেসিক। আমি লিনিয়ার রিগ্রেশন মডেলগুলি ব্যবহার করছি (i) বেশ কয়েকটি ব্যাখ্যামূলক ভেরিয়েবল এবং আমার প্রতিক্রিয়া ভেরিয়েবলের সম্পর্ক তদন্ত করতে এবং (ii) ব্যাখ্যামূলক ভেরিয়েবলগুলি ব্যবহার করে আমার প্রতিক্রিয়া ভেরিয়েবলের পূর্বাভাস। একটি নির্দিষ্ট ব্যাখ্যামূলক ভেরিয়েবল এক্স উল্লেখযোগ্যভাবে আমার প্রতিক্রিয়া ভেরিয়েবলকে …

1
কীভাবে নমুনা আর স্কোয়ারের বাইরে গণনা করব?
আমি জানি এটি সম্ভবত অন্য কোথাও আলোচনা করা হয়েছে, তবে আমি এর স্পষ্ট উত্তর খুঁজে পাচ্ছি না। আমি লিনিয়ার রিগ্রেশন মডেলটির আউট-অফ-স্যাম্পল গণনা করার জন্য সূত্র ব্যবহার করার চেষ্টা করছি , যেখানে হ'ল স্কোয়ারের অবশিষ্টাংশের যোগফল এবং বর্গের মোট যোগফল। প্রশিক্ষণের জন্য, এটি পরিষ্কার যেR2=1−SSR/SSTR2=1−SSR/SSTR^2 = 1 - SSR/SSTR2R2R^2SSRSSRSSRSSTSSTSST SST=Σ(y−y¯train)2SST=Σ(y−y¯train)2 …
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.