ট্রেন / টেস্ট / বৈধকরণ সেটগুলিতে টাইম সিরিজের ডেটা বিভক্ত করা


12

ট্রেন / পরীক্ষা / বৈধতা সেটগুলিতে টাইম সিরিজের ডেটা বিভক্ত করার সর্বোত্তম উপায় কী, যেখানে হাইপারপ্যারমিটার টিউনিংয়ের জন্য বৈধতা সেটটি ব্যবহৃত হবে?

আমাদের কাছে দৈনিক বিক্রয় ডেটা 3 বছরের মূল্যবান রয়েছে এবং আমাদের পরিকল্পনাটি 2015-2016 প্রশিক্ষণ ডেটা হিসাবে ব্যবহার করা হবে, তারপরে এলোমেলোভাবে নমুনা হিসাবে সেট করার জন্য 2017 ডেটা থেকে 10 সপ্তাহ এবং 2017 এর ডেটা থেকে আরও 10 সপ্তাহের জন্য পরীক্ষা সেট। এরপরে আমরা পরীক্ষা এবং বৈধতা সেটটিতে প্রতিটি দিন এগিয়ে যেতে পারি।

উত্তর:


8

চেহারা-সামনের পক্ষপাতিত্ব এড়াতে আপনার সময়ের উপর ভিত্তি করে একটি বিভাজন ব্যবহার করা উচিত। ট্রেন / বৈধতা / সময়ক্রমে এই আদেশে পরীক্ষা।

পরীক্ষা সেটটি ডেটার সবচেয়ে সাম্প্রতিক অংশ হওয়া উচিত। আপনাকে একটি উত্পাদনের পরিবেশের পরিস্থিতি অনুকরণ করতে হবে, যেখানে কোনও মডেলকে প্রশিক্ষণ দেওয়ার পরে আপনি মডেল তৈরির সময় পরে আসা ডেটাগুলি মূল্যায়ন করেন। যাচাইকরণ এবং প্রশিক্ষণের জন্য আপনি যে এলোমেলো নমুনা ব্যবহার করেন সেহেতু এটি ভাল ধারণা নয়।


5

আমি মনে করি প্রশিক্ষণ / বৈধতা / পরীক্ষা / পূর্বাভাসের জন্য আপনার সময়-সিরিজ ডেটাটি উপার্জনের সবচেয়ে সম্পূর্ণ উপায় হ'ল:

এখানে চিত্র বর্ণনা লিখুন

ছবিটি কি স্ব-বর্ণনামূলক? যদি তা না হয় তবে দয়া করে মন্তব্য করুন এবং আমি আরও পাঠ্য যোগ করব ...


3

প্রশিক্ষণ / বৈধতা সেটগুলির কেবলমাত্র একটি সেট তৈরি করার পরিবর্তে আপনি এই জাতীয় আরও সেট তৈরি করতে পারেন।

প্রথম প্রশিক্ষণের সেটটি বলা যেতে পারে, 6 মাসের ডেটা (2015 সালের প্রথম সেমিস্টার) এবং বৈধতা সেটটি পরবর্তী তিন মাস (জুলাই-আগস্ট 2015) হবে। দ্বিতীয় প্রশিক্ষণ সেটটি প্রথম প্রশিক্ষণ এবং বৈধকরণের সংমিশ্রণ হবে। বৈধতা সেটটি পরবর্তী তিন মাস (সেপ্টেম্বর-অক্টোবর 2015) হয়। ইত্যাদি।

এটি কে-ফোল্ড ক্রস-বৈধকরণের একটি বৈকল্পিকতা যেখানে প্রশিক্ষণ সেটগুলি পূর্ববর্তী প্রশিক্ষণ এবং বৈধতা সংস্থার সংমিশ্রণ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.