তৃতীয় উপায়টি সঠিক। স্ট্যাটিস্টিকাল লার্নিংয়ের উপাদানগুলিতে হুবহু কেন আশ্চর্যজনকভাবে আবরণ করা হয়েছে, শেয়ার বাজারের উদাহরণে "ভুল এবং সঠিক পথ ক্রস-বৈধকরণের" বিভাগটি দেখুন, এবং ডেটা লার্নিং থেকে ডেটা চূড়ান্ত অধ্যায়েও শেয়ার বাজারের উদাহরণে দেখুন।
মূলত, 1 এবং 2 পদ্ধতিগুলি আপনার প্রতিক্রিয়া সম্পর্কে বা ভবিষ্যত থেকে আপনার মডেলটির প্রশিক্ষণ বা মূল্যায়নের জন্য নির্ধারিত তথ্য থেকে তথ্য ফাঁস করে। এটি আপনার মডেল মূল্যায়নে যথেষ্ট আশাবাদ পক্ষপাত করতে পারে।
মডেল যাচাইয়ের ধারণাটি হল আপনার মডেল যখন উত্পাদন সংক্রান্ত সিদ্ধান্ত নেবেন তখন আপনি যে পরিস্থিতিটি তৈরি করবেন, যখন আপনার সত্যিকারের প্রতিক্রিয়াতে অ্যাক্সেস থাকবে না m ফলাফলটি হ'ল আপনি পূর্বাভাসিত মানগুলির তুলনা বাদ দিয়ে পরীক্ষার জবাবটি কোনও কিছুর জন্য ব্যবহার করতে পারবেন না ।
এর নিকটবর্তী হওয়ার অন্য উপায়টি কল্পনা করা যে আপনি একবারে আপনার হোল্ড আউট থেকে কেবলমাত্র একটি ডেটা পয়েন্ট অ্যাক্সেস পেয়েছেন (উত্পাদন মডেলগুলির জন্য একটি সাধারণ পরিস্থিতি)। এই অনুমানের অধীনে আপনি যা কিছু করতে পারবেন না তা আপনার দুর্দান্ত সন্দেহের মধ্যে থাকা উচিত। স্পষ্টতই, আপনি যা করতে পারবেন না তা হ'ল আপনার ডেটা উত্পাদন প্রবাহকে স্বাভাবিক করার জন্য সমস্ত নতুন ডেটা-পয়েন্টগুলি অতীত এবং ভবিষ্যতের উপরে সামগ্রিক - সুতরাং মডেল বৈধতার জন্য একই কাজ করা অবৈধ।
আপনার পরীক্ষার সেটটি শূন্য-নন হওয়ার বিষয়ে আপনাকে চিন্তা করতে হবে না, এটি আপনার পারফরম্যান্সের প্রাক্কলন অনুমানের চেয়ে পক্ষপাতদুষ্ট হওয়ার চেয়ে ভাল অবস্থা। যদিও, অবশ্যই, যদি পরীক্ষাটি সত্যই আপনার ট্রেনের হিসাবে একই অন্তর্নিহিত বিতরণ থেকে নেওয়া হয় (পরিসংখ্যানগত শিক্ষার একটি প্রয়োজনীয় অনুমান), বলেন গড়টি প্রায় শূন্য হিসাবে বের হওয়া উচিত।
R
? : এই প্রশ্ন দেখতে পাবেন stackoverflow.com/questions/49260862/...