আমি জানতে চাই যে নীচে বর্ণিত প্রক্রিয়াটি বৈধ / গ্রহণযোগ্য এবং কোনও ন্যায়সঙ্গত উপলব্ধ কিনা।
ধারণা: তদারকি করা অ্যালগরিদমগুলি ডেটা সম্পর্কে অন্তর্নিহিত কাঠামো / বিতরণকে ধরে নেয় না। দিনের শেষে তারা অনুমানের ফলাফল নির্ধারণ করে। আমি আশা করি কোনওভাবেই অনুমানের অনিশ্চয়তা মেটানোর জন্য। এখন, এমএল মডেল বিল্ডিং প্রক্রিয়া সহজাতভাবে এলোমেলো (উদাহরণস্বরূপ হাইপারপ্যারামিটার টিউনিংয়ের জন্য ক্রস-বৈধকরণের জন্য নমুনা দেওয়ার ক্ষেত্রে এবং স্টোকাস্টিক জিবিএম-এ সাবমলিংয়ে), সুতরাং একটি মডেলিং পাইপলাইন আমাকে প্রতিটি ভিন্ন বীজের সাথে একই ভবিষ্যদ্বাণীকারীদের জন্য আলাদা আউটপুট দেয়। আমার (নিষ্পাপ) ধারণাটি এই প্রসেসটি বারবার চালানো এবং ভবিষ্যদ্বাণীটির বন্টন নিয়ে আসে এবং আমি ভবিষ্যদ্বাণীগুলির অনিশ্চয়তা সম্পর্কে আশাবাদী বিবৃতি দিতে পারি।
যদি এটি গুরুত্বপূর্ণ হয় তবে আমি যে ডেটাসেটগুলির সাথে কাজ করি তা সাধারণত খুব ছোট (200 ডলার সারি) are
এটা কোনো কিছু হলো?
স্পষ্ট করার জন্য, আমি আসলে সনাতন অর্থে ডেটা বুটস্ট্র্যাপিং করছি না (অর্থাত্ আমি ডেটা পুনরায় নমুনা দিচ্ছি না)। প্রত্যেকটি পুনরাবৃত্তিতে একই ডেটাসেট ব্যবহার করা হয়, আমি কেবল এক্সওয়াল এবং স্টোকাস্টিক জিবিএম এ র্যান্ডমনেসটি ব্যবহার করছি।