মনে করুন আমি এমন একটি শ্রেণিবদ্ধ শিখতে চাই যা সংখ্যার ভেক্টরকে ইনপুট হিসাবে গ্রহণ করে এবং আউটপুট হিসাবে একটি শ্রেণিবদ্ধ লেবেল দেয়। আমার প্রশিক্ষণের ডেটাতে প্রচুর সংখ্যক ইনপুট-আউটপুট জোড়া থাকে।
যাইহোক, যখন আমি কিছু নতুন ডেটা পরীক্ষা করতে আসি, তখন এই ডেটাটি সাধারণত আংশিকভাবে সম্পূর্ণ হয়। উদাহরণস্বরূপ যদি ইনপুট ভেক্টরটি দৈর্ঘ্যের 100 হয় তবে কেবলমাত্র 30 টি উপাদানকে মান দেওয়া যেতে পারে এবং বাকীগুলি "অজানা"।
এর উদাহরণ হিসাবে চিত্রের স্বীকৃতি বিবেচনা করুন যেখানে এটি জানা যায় যে চিত্রটির অংশটি অন্তর্ভুক্ত রয়েছে। বা শ্রেণিবিন্যাসকে সাধারণ অর্থে বিবেচনা করুন যেখানে এটি পরিচিত যে তথ্যের অংশটি দূষিত। সমস্ত ক্ষেত্রে, আমি ঠিক জানি ডেটা ভেক্টরের কোন উপাদানগুলি অজানা অংশ।
আমি ভাবছি যে আমি কীভাবে এমন শ্রেণিবদ্ধ শিখতে পারি যা এই ধরণের ডেটার জন্য কাজ করবে? আমি কেবল "অজানা" উপাদানগুলিকে একটি এলোমেলো সংখ্যায় সেট করতে পেরেছিলাম, তবে জানা যায় যে পরিচিতদের তুলনায় প্রায়শই অজানা উপাদান রয়েছে, এটি ভাল সমাধানের মতো শোনাচ্ছে না। অথবা, আমি এলোমেলোভাবে প্রশিক্ষণ ডেটাতে উপাদানগুলিকে "অজানা" হিসাবে পরিবর্তন করতে এবং সম্পূর্ণ ডেটার পরিবর্তে এগুলি দিয়ে প্রশিক্ষণ দিতে পারি, তবে এর জন্য জানা এবং অজানা উপাদানগুলির সমস্ত সংমিশ্রণের বিস্তৃত নমুনার প্রয়োজন হতে পারে।
বিশেষত আমি নিউরাল নেটওয়ার্কগুলি সম্পর্কে ভাবছি, তবে আমি অন্য শ্রেণিবদ্ধদের জন্য উন্মুক্ত।
কোন ধারনা? ধন্যবাদ!