আমি আধা-তত্ত্বাবধানে শেখার পদ্ধতিগুলি খতিয়ে দেখছি এবং "সিউডো-লেবেলিং" ধারণাটি পেয়েছি।
আমি যেমন এটি বুঝতে পারি, সিউডো-লেবেলিংয়ের সাথে আপনার কাছে লেবেলযুক্ত ডেটার পাশাপাশি লেবেলযুক্ত ডেটার একটি সেট রয়েছে। আপনি কেবলমাত্র লেবেলযুক্ত ডেটাতে কোনও মডেলকে প্রশিক্ষণ দিন। তারপরে আপনি সেই প্রাথমিক তথ্যটি লেবেলযুক্ত ডেটা শ্রেণিবদ্ধ করতে (অস্থায়ী লেবেলগুলি সংযুক্ত করতে) ব্যবহার করুন। তারপরে আপনি লেবেলযুক্ত এবং লেবেলযুক্ত উভয় ডেটা আপনার মডেল প্রশিক্ষণে ফিরিয়ে আনুন, (পুনরায়) পরিচিত লেবেল এবং পূর্বাভাসীকৃত লেবেল উভয়েরই ফিটিং। (এই প্রক্রিয়াটি চিহ্নিত করুন, আপডেট হওয়া মডেলটির সাথে পুনরায় লেবেলিং করুন))
দাবি করা সুবিধাগুলি হ'ল আপনি মডেলটি উন্নত করতে লেবেলযুক্ত ডেটার কাঠামো সম্পর্কিত তথ্য ব্যবহার করতে পারেন। নিম্নলিখিত চিত্রটির বিভিন্নতা প্রায়শই প্রদর্শিত হয়, "প্রদর্শিত হয়" যে প্রক্রিয়াটি আরও জটিল সিদ্ধান্তের সীমানা নিতে পারে যেখানে ভিত্তিতে (লেবেলযুক্ত) ডেটা রয়েছে based
টেকেরিন সিসি বাই-এসএ 3.0 দ্বারা উইকিমিডিয়া কমন্স থেকে চিত্র
তবে আমি সেই সরল ব্যাখ্যাটি কিনছি না। সাদামাটাভাবে, যদি কেবলমাত্র লেবেলযুক্ত কেবল প্রশিক্ষণের ফলাফল উপরের সিদ্ধান্তের সীমানা হয়, তবে সিউডো-লেবেলগুলি সেই সিদ্ধান্তের সীমানার ভিত্তিতে নির্ধারিত হত। যা বলা যায় যে উপরের বক্ররেখার বাম হাতটি সিউডো-লেবেলযুক্ত সাদা এবং নীচের বক্ররেখার ডান হাতটি সিউডো-লেবেলযুক্ত কালো হবে। পুনরায় প্রশিক্ষণের পরে আপনি সুন্দর কার্ভিং সিদ্ধান্তের সীমানা পাবেন না, কারণ নতুন সিউডো-লেবেলগুলি কেবলমাত্র বর্তমান সিদ্ধান্তের সীমানাকে শক্তিশালী করবে।
বা অন্যভাবে বলতে গেলে, বর্তমান লেবেলযুক্ত কেবলমাত্র সিদ্ধান্তের সীমানায় লেবেলযুক্ত ডেটাগুলির জন্য নিখুঁত পূর্বাভাসের নির্ভুলতা থাকবে (যেমনটি আমরা সেগুলি তৈরি করতাম)। কোনও ড্রাইভিং ফোর্স নেই (গ্রেডিয়েন্ট নেই) যা সিউডো-লেবেলযুক্ত ডেটা যুক্ত করে কেবল আমাদের সেই সিদ্ধান্তের সীমানার অবস্থান পরিবর্তন করতে পারে।
আমি কি ভেবে সঠিকভাবে বুঝতে পারি যে ডায়াগ্রামের সাহায্যে ব্যাখ্যাটির অভাব রয়েছে? নাকি আমি এখানে কিছু মিস করছি? যদি তা না হয় তবে সিউডো-লেবেলের সুবিধা কী , পূর্ব-প্রশিক্ষণ সংক্রান্ত সিদ্ধান্তের সীমানায় সিউডো-লেবেলের উপর নিখুঁত নির্ভুলতা থাকলে?