আপনি যে শব্দটির সন্ধান করছেন তা হ'ল "লার্নিং কার্ভ", যা প্রশিক্ষণের নমুনা আকারের কার্যকারিতা হিসাবে (গড়) মডেল পারফরম্যান্স দেয়।
বক্ররেখা শেখা অনেক কিছুর উপর নির্ভর করে, যেমন
- শ্রেণিবদ্ধকরণ পদ্ধতি
- শ্রেণিবদ্ধের জটিলতা
- ক্লাস পৃথক করা হয় কত ভাল।
(আমি মনে করি দ্বি-শ্রেণীর এলডিএর জন্য আপনি কিছু তাত্ত্বিক শক্তি গণনা অর্জন করতে সক্ষম হতে পারেন, তবে গুরুত্বপূর্ণ তথ্যটি সর্বদা আপনার ডেটা আসলে "সমান সিওভি মাল্টিভারিয়েট স্বাভাবিক" অনুমানের সাথে মিলিত হয় কিনা তা সর্বদা। আমি উভয় এলডিএর জন্য কিছু সিমুলেশন চাইব অনুমান এবং আপনার ইতিমধ্যে বিদ্যমান ডেটা পুনরায় মডেলিং)।
সীমাবদ্ধ আকারের (যথারীতি) প্রশিক্ষণপ্রাপ্ত শ্রেণিবদ্ধের পারফরম্যান্সের দুটি দিক রয়েছে ,এন
- পক্ষপাতিত্ব, অর্থাত্ প্রশিক্ষণ নমুনাগুলিতে প্রশিক্ষিত একজন শ্রেণিবদ্ধ, প্রশিক্ষণের ক্ষেত্রে প্রশিক্ষণপ্রাপ্ত শ্রেণিবদ্ধের চেয়ে খারাপ (এটি সাধারণত বক্ররেখা শেখার দ্বারা বোঝানো হয়), এবংএনn = ∞
- বৈকল্পিকতা: ক্ষেত্রে একটি প্রদত্ত প্রশিক্ষণ সেট মডেলটির পারফরম্যান্সে ভিন্ন হতে পারে।
এমনকি কয়েকটি ক্ষেত্রেও আপনি ভাগ্যবান এবং ভাল ফলাফল পেতে পারেন। অথবা আপনার ভাগ্য খারাপ এবং সত্যিই খারাপ শ্রেণিবদ্ধ হয়।
যথারীতি, incresing প্রশিক্ষণ নমুনার আকার সাথে এই প্রকরণটি হ্রাস পায় ।এন
এন
আপনার আরেকটি দিক যা বিবেচনায় নিতে হতে পারে তা হ'ল সাধারণত কোনও ভাল শ্রেণিবদ্ধকারীকে প্রশিক্ষণ দেওয়া যথেষ্ট নয়, তবে আপনাকে এটি প্রমাণও করতে হবে যে শ্রেণিবদ্ধকারী ভাল (বা যথেষ্ট ভাল)। সুতরাং আপনাকে প্রদত্ত নির্ভুলতার সাথে বৈধতার জন্য প্রয়োজনীয় নমুনা আকারও পরিকল্পনা করতে হবে। এতগুলি পরীক্ষার ক্ষেত্রে (যেমন উত্পাদকের বা গ্রাহকের যথার্থতা / যথার্থতা / সংবেদনশীলতা / ইতিবাচক ভবিষ্যদ্বাণীমূলক মান) মধ্যে সাফল্যের ভগ্নাংশ হিসাবে যদি আপনাকে এই ফলাফলগুলি দেওয়া প্রয়োজন হয়, এবং অন্তর্নিহিত শ্রেণিবিন্যাসের কাজটি বরং সহজ তবে প্রশিক্ষণের চেয়ে আরও স্বতন্ত্র কেসগুলির প্রয়োজন হতে পারে একটি ভাল মডেল।
থাম্বের নিয়ম হিসাবে, প্রশিক্ষণের জন্য, নমুনার আকারটি সাধারণত মডেল জটিলতার সাথে সম্পর্কিত হয় (কেসের সংখ্যা: প্রকরণের সংখ্যা), যেখানে পরীক্ষার নমুনা আকারের উপর নিখুঁত সীমা পারফরম্যান্সের পরিমাপের প্রয়োজনীয় নির্ভুলতার জন্য দেওয়া যেতে পারে।
এখানে একটি কাগজ রয়েছে, যেখানে আমরা এই বিষয়গুলি আরও বিশদভাবে ব্যাখ্যা করেছি এবং কীভাবে শেখার বক্ররেখাগুলি পরিচালনা করবেন তাও আলোচনা করব:
বেলাইট, সি এবং নিউজবাউয়ার, ইউ এবং বকলিটজ, টি। এবং ক্রাফ্ট, সি এবং পপ, জে: নমুনা আকারের পরিকল্পনা শ্রেণিবদ্ধকরণ মডেলগুলির জন্য। পায়খানা চিম অ্যাক্টা, 2013, 760, 25-33।
ডিওআই: 10.1016 / জে.এ.সি.এ.এল.এল .11.11.007 আরএক্সআইভিতে
স্বীকৃত পান্ডুলিপি: 1211.1323
এটি "টিজার", একটি সহজ শ্রেণিবদ্ধকরণ সমস্যা দেখায় (আমাদের শ্রেণিবিন্যাসের সমস্যাটিতে আমাদের কাছে এর মতো একটি সহজ পার্থক্য রয়েছে তবে অন্যান্য শ্রেণিগুলি পার্থক্য করা আরও বেশি কঠিন):
আরও কত প্রশিক্ষণের ক্ষেত্রে প্রয়োজনীয় তা নির্ধারণ করার জন্য আমরা বৃহত্তর প্রশিক্ষণের নমুনা আকারগুলিতে এক্সট্রোপোলেট করার চেষ্টা করিনি, কারণ পরীক্ষার নমুনা মাপগুলি আমাদের বাধা, এবং বৃহত্তর প্রশিক্ষণের নমুনা আকারগুলি আরও জটিল মডেলগুলি তৈরি করতে দেয়, সুতরাং এক্সট্রাপোলেশন প্রশ্নবিদ্ধ। আমার যে ধরণের ডেটা সেট রয়েছে সেগুলির জন্য, আমি এই পুনরাবৃত্তির সাথে যোগাযোগ করতাম, একগুচ্ছ নতুন কেস পরিমাপ করতাম, দেখিয়েছিলাম যে জিনিসগুলির মধ্যে কতটা উন্নতি হয়েছে, আরও কেসগুলি পরিমাপ করা হবে ইত্যাদি।
এটি আপনার পক্ষে পৃথক হতে পারে তবে প্রয়োজনীয় সংখ্যার নমুনার অনুমানের জন্য কাগজটিতে উচ্চতর নমুনা আকারগুলিতে এক্সট্রাপোলেশন ব্যবহার করে কাগজগুলিতে সাহিত্যের উল্লেখ রয়েছে।