বৃহত্তর বৈধতা সেটগুলি নমুনার বাইরে থাকা কার্যকারিতার আরও সঠিক অনুমান দেয়। তবে যেমনটি আপনি লক্ষ্য করেছেন, এক পর্যায়ে অনুমানটি আপনার প্রয়োজনের মতো যথাযথ হতে পারে এবং আপনি সেই পর্যায়ে পৌঁছানোর জন্য বৈধতা নমুনার আকার সম্পর্কে কিছুটা মোটামুটি ভবিষ্যদ্বাণী করতে পারেন।
সাধারণ সঠিক / ভুল শ্রেণিবদ্ধকরণ নির্ভুলতার জন্য, আপনি অনুমানের স্ট্যান্ডার্ড ত্রুটি √ হিসাবে গণনা করতে পারেন (একটি বার্নুইলি ভেরিয়েবলের স্ট্যান্ডার্ড বিচ্যুতি), যেখানেপিহ'ল সঠিক শ্রেণিবিন্যাসের সম্ভাবনা, এবংnহ'ল বৈধকরণের আকারের আকার। অবশ্যই আপনিপিজানেন না, তবে এর ব্যাপ্তি সম্পর্কে আপনার কিছু ধারণা থাকতে পারে। উদাহরণস্বরূপ বলা যাক আপনি 60-80% এর মধ্যে একটি নির্ভুলতা আশা করেন এবং আপনি নিজের অনুমানের 0.1% এর চেয়ে ছোট স্ট্যান্ডার্ড ত্রুটি দেখতে চান:
√পি ( 1 - পি ) / এন---------√পিএনপিএন(বৈধতা সেটটির আকার)
কত বড় হওয়া উচিত? জন্যপি=0.6আমরা পাই:
এন> 0.6 - 0.6 2
পি ( 1) - পি ) / এন---------√< 0.001
এনপি = 0.6
জন্য
পি=0.8আমরা পাই:
এন>0.8-0.82n > 0.6 - 0.620.0012= 240 , 000
পি = 0.8
সুতরাং এটি আমাদের বলছে আপনি বৈধতার জন্য আপনার 5 মিলিয়ন ডেটা নমুনার 5% এরও কম ব্যবহার করে পালিয়ে যেতে পারেন। আপনি যদি উচ্চতর পারফরম্যান্স আশা করেন তবে এই শতাংশ হ্রাস পাবে, বা বিশেষত আপনি যদি আপনার নমুনা ছাড়িয়ে নিখরচায় পারফরম্যান্সের প্রাক্কলনের তুলনায় কম সন্তুষ্ট হন (যেমন
পি=0.7সহ
)n > 0.8 - 0.820.0012= 160 , 000
পি = 0.7 এবং একটি <1% এর জন্য, আপনার কেবলমাত্র 2100 বৈধতা নমুনার প্রয়োজন , বা আপনার ডেটা শতাংশের বিশ ভাগের কম)।
এই গণনাগুলি টিম তার উত্তরে তৈরি করা বিন্দুটিও প্রদর্শন করে যে আপনার অনুমানের যথার্থতা আপনার বৈধতা সেটটির নিখুঁত আকারের উপর নির্ভর করে (যেমন এন প্রশিক্ষণের সেটের তুলনায় এর আকারের পরিবর্তে ) ।
(এছাড়াও আমি যুক্ত করতে পারি যে আমি এখানে প্রতিনিধি নমুনা গ্রহণ করছি। যদি আপনার ডেটা খুব ভিন্নধর্মী হয় তবে আপনার ট্রেন ও পরীক্ষার ডেটা হিসাবে যাচাইকরণের ডেটাতে সমস্ত একই শর্ত ইত্যাদি অন্তর্ভুক্ত রয়েছে তা নিশ্চিত করার জন্য আপনাকে বৃহত্তর বৈধতা সেটগুলি ব্যবহার করতে হবে। )