দ্রষ্টব্য: কেস হল এন >> পি
আমি পরিসংখ্যানগত শিক্ষার উপাদানগুলি পড়ছি এবং ক্রস বৈধকরণের "ডান" উপায় সম্পর্কে বিভিন্ন উল্লেখ রয়েছে (যেমন পৃষ্ঠা 60, পৃষ্ঠা 245)) বিশেষত, আমার প্রশ্ন হল যখন কোনও মডেল অনুসন্ধান হয়েছে তখন কে-ফোল্ড সিভি বা বুটস্ট্র্যাপিং ব্যবহার করে চূড়ান্ত মডেলটিকে (পৃথক পরীক্ষার সেট ছাড়াই) কীভাবে মূল্যায়ন করা যায়? দেখে মনে হচ্ছে বেশিরভাগ ক্ষেত্রে (এম্বেড করা বৈশিষ্ট্য নির্বাচন ছাড়া এমএল অ্যালগরিদম) থাকবে
- একটি বৈশিষ্ট্য নির্বাচনের পদক্ষেপ
- একটি মেটা প্যারামিটার নির্বাচনের পদক্ষেপ (যেমন এসভিএমের ব্যয় প্যারামিটার)।
আমার প্রশ্নগুলো:
- আমি দেখেছি বৈশিষ্ট্য নির্বাচন পদক্ষেপটি সম্পন্ন করা যেতে পারে যেখানে পুরো প্রশিক্ষণ সেটটিতে বৈশিষ্ট্য নির্বাচন করা হয় এবং একপাশে রাখা হয়। তারপরে কে-ফোল্ড সিভি ব্যবহার করে বৈশিষ্ট্য নির্বাচন অ্যালগরিদম প্রতিটি ভাঁজে ব্যবহৃত হয় (প্রতিটি সময় সম্ভবত পৃথক বৈশিষ্ট্যগুলি বেছে নেওয়া হয়) এবং ত্রুটি গড় হয় a তারপরে, আপনি চূড়ান্ত মোডটি প্রশিক্ষণের জন্য সমস্ত ডেটা (যা আলাদা করে রাখা হয়েছিল) ব্যবহার করে নির্বাচিত বৈশিষ্ট্যগুলি ব্যবহার করবেন তবে মডেলের ভবিষ্যতের পারফরম্যান্সের অনুমান হিসাবে ক্রস বৈধতা থেকে ত্রুটিটি ব্যবহার করুন। এটা কি সঠিক?
- আপনি যখন মডেল পরামিতিগুলি নির্বাচন করতে ক্রস বৈধতা ব্যবহার করছেন, তারপরে কীভাবে মডেল পারফরম্যান্স অনুমান করবেন? এটি # 1 সমপরিমাণ একই পদ্ধতি বা আপনি নীচের সিভি পছন্দ করেন পৃষ্ঠা 54 ( পিডিএফ ) বা অন্য কিছুতে দেখান?
- আপনি যখন উভয় পদক্ষেপ (বৈশিষ্ট্য এবং প্যারামিটার সেটিং) করছেন তখন ..... আপনি কী করবেন? জটিল নেস্ট লুপ?
- আপনার যদি পৃথক হোল্ড আউট নমুনা থাকে, তবে উদ্বেগটি কি দূরে যায় এবং আপনি বৈশিষ্ট্য এবং পরামিতিগুলি নির্বাচন করতে ক্রস বৈধতা ব্যবহার করতে পারেন (আপনার পারফরম্যান্সের অনুমান হোল্ড আউট সেট থেকে আসবে বলে কোনও উদ্বেগ ছাড়াই)?