জেনারালাইজেশন ত্রুটি পরিমাপ করার জন্য, আপনাকে পরবর্তীটি করা দরকার: প্রতিটি প্রশিক্ষণ সংস্থার জন্য পৃথক পিসিএ (যার অর্থ প্রতিটি শ্রেণিবদ্ধ এবং প্রতিটি সিভি ফোল্ডারের জন্য পৃথক পিসিএ করা)।
তারপরে আপনি পরীক্ষার সেটে একই রূপান্তরটি প্রয়োগ করেন: অর্থাত আপনি পরীক্ষার সেটটিতে পৃথক পিসিএ করবেন না ! আপনি এখানে ট্রেনিং সেটটির গড় (এবং যদি মান বিচ্যুতি দ্বারা বিভাজনের প্রয়োজন হয়) বিয়োগ করুন: প্রশিক্ষণের সেটটিতে পিসিএর পরে পরীক্ষার সেটটি জিরোকে কেন্দ্র করে নেওয়া । তারপরে আপনি প্রশিক্ষণের সেটটির পিসিগুলিতে ডেটা প্রজেক্ট করুন।
পিসি ব্যবহারের জন্য আপনাকে একটি স্বয়ংক্রিয় মানদণ্ড সংজ্ঞায়িত করতে হবে।
"প্রকৃত" শ্রেণিবিন্যাসের আগে এটি কেবলমাত্র প্রথম তথ্য হ্রাসের পদক্ষেপ হিসাবে, খুব বেশি কয়েকটি পিসি ব্যবহার করা পারফরম্যান্সকে ক্ষতিগ্রস্থ করবে না not আপনার যদি কোনও প্রত্যাশা থাকে যে কতগুলি পিসি অভিজ্ঞতা থেকে ভাল হবে, আপনি সম্ভবত এটি ব্যবহার করতে পারেন।
আপনি পরে পরীক্ষা করতে পারেন যে প্রতি সরোগেট মডেলের জন্য পিসিএ পুনরায় করা প্রয়োজনীয় ছিল (কেবলমাত্র একটি পিসিএ মডেল দিয়ে বিশ্লেষণটি পুনরাবৃত্তি করা)। আমি মনে করি এই পরীক্ষার ফলাফলটি রিপোর্ট করার মতো।
আমি একবার পিসিএ'র পুনরাবৃত্তি না করার পক্ষপাত পরিমাপ করেছিলাম এবং দেখেছিলাম যে আমার বর্ণালী সংক্রান্ত শ্রেণিবিন্যাসের ডেটা দিয়ে, প্রতিটি সরোগেট মডেলের জন্য পিসিএ পুনর্নির্মাণ না করার সময় আমি সাধারণীকরণ ত্রুটি হারের অর্ধেক খুঁজে পেয়েছি।
বলা হচ্ছে, আপনি বর্ণনামূলক (যেমন ভিজ্যুয়ালাইজেশন) উদ্দেশ্যে সম্পূর্ণ ডেটা সেটের একটি অতিরিক্ত পিসিএ মডেল তৈরি করতে পারেন । আপনি নিশ্চিত হন যে আপনি দুটি পদ্ধতির একে অপরের থেকে পৃথক রেখেছেন।
ক্লাসের লেবেলগুলি না দেখে পুরো ডেটাসেটের প্রাথমিক পিসিএ কীভাবে ফলাফলকে পক্ষপাত করবে তা অনুভব করা এখনও আমার পক্ষে কঠিন হয়ে পড়েছে।
তবে এটি ডেটা দেখে না। এবং যদি শ্রেণীর মধ্যে বৈকল্পিকের মধ্যে-শ্রেণীর বৈকল্পিকের তুলনায় বৃহত্তর হয়, তবে শ্রেণিবদ্ধের পার্থক্য পিসিএ প্রজেকশনকে প্রভাবিত করে। সাধারণত পিসিএ পদক্ষেপটি করা হয় কারণ আপনার শ্রেণিবিন্যাসকে স্থিতিশীল করতে হবে। যে একটি অবস্থা যেখানে অতিরিক্ত ক্ষেত্রে, হয় না মডেল প্রভাবিত।
যদি শ্রেণিবদ্ধের পার্থক্যটি ছোট হয়, তবে এই পক্ষপাতিত্ব খুব বেশি হবে না, তবে সেই ক্ষেত্রে পিসিএ উভয়ই শ্রেণিবিন্যাসে সহায়তা করবে না: পিসিএ প্রক্ষেপণ তখন শ্রেণীর মধ্যে পৃথকীকরণের উপর জোর দেওয়াতে সহায়তা করতে পারে না।
caret
প্যাকেজ সহ পিসিএ দিয়ে ক্রস-বৈধকরণ কীভাবে করবেন সে সম্পর্কে এই প্রশ্নটি দেখুন : ক্যারেটে পিসিএ এবং কে-ভাঁজ ক্রস বৈধকরণ ।