তদারক করা এবং নিরীক্ষণযোগ্য সমস্যার জন্য কার্নেল পদ্ধতিগুলি ব্যবহার করা যেতে পারে। সুপরিচিত উদাহরণগুলি যথাক্রমে সমর্থন ভেক্টর মেশিন এবং কার্নেল বর্ণালী ক্লাস্টারিং ।
কার্নেল পদ্ধতিগুলি রুপান্তরিত বৈশিষ্ট্য ব্যবস্থায় রৈখিক অ্যালগরিদম ব্যবহারের জন্য একটি কাঠামোগত উপায় সরবরাহ করে, যার জন্য রূপান্তরটি সাধারণত অরেখানের (এবং একটি উচ্চতর মাত্রিক স্থান) হয়। এই তথাকথিত কার্নেল ট্রিকটি কী কী সুবিধা নিয়ে আসে তা হ'ল ননলাইনার প্যাটার্নগুলি একটি যুক্তিসঙ্গত গণনা মূল্যে পাওয়া যাবে ।
নোট করুন যে আমি বলেছিলাম যে গণনা ব্যয় যুক্তিসঙ্গত, কিন্তু তুচ্ছ নয়। কার্নেল পদ্ধতিগুলি সাধারণত কার্নেল ম্যাট্রিক্স তৈরি করেK∈RN×N সঙ্গে Nপ্রশিক্ষণের উদাহরণ সংখ্যা। কার্নেল পদ্ধতির জটিলতা তাই ইনপুট মাত্রার সংখ্যার চেয়ে প্রশিক্ষণের ক্ষেত্রে সংখ্যার ফাংশন। সমর্থন ভেক্টর মেশিনগুলির উদাহরণস্বরূপ, এর মধ্যে একটি প্রশিক্ষণের জটিলতা রয়েছেO(N2) এবং O(N3)। খুব বড় সমস্যাগুলির জন্যNএই জটিলতাটি বর্তমানে নিষিদ্ধ।
মাত্রাগুলির সংখ্যা বড় এবং নমুনাগুলির সংখ্যা তুলনামূলকভাবে কম (বলুন, 1 মিলিয়নেরও কম) যখন এটি গণনার দিক থেকে কর্নেল পদ্ধতিগুলি খুব আকর্ষণীয় করে তোলে।
সম্পর্কিত: সমর্থন ভেক্টর মেশিনের জন্য লিনিয়ার কার্নেল এবং নন-লিনিয়ার কার্নেল?
বৃহত্তর স্কেল সমস্যার জন্য এসভিএম
জন্য খুব যেমন উচ্চ মাত্রিক সমস্যা, 10000
মাত্রা আপনি প্রশ্নে উল্লেখ আছে, প্রায়ই একটি উচ্চ মাত্রিক বৈশিষ্ট্য স্থান ম্যাপ কোন প্রয়োজন নেই। ইনপুট স্থান ইতিমধ্যে যথেষ্ট ভাল। এই জাতীয় সমস্যার জন্য, লিনিয়ার পদ্ধতি হ'ল প্রায় একই প্রেডিকটিভ পারফরম্যান্স সহ দ্রুততার অর্ডার । এই পদ্ধতির উদাহরণগুলি লাইবলাইনআর বা ভোপাল ওয়াববিটে পাওয়া যাবে ।
লিনিয়ার পদ্ধতিগুলি বিশেষত আকর্ষণীয় যখন আপনার কাছে উচ্চ মাত্রিক ইনপুট স্পেসে অনেকগুলি নমুনা থাকে। যখন আপনি কেবল500 নমুনা, একটি ননলাইনার কার্নেল পদ্ধতি ব্যবহার করাও সস্তা হবে (যেহেতু এনছোট). যদি আপনার কাছে থাকে, বলুন,5.000.000 মধ্যে নমুনা 10.000 মাত্রা, কার্নেল পদ্ধতিগুলি অক্ষম হবে।
অনেক প্রশিক্ষণের উদাহরণ সহ নিম্ন-মাত্রিক সমস্যার জন্য (তথাকথিত বৃহত এন ছোট পিসমস্যা), লিনিয়ার পদ্ধতিগুলি খারাপ ভবিষ্যদ্বাণীমূলক নির্ভুলতা অর্জন করতে পারে। এই জাতীয় সমস্যার জন্য, এনসেম্বলএসভিএম এর মতো এনসেম্বল পদ্ধতিগুলি স্ট্যান্ডার্ড এসভিএমের তুলনায় উল্লেখযোগ্যভাবে হ্রাস করা গণনা ব্যয়ে ননলাইনারের সিদ্ধান্তের সীমানা সরবরাহ করে।
RBF
কার্নেলটি এর মধ্যে ব্যবহার করি তবেlibsvm
এটি সর্বদা উপযোগী, শ্রেণিবদ্ধকারী পরীক্ষার সংস্থায় একটি উচ্চ নির্ভুলতা তবে কম নির্ভুলতা অর্জন করে। এবং যদি আমি শ্রেণিবদ্ধের আগে মাত্রা হ্রাস করি, এবং হ্রাস মাত্রাগুলি প্রশিক্ষণের নমুনার সংখ্যার কাছাকাছি হয়, তবে শ্রেণিবদ্ধকারী প্রশিক্ষণ এবং পরীক্ষার সেটগুলির মধ্যে একটি ভাল লাভ অর্জন করতে পারে। ফলাফলগুলি কি সবচেয়ে পরীক্ষামূলক ফলাফলের সাথে খাপ খায়? ধন্যবাদ।