আমার কিছু তথ্য রয়েছে যা গ্রাফ । দুটি ক্লাসের মধ্যে , একটির অন্তর্ভুক্ত , এবং আমি দুটি শ্রেণীর মধ্যে পার্থক্য করার জন্য একটি এসভিএম প্রশিক্ষণ দিতে আগ্রহী। এর একটি উপযুক্ত কার্নেল হল আশ্লেষ কার্নেল , যেখানে হয় Laplacian এর এবং একটি টিউনিং প্যারামিটার।y আমি ∈ { - 1 , 1 }এলβ
এসভিএম টিউন করার জন্য হাইপারপ্যারামিটার নির্বাচন করা দরকার, তাই আমাকে টিউন করতে হবেসাধারণত, আমরা এই সমস্যা জন্য ক্রস-বৈধতা ব্যবহার করেন, কিন্তু যে এখানে যথাযথ বলে মনে হচ্ছে না, একটি প্রান্তবিন্দু বাদ যেহেতু থেকে পুরো গ্রাফ পরিবর্তন, এমনকি সংযুক্ত উপাদান সংখ্যা বাড়িয়ে! যদি সংযুক্ত উপাদানগুলির সংখ্যা পরিবর্তিত হয়, তবে কিছু অংশগুলি অন্যের কাছ থেকে অ্যাক্সেসযোগ্য হয়ে যায় এবং আমরা যেভাবে শুরু করেছি তার চেয়ে অনেক বেশি আলাদা ডেটার মুখোমুখি। এটি হ'ল কেবল আমরা মুছে ফেলা ভারটেক্স টিই হারিয়ে যাচ্ছি না, তবে আমরা গ্রাফের অন্যান্য শিখুন সম্পর্কেও তথ্যটি অনুপস্থিত যা সেই শীর্ষবিন্দুটির সাথে সংলগ্ন ছিল।i G i j
ক্রস-বৈধকরণের মূল ধারণাটি হ'ল আমরা যখন নতুন ডেটা উপস্থাপন করা হয় তখন মডেলটি কীভাবে সম্পাদন করবে তা অনুমান করতে চাই। মানক সমস্যায়, পরীক্ষার জন্য আপনার কিছু ডেটা বাদ দেওয়া বাকী প্রশিক্ষণের ডেটার মানগুলিকে পরিবর্তন করে না। তবে গ্রাফ ডেটার ক্ষেত্রে, সিভি সেটিংয়ে মডেলটির "নতুন" ডেটা দেখার জন্য এর অর্থ কী তা পরিষ্কার নয়। শীর্ষস্থানীয় বা প্রান্তকে ছাড় দেওয়াতে পুরোপুরি ডেটা পরিবর্তন করার সম্ভাবনা থাকে। উদাহরণস্বরূপ, একটি গ্রাফ কল্পনা যা একটি -star গ্রাফ, যা এক চূড়া আছে করার প্রান্ত ছেদচিহ্ন, এবং সমস্ত অন্যান্য ছেদচিহ্ন 1 প্রান্ত আছে। প্রশিক্ষণ ডেটা নির্মাণের জন্য কেন্দ্রীয় ভারটেক্সকে ছাড় দেওয়াট ট ট এস *গ্রাফটি সম্পূর্ণ সংযোগ বিচ্ছিন্ন করবে এবং কার্নেল ম্যাট্রিক্সটি তির্যক হবে! তবে অবশ্যই, সরবরাহ করা এই প্রশিক্ষণের ডেটা সম্পর্কে একটি মডেলকে প্রশিক্ষণ দেওয়া সম্ভব হবে । যা কম স্পষ্ট তা হল এর পরে ফলাফলের মডেলের আউট-অফ-নমুনা কর্মক্ষমতা পরীক্ষা করার অর্থ কী। কেউ কি জন্য কার্নেল ম্যাট্রিক্সের পুনঃনির্মাণ করে এবং ভবিষ্যদ্বাণী করার জন্য এটি সরবরাহ করে? এস
অথবা, বিকল্পভাবে, কেউ এর সম্পূর্ণরূপে কার্নেল ম্যাট্রিক্স গণনা করে এবং এসভিএম অনুমানের জন্য ব্যবহৃত কার্নেল ম্যাট্রিক্স উত্পাদন করতে প্রয়োজনীয় সারি এবং কলাম বাদ দিতে পারে? এই দলিল নিজস্ব ধারণাগত সমস্যা, কেন্দ্রীয় নোড অন্তর্ভুক্তি যেহেতু মানে যে প্রতি প্রান্তবিন্দু প্রত্যেক অন্যান্য প্রান্তবিন্দু থেকে পৌঁছানো, এবং কার্নেল ম্যাট্রিক্স ঘন হয়। এই অন্তর্ভুক্তির অর্থ কি ভাঁজগুলি জুড়ে তথ্য ফাঁস এবং ক্রস-বৈধতা আউটপুটকে পক্ষপাতিত্ব করবে? একদিকে, বাদ দেওয়া কেন্দ্রীয় নোডগুলি সম্পর্কিত ডেটা এখনও উপস্থিত রয়েছে, যেহেতু বাদ দেওয়া কেন্দ্রীয় নোড গ্রাফকে সংযুক্ত করে। অন্যদিকে, আমরা লেবেল সম্পর্কে কিছুই জানি নাএস ওয়াই বাদ দেওয়া নোডগুলির মধ্যে, তাই আমরা স্বাচ্ছন্দ্যবোধ করতে পারি যে আমরা এই পদ্ধতিতে সিভি সম্পাদন করে নমুনা ছাড়িয়ে নমুনা ছাড়াই নমুনা পেয়ে যাচ্ছি।
এই ধরণের সমস্যার জন্য কীভাবে একটি হাইপারপ্রেমিটার নির্বাচন করে? সিভি কি অসম্পূর্ণ-তবে-গ্রহণযোগ্য, বা আমাদের বিশেষায়িত পদ্ধতিগুলির প্রয়োজন? হাইপারপ্যারমিটার টিউন করা কি আমার প্রসঙ্গে আদৌ সম্ভব?