গ্রাফ কার্নেল এসভিএম হাইপারপ্যারামিটারগুলি টিউন করার জন্য কোন পদ্ধতি বিদ্যমান?


10

আমার কিছু তথ্য রয়েছে যা গ্রাফ । দুটি ক্লাসের মধ্যে , একটির অন্তর্ভুক্ত , এবং আমি দুটি শ্রেণীর মধ্যে পার্থক্য করার জন্য একটি এসভিএম প্রশিক্ষণ দিতে আগ্রহী। এর একটি উপযুক্ত কার্নেল হল আশ্লেষ কার্নেল , যেখানে হয় Laplacian এর এবং একটি টিউনিং প্যারামিটার।y আমি{ - 1 , 1 }G=(V,E)yi{1,1}এলK=exp(βL),LβGβ

এসভিএম টিউন করার জন্য হাইপারপ্যারামিটার নির্বাচন করা দরকার, তাই আমাকে টিউন করতে হবেসাধারণত, আমরা এই সমস্যা জন্য ক্রস-বৈধতা ব্যবহার করেন, কিন্তু যে এখানে যথাযথ বলে মনে হচ্ছে না, একটি প্রান্তবিন্দু বাদ যেহেতু থেকে পুরো গ্রাফ পরিবর্তন, এমনকি সংযুক্ত উপাদান সংখ্যা বাড়িয়ে! যদি সংযুক্ত উপাদানগুলির সংখ্যা পরিবর্তিত হয়, তবে কিছু অংশগুলি অন্যের কাছ থেকে অ্যাক্সেসযোগ্য হয়ে যায় এবং আমরা যেভাবে শুরু করেছি তার চেয়ে অনেক বেশি আলাদা ডেটার মুখোমুখি। এটি হ'ল কেবল আমরা মুছে ফেলা ভারটেক্স টিই হারিয়ে যাচ্ছি না, তবে আমরা গ্রাফের অন্যান্য শিখুন সম্পর্কেও তথ্যটি অনুপস্থিত যা সেই শীর্ষবিন্দুটির সাথে সংলগ্ন ছিল।i G i jθ=(β,C).iGij

ক্রস-বৈধকরণের মূল ধারণাটি হ'ল আমরা যখন নতুন ডেটা উপস্থাপন করা হয় তখন মডেলটি কীভাবে সম্পাদন করবে তা অনুমান করতে চাই। মানক সমস্যায়, পরীক্ষার জন্য আপনার কিছু ডেটা বাদ দেওয়া বাকী প্রশিক্ষণের ডেটার মানগুলিকে পরিবর্তন করে না। তবে গ্রাফ ডেটার ক্ষেত্রে, সিভি সেটিংয়ে মডেলটির "নতুন" ডেটা দেখার জন্য এর অর্থ কী তা পরিষ্কার নয়। শীর্ষস্থানীয় বা প্রান্তকে ছাড় দেওয়াতে পুরোপুরি ডেটা পরিবর্তন করার সম্ভাবনা থাকে। উদাহরণস্বরূপ, একটি গ্রাফ কল্পনা যা একটি -star গ্রাফ, যা এক চূড়া আছে করার প্রান্ত ছেদচিহ্ন, এবং সমস্ত অন্যান্য ছেদচিহ্ন 1 প্রান্ত আছে। প্রশিক্ষণ ডেটা নির্মাণের জন্য কেন্দ্রীয় ভারটেক্সকে ছাড় দেওয়াএস *এস=(ভীএস,এস)এস*গ্রাফটি সম্পূর্ণ সংযোগ বিচ্ছিন্ন করবে এবং কার্নেল ম্যাট্রিক্সটি তির্যক হবে! তবে অবশ্যই, সরবরাহ করা এই প্রশিক্ষণের ডেটা সম্পর্কে একটি মডেলকে প্রশিক্ষণ দেওয়া সম্ভব হবে । যা কম স্পষ্ট তা হল এর পরে ফলাফলের মডেলের আউট-অফ-নমুনা কর্মক্ষমতা পরীক্ষা করার অর্থ কী। কেউ কি জন্য কার্নেল ম্যাট্রিক্সের পুনঃনির্মাণ করে এবং ভবিষ্যদ্বাণী করার জন্য এটি সরবরাহ করে? এসএস*এস

অথবা, বিকল্পভাবে, কেউ এর সম্পূর্ণরূপে কার্নেল ম্যাট্রিক্স গণনা করে এবং এসভিএম অনুমানের জন্য ব্যবহৃত কার্নেল ম্যাট্রিক্স উত্পাদন করতে প্রয়োজনীয় সারি এবং কলাম বাদ দিতে পারে? এই দলিল নিজস্ব ধারণাগত সমস্যা, কেন্দ্রীয় নোড অন্তর্ভুক্তি যেহেতু মানে যে প্রতি প্রান্তবিন্দু প্রত্যেক অন্যান্য প্রান্তবিন্দু থেকে পৌঁছানো, এবং কার্নেল ম্যাট্রিক্স ঘন হয়। এই অন্তর্ভুক্তির অর্থ কি ভাঁজগুলি জুড়ে তথ্য ফাঁস এবং ক্রস-বৈধতা আউটপুটকে পক্ষপাতিত্ব করবে? একদিকে, বাদ দেওয়া কেন্দ্রীয় নোডগুলি সম্পর্কিত ডেটা এখনও উপস্থিত রয়েছে, যেহেতু বাদ দেওয়া কেন্দ্রীয় নোড গ্রাফকে সংযুক্ত করে। অন্যদিকে, আমরা লেবেল সম্পর্কে কিছুই জানি নাএস ওয়াইএসএস Y বাদ দেওয়া নোডগুলির মধ্যে, তাই আমরা স্বাচ্ছন্দ্যবোধ করতে পারি যে আমরা এই পদ্ধতিতে সিভি সম্পাদন করে নমুনা ছাড়িয়ে নমুনা ছাড়াই নমুনা পেয়ে যাচ্ছি।

এই ধরণের সমস্যার জন্য কীভাবে একটি হাইপারপ্রেমিটার নির্বাচন করে? সিভি কি অসম্পূর্ণ-তবে-গ্রহণযোগ্য, বা আমাদের বিশেষায়িত পদ্ধতিগুলির প্রয়োজন? হাইপারপ্যারমিটার টিউন করা কি আমার প্রসঙ্গে আদৌ সম্ভব?


বর্ণালী পদ্ধতিগুলির জন্য নমুনার বাইরে থাকা এক্সটেনশনের সন্ধান করুন। আমি আমার থিসিসে চিত্রের শ্রেণিবিন্যাসের জন্য কিছু কৌশল প্রয়োগ করেছি (এখন পিছনে তাকিয়ে দেখলাম, আমি এটি আলাদাভাবে করব তবে)। ফলাফল আকর্ষণীয় ছিল তবে মডেলগুলি নিজেরাই বেশ নড়বড়ে এবং টিউন করা সহজ ছিল না।
ভ্লাদিস্লাভস ডভগ্যালিক্স

@xeon এই সাহিত্যের দিকে তাকানো শুরু করার কোন সুপারিশ?
সাইকোরাক্স বলছে মনিকা পুনরায়

উত্তর:


3

দাবি অস্বীকার: আমি গ্রাফ কার্নেলগুলির সাথে খুব বেশি পরিচিত নই, সুতরাং এই উত্তরটি ভুল অনুমানের ভিত্তিতে থাকতে পারে। আমি সম্মত হয়েছি যে কার্নেল ম্যাট্রিক্সের গণনা করার সময় শীর্ষস্থানগুলি বাদ দেওয়া suboptimal হয়। এটি বলেছিল, আমি নিশ্চিত নই যে ক্রস-বৈধতা অগত্যা সমস্যাযুক্ত। আপনার শেখার প্রেক্ষাপট ট্রান্সপোর্টেশন বা আনয়ন?

সামগ্রিকভাবে, আমি নিশ্চিত নই যে সমস্ত ডেটা (যেমন, ট্রেন এবং পরীক্ষা উভয়) এর উপর ভিত্তি করে প্রদত্ত জন্য কার্নেল ম্যাট্রিক্সের গণনা করা প্রয়োজনীয়ভাবে একটি তথ্য ফাঁস তৈরি করে। যদি সমস্ত ডেটার উপর ভিত্তি করে কার্নেলটি গণনা করা ঠিক হয়ে যায়, তবে আপনি প্রশিক্ষণ / পরীক্ষার জন্য (পূর্বনির্মাণ) পূর্ণ কার্নেল ম্যাট্রিক্সের প্রাসঙ্গিক ব্লকগুলি ব্যবহার করে একটি আদর্শ সিভি-সেটআপে মডেলগুলি প্রশিক্ষণ দিতে পারেন।β

এই পদ্ধতির সাহায্যে আপনাকে এবং যৌথভাবে অনুকূলিত করতে সক্ষম করবে , উদাহরণস্বরূপ অপ্টিউটিশনের মতো লাইব্রেরিগুলির মাধ্যমে যেখানে data সমস্ত ডেটার উপর ভিত্তি করে কার্নেল গণনা করতে ব্যবহৃত হয় এবং প্রশিক্ষণের জন্য ভাঁজগুলিতে মডেলগুলি প্রশিক্ষণের জন্য ব্যবহৃত হয়।সি β সিβসিβসি


মার্ক, আপনার মনোযোগের জন্য ধন্যবাদ। আমার সমস্যা প্ররোচক। আমার প্রবৃত্তিটি হ'ল আপনার সঠিক, এবং আমরা সমস্ত ডেটার জন্য সম্পূর্ণ কার্নেল ম্যাট্রিক্স গণনা করি এবং তারপরে সিভি'র কার্নেল তৈরির জন্য প্রয়োজনীয় সারি এবং কলামগুলি বাদ দিই। আপনি কি এই প্রভাবের কোনও রেফারেন্স সম্পর্কে সচেতন হতে হবে?
সাইকোরাক্স মনিকাকে

তাত্ক্ষণিকভাবে নয়, তবে আমার কিছু সহকর্মী তুলনামূলক সমস্যা (কর্নাল বর্ণালী ক্লাস্টারিং) যা আমি জিজ্ঞাসা করতে পারি সে সম্পর্কে কাজ করছি। তাদের কাছে রেফারেন্স এবং / অথবা আরও ভাল ধারণা থাকতে পারে। আরও জানলে আপডেট হবে।
মার্ক ক্লেসেন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.