একটি ছবিতে পিক্সেল শ্রেণিবদ্ধ করার জন্য একটি প্রাথমিক মার্কভ র্যান্ডম ফিল্ড প্রশিক্ষণ


16

আমি কোনও চিত্রের বিভাগগুলিতে মার্কভ র্যান্ডম ক্ষেত্রগুলি কীভাবে ব্যবহার করতে পারি তা শেখার চেষ্টা করছি। আমি এমআরএফ এর কিছু পরামিতি বুঝতে পারি না বা কেন আমি যে প্রত্যাশা সর্বাধিকীকরণ করি তা কখনও কখনও কোনও সমাধানে রূপান্তর করতে ব্যর্থ হয়।

বয়েসের উপপাদ্য থেকে শুরু করে, আমার কাছে p(x|y)=p(y|x)p(x)/p(y) , যেখানে y পিক্সেলের ধূসর-স্কেল মান এবং x একটি শ্রেণির লেবেল। আমি এর জন্য গাউসীয় বিতরণ ব্যবহার করা বেছে নিয়েছি p(y|x), যখন p(x) এমআরএফ ব্যবহার করে মডেল করা হয়েছে।

আমি এমআরএফ-এর জন্য একটি সম্ভাব্য ফাংশন ব্যবহার করি যা জুটিওয়ালা চক্রের সম্ভাব্যতা এবং পিক্সেলের শ্রেণিবদ্ধকরণের শ্রেণিবদ্ধকরণের জন্য একটি সম্ভাব্য মান। একক পিক্সেল সম্ভাব্য মান কিছু ধ্রুবক α যে বর্গ ট্যাগ নির্ভর x । Pairwise সম্ভাব্য ফাংশন 4-সংযুক্ত প্রতিবেশীদের জন্য মূল্যায়ন এবং ইতিবাচক আসতে হয় β যদি প্রতিবেশী এই পিক্সেল হিসাবে একই বর্গ লেবেল এবং হয়েছে β যদি লেবেল পৃথক।

প্রত্যাশা বৃদ্ধি যেখানে আমি মান খুঁজে বের করতে হবে এ মুহুর্তে α(x) এবং β যে লগ-সম্ভাবনা আমি একটি সংখ্যাসূচক অপ্টিমাইজেশান পদ্ধতি ব্যবহৃত প্রত্যাশিত মান পূর্ণবিস্তার (অনুবন্ধী গ্রেডিয়েন্ট চেষ্টা BFGS, পাওয়েলের পদ্ধতি) কিন্তু সবসময় would সন্ধান করুন যে এর মান βনেতিবাচক হয়ে উঠবে, α গুলি নাটকীয়ভাবে বৃদ্ধি পাবে এবং একটি পুনরাবৃত্তি বা দু'টি পরে পুরো চিত্রটি কেবল একটি লেবেলে বরাদ্দ করা হবে (পটভূমি: এমআরএফ প্যারামিটারগুলি দেওয়া শ্রেনীর লেবেলগুলি আইসিএম ব্যবহার করে করা হয়েছিল)। আমি যদি আলফাসগুলি সরিয়ে ফেলেছি, যেমন কেবল জোড়াযুক্ত চক্রের সম্ভাবনা ব্যবহার করি তবে প্রত্যাশা সর্বাধিকীকরণ ঠিক কাজ করবে work

দয়া করে ব্যাখ্যা করুন প্রতিটি শ্রেণীর জন্য বর্ণমালার উদ্দেশ্য কী? আমি ভেবেছিলাম যে তারা চিত্রটিতে উপস্থিত class শ্রেণীর পরিমাণের সাথে সম্পর্কিত হবে, তবে তা প্রদর্শিত হয়নি। আমি যখন এমআরএফকে কেবল জোড়াযুক্ত সম্ভাবনার সাথে কাজ করতে পেলাম, তখন আমি এটিকে একটি সোজা এগিয়ে গাউসিয়ান মিশ্রণ মডেলের সাথে তুলনা করে দেখলাম যে তারা প্রায় অভিন্ন ফলাফল নিয়েছে। আমি আশা করছিলাম যুগলক্ষেত্রের সম্ভাবনাগুলি ক্লাসটি কিছুটা সহজ করে দেবে, তবে তা ঘটেনি। আমি কোথায় ভুল হয়ে গেছে দয়া করে পরামর্শ দিন।


শুধু কৌতূহলী, আপনি কেন অপরিবর্তিত গ্রাফ মডেলটি বেছে নিয়েছিলেন?

আমার অ্যাপ্লিকেশনটিতে, পিক্সেল গণনা এবং প্রতিবেশী পিক্সেলের ধূসর-স্কেল মান একই শ্রেণীর লেবেল হওয়ার সম্ভাবনা বেশি, তবে প্রতিটি জোড়াযুক্ত চক্রের জন্য আলাদা বিটা ব্যবহার করার কোনও কারণ নেই। আমি আশা করি আপনার প্রশ্নটি আমি সঠিকভাবে বুঝতে পেরেছি।
চিপিজ

1
অবিচ্ছিন্ন বর্ণমালা লেবেলে পূর্ব বিতরণকে মডেল করার উদ্দেশ্যে কাজ করে বলে মনে হচ্ছে। আপনার অনুমান অনুসারে, সঠিক বর্ণমালা প্রশিক্ষণ সেটে প্রায়শই সেই সমস্ত লেবেলগুলির মুখোমুখি হতে পারে। আপনার মডেল যদি এগুলি ব্যতীত ভাল কাজ করে তবে আপনি কেবল তাদের মডেল থেকে বাদ দেবেন না কেন? আপনার বর্ণনাকে হু হু করে যথাযথভাবে উত্তর দেওয়া যায় না কেন আলফাগুলি সব বেড়ে যায় এবং সবকিছু নষ্ট করে দেয় তবে আপনার সম্ভবত নিয়মিতকরণ প্রয়োজন। মডেলটিতে আলফার আগে গাউসিয়ান যুক্ত করার চেষ্টা করুন, যেমন লগ-পোস্টারেয়ারে যোগ করুন , এটি সম্ভবত অতিরিক্ত চাপ প্রতিরোধ করবে prevent λα2
রোমান শাপোভালভ

আপনার প্রশ্ন থেকে অস্পষ্ট: 1) আপনার সম্ভাবনা p (y | x) পিক্সেলগুলির চেয়ে পচে যায়, তাই আপনি প্রত্যেকের জন্য 1 ডি গাউসিয়ান ব্যবহার করেন? 2) আপনি ইএম-তে যথাযথ উদ্দেশ্যটি কী অনুকূল করেছেন (আপনি লগ-সম্ভাবনার কথা উল্লেখ করেছেন, তবে আপনি মডেলিংয়ের জন্য এমআরএফ ব্যবহার করেন)? 3) আপনি লগারিদমিক ডোমেইনে সম্ভাব্যতা সংজ্ঞায়িত করেন? বিটা বাড়ানোর অর্থ কি পি (এক্স) বা শক্তি বৃদ্ধি, যা -লগ পি (এক্স), বা নেতিবাচক শক্তি? 4) আপনি কি এই জাতীয় হ্রাসকারী বর্ণমালা স্থাপন করে ইএম উদ্দেশ্যটি হ্রাস করতে চান?
রোমান শাপোভালভ

লুপী বিশ্বাসের প্রচার সম্পর্কে কী?
উলফসঠহেদুর

উত্তর:


1

রোগ নির্ণয়

এটি শুরুর সমস্যা মনে হচ্ছে।

আপনি যে এমআরএফ মডেলটি ব্যবহার করছেন তা হ'ল নন-উত্তল এবং এর মতো, একাধিক স্থানীয় মিনিমা রয়েছে। যতদূর আমি জানি, সমস্ত বিদ্যমান অপ্টিমাইজেশান কৌশল সূচনা সংবেদনশীল, যার অর্থ আপনি যেখান থেকে অপ্টিমাইজেশন প্রক্রিয়া শুরু করেন তার মাধ্যমে চূড়ান্ত সমাধানের গুণমান অত্যন্ত প্রভাবিত হয়।

প্রস্তাবিত সমাধান

আমি মডেলটি আরম্ভ করার জন্য বিভিন্ন কৌশল চেষ্টা করার পরামর্শ দিচ্ছি। উদাহরণস্বরূপ, একটি কৌশল যা আমার মনে আসে তা হ'ল:

  1. প্রথমে এর জন্য একটি মডেলকে প্রশিক্ষণ দিন এবং এখনকার পূর্বের শব্দটিকে উপেক্ষা করুন; যে ফিক্স পি ( এক্স ) সেটিংস এর দ্বারা, উদাহরণস্বরূপ, অভিন্ন হতে α = β = 0 এবং তাদের পালন সংশোধন । আপনি যদি ফ্যানসিয়ার হতে চান, তবে আপনি পি ( এক্স ) কে একটি মিটিনোমিমাল বিতরণ হিসাবে ঠিক করতে পারেন যা প্রশিক্ষণ সংস্থায় লেবেলের আপেক্ষিক ফ্রিকোয়েন্সি উপস্থাপন করে। আপনি যথাযথভাবে α মানগুলি সেট করে এটি করতে পারেন ।p(y|x) p(x)α=β=0 p(x)α

  2. unfreeze MRF মডেল ইউনারী এবং pairwise পদ; যে আপনার অপটিমাইজার এর মান পরিবর্তন করা যাক এবং βαβ

প্রস্তাবিত সূচনাটি কোনওভাবেই নয়, আপনার অপ্টিমাইজেশানটি শুরু করার সেরা উপায়, বরং কেবল একটি সম্ভাব্য বিকল্প।

অবশেষে, যেমন রোমান শ্যাপাওয়ালভ পরামর্শ দিয়েছেন, আপনি আপনার পূর্ববর্তী পরামিতিগুলিকে নিয়মিত করার কথা বিবেচনা করতে পারেন; উদাহরণস্বরূপ, তাদের উপর কোনও গাউসিয়ান আগে রেখে: যেখানে λ α এবং λ hyp হাইপার-প্যারামিটার যা গাউসীয় প্রিভিয়ারদের রূপ হিসাবে ব্যাখ্যা করা যায়।λα||α||2+λβ||β||2λαλβ

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.