সর্বাধিক সাধারণ আধুনিক চিত্র চিত্র বিভাজন কৌশল


11

আমি ইমেজ সেগমেন্টেশন কৌশলগুলি সম্পর্কে কিছুটা পড়ছিলাম এবং আমি আধুনিক দিন, অত্যাধুনিক বিভাজন আলগোরিদিম সম্পর্কে ভাবছিলাম।

'আবশ্যক-পঠনযোগ্য', যা বর্তমানে সম্প্রদায়ের মধ্যে সর্বাধিক ব্যবহৃত হয় সেগুলির বর্তমান বিভাজন কৌশলগুলি কী? আপনি কোন কৌশলগুলির সাথে যোগাযোগ করেছিলেন এবং সর্বাধিক কার্যকর এবং দরকারী (এবং কোন প্রয়োগের জন্য) পেয়েছেন?


এতদূর তাকিয়েছ কোথায়?
ফোনন

1
আমি নরমালাইজড কাটস, গ্রাফ কাটস, লেভেল সেট পদ্ধতি এবং ফাস্ট মার্চিং পদ্ধতি ছাড়াও ন্যূনতম কাটা, গ্রাফ কাটস, ন্যূনতম কাটগুলি সম্পর্কে কিছু পাঠ করছি।
গেমিংএক্স

3
সুন্দর এবং সংক্ষিপ্ত, নভেম্বর ২০১২ থেকে: চিত্র বিভাগকরণ: একটি পর্যালোচনা
এমরে

( থ্রোসোল্ডিংয়ের উপর এই প্রশ্নের দ্বারা অনুপ্রাণিত সম্পাদনা করুন, সম্ভবত এই প্রশ্নটি বিভাজন পদ্ধতিতে একইরকম রেফারেন্স হয়ে উঠতে পারে)
পেনেলোপ

উত্তর:


7

আমি অনেকগুলি বিভাজন কৌশল সম্পর্কে জানি না, তবে আমি এমন কাঠামোগুলি নিয়ে কাজ করছি যা বিভাগগুলি বিভক্ত করার একটি "পছন্দ" দেয় যা সন্তোষজনক বিভাগ তৈরি করার জন্য আরও পরীক্ষা করা যেতে পারে।

আশা করি অন্য কেউ কেউ অতীতের কিছু অত্যাধুনিক সেগমেন্টেশন পদ্ধতি সম্পর্কে লিখতে পারেন যার সম্পর্কে আমি খুব বেশি জানি না।

একটি পৃথক চিত্রের জন্য বিভাগ বা বিভাগগুলির পছন্দগুলি বা স্তরের পছন্দগুলি কেন ভাল as সে সম্পর্কে একটি ছোট্ট ভূমিকা: বিভাগকরণ একটি অসুস্থ সংজ্ঞাযুক্ত সমস্যা। মূল সত্যটি বিদ্যমান নেই: কাঙ্ক্ষিত ফলাফল সর্বদা ব্যবহারকারীর প্রয়োজনীয়তা এবং নির্দিষ্টকরণের উপর নির্ভর করে। একটি দুর্দান্ত উক্তি:

এমনকি একটি স্থির চিত্রের জন্যও একাধিক "সেরা" বিভাগ থাকতে পারে কারণ বিভাগের মান নির্ধারণের মানদণ্ডগুলি অ্যাপ্লিকেশন নির্ভর। এটি আমাদের "গবেষণামূলক বিভাজন কৌশল" সরবরাহকারী "ধাঁধা পিস" সরবরাহের কৌশলগুলিতে আমাদের গবেষণাকে ফোকাস করতে অনুপ্রাণিত করেছিল যা নির্দিষ্ট ব্যবহারকারীর প্রয়োজনীয়তা সন্তুষ্ট করে একটি বিভাগ তৈরি করতে (...) তৈরি করতে পারে

( পি। সোয়েল: হায়ারারিকালিক্যাল ইমেজ পার্টিশনিং এবং সরলীকরণের জন্য সীমাবদ্ধ সংযোগ (২০০৮) )

এখানে শ্রেণিবদ্ধ কাঠামো , শ্রেণিবিন্যাসের চিত্রের পচন রয়েছে যা বিভিন্ন জটিলতার সাথে চিত্রের পার্টিশনের প্রস্তাব দেয়। এই কাঠামোগুলি সর্বাধিক সহজভাবে গাছ কাঠামো হিসাবে প্রতিনিধিত্ব করা হয়, যেখানে প্রতিটি নোড চিত্রের একটি অঞ্চল প্রতিনিধিত্ব করে। কাঠামোগুলি সম্পর্কে ধারণা:

  • কাঠামোর পাতাগুলি একটি সূক্ষ্ম বিভাজনের অঞ্চল বা কোনও চিত্রের ওভার-সেগমেন্টেশন (উদাহরণস্বরূপ পিক্সেল, সমতল অঞ্চল - একই তীব্রতার সাথে সংযুক্ত অঞ্চল, ওয়াটারশেড )
  • গাছ লিঙ্কগুলি প্রতিনিধিত্ব মার্জ বা ইউনিয়ন (প্রতিবেশী) অঞ্চলের এবং একটি আরো জটিল অঞ্চল বিরচন, এবং একটি ভাবে নির্মাণ করা হয় বস্তু সংশ্লিষ্ট পণ্যের অঞ্চলে সম্ভবত (আশা :))
  • অঞ্চলগুলির জটিলতা প্রতিটি শাখা বরাবর নোড থেকে গাছের গোড়ার দিকে বৃদ্ধি পায়
  • গাছের প্রতিটি স্তর (এছাড়াও, প্রতিটি কাটা) একটি চিত্রের বিভাজন / বিভাজন (এটি মূলের কাছাকাছি স্থায়ী)
  • গাছের গোড়াটি পুরো চিত্রের ডোমেন জুড়ে

চেয়ে সেগমেন্টেশন গঠিত করার অঞ্চল ও তাদের প্রস্তাবিত ইউনিয়ন, পরীক্ষা এর নির্ধারণ গাছে অঞ্চলে বা গাছের কাটা প্রয়োজনীয় সংশ্লিষ্ট সুদের বস্তু, বা অন্যান্য প্রাক সংজ্ঞায়িত ব্যবহারকারী বিবরণীর সম্পর্কে স্পষ্টতা, অথবা কিছু পরিচিত বৈশিষ্ট্য।

এই জাতীয় বৈশিষ্ট্য সহ গাছগুলি (এটি শ্রেণিবদ্ধ চিত্রের পচন)

ইতিমধ্যে সরবরাহ করা কাগজপত্রগুলির লিঙ্কগুলি ছাড়াও এই ধরণের বিভাজন কৌশলগুলিতে আরও কিছু সুনির্দিষ্ট এবং কম নির্দিষ্ট বর্তমান কাগজপত্রগুলি:

(আরও ব্যবহারিক):


1
"আধুনিক" (এবং ট্রেন্ডি) পৃথকীকরণ অ্যালগোরিদমিক পরিবারগুলির জন্য, আমি সুপারপিক্সেল যুক্ত করব। এই পদটির জন্য গুগলিং সত্যিই চিত্তাকর্ষক।
সানসাইসো

@ সানসাইসো ওয়েল, এটি একটি উত্তর হিসাবে যুক্ত করুন :) আশা করি আমরা এই প্রশ্নে বেশ কয়েকটি আকর্ষণীয় স্টেট-অফ-দ্য আর্টিকেশন পদ্ধতি সংগ্রহ করতে পারি
পেনেলোপ

6

পেনেলোপের উত্তরের সংযোজন হিসাবে , অ্যালগরিদমের দুটি জনপ্রিয় পরিবার (এবং ট্রেন্ডি)।

Superpixels

সুপারপিক্সেল নামে অ্যালগরিদমের একটি খুব জনপ্রিয় পরিবার এই মুহুর্তে খুব ট্রেন্ডি রয়েছে (সিভি সম্মেলনে কিছু সুপারপিক্সেল সেশনও রয়েছে)। সুপারপিক্সেলগুলি অনেকগুলি ওভার-সেগমেন্টেশনের মতো (যেমনটি জলছবি আপনাকে দেয়) এর মতো কিছু পোস্ট-প্রসেসিং প্রয়োজন।

সুপারপিক্সেলগুলি ছোট সমজাতীয় চিত্রের অঞ্চল হিসাবে দেখা যায় । পিক্সেলের মধ্যকার দূরত্বটি দ্বিপক্ষীয় ফিল্টারিংয়ের মতো মূল্যায়ন করা হয়, অর্থাত্ এটি তাদের স্থানিক দূরত্ব এবং তাদের চাক্ষুষ মিলের মধ্যে একটি মিশ্রণ যা তারা যখন ঘনিষ্ঠ এবং অনুরূপ হয় তখন 0 এ যায় এবং অন্যথায় কিছু বড় মানের হয়।
তারপরে, সুপারপিক্সেল পদ্ধতিগুলি এই পরিমাপের প্রতি শ্রদ্ধা রেখে ছোট আকারের অঞ্চল গঠনের জন্য বিভিন্ন মানদণ্ড চেষ্টা করে। তাদের মধ্যে অনেকগুলি রয়েছে (গ্রাফ-ভিত্তিক, মোড সন্ধান / ক্লাস্টারিং ভিত্তিক ...), তাই আমি অনুমান করি যে আপনাকে এই প্রযুক্তি প্রতিবেদনে উল্লেখ করা ভাল

(সম্পাদনা :) যদি কেউ প্রকাশিত পিয়ার-পর্যালোচিত কাজ খুঁজছেন, এই নিবন্ধটি একই লেখক এবং প্রযুক্তি প্রতিবেদনের মতো একই বিষয়টিকে কভার করেছেন: আর। অচন্ত, এ। শজি, কে। স্মিথ, এ। লুচি, পি। ফুয়া, এস। সাস্টারঙ্ক: স্টেট অফ দ্য আর্ট সুপারপিক্সেল পদ্ধতির তুলনায় এসএলিক সুপারপিক্সেলগুলি

আমি উত্তরটির প্রথম সংস্করণটি যেমন লিখেছিলাম তেমন নোট করুন যে দৃশ্যত ফলাফলগুলি জলছবি ওভার-সেগমেন্টেশন আপনাকে যা সরবরাহ করে তার সাথে খুব মিল। এটি প্রযুক্তি সম্পর্কিত প্রতিবেদনের লেখকরা নিশ্চিত করেছেন যারা সম্পর্কিত কাজের অংশে জলাশয় অন্তর্ভুক্ত করে। সুতরাং, আপনাকে একই পোস্ট-প্রসেসিংও করতে হবে: পিক্সেলের পরিবর্তে সুপারপিক্সেলগুলি হ'ল সুবিধাজনক বৈশিষ্ট্য হতে পারে, তবে আপনাকে অবজেক্টগুলি সন্ধান / সনাক্ত করতে গেলে উচ্চ স্তরের অঞ্চল গঠনের জন্য তাদের এখনও শ্রেণিবদ্ধ করা দরকার।

গ্রাফ ভিত্তিক বিভাজন পদ্ধতি

অ্যালগরিদমের আরেকটি জনপ্রিয় পরিবার পিক্সেল সম্পর্কের বিশ্লেষণ থেকে আসে, পিক্সেলগুলি কীভাবে তাদের উপস্থিতিতে নিকটবর্তী হয়। এটি ভাগ করা পদ্ধতির গ্রাফ-তত্ত্ব ভিত্তিক পরিবার যেমন সাধারণীকরণ কাটা (জে। শি, জে মালিক: নরমালাইজড কাটস এবং ইমেজ সেগমেন্টেশন ) উত্পাদন করে

এই পদ্ধতির জন্য অন্তর্দৃষ্টি এখানে রয়েছে: ধরুন আপনার পিক্সেলগুলি এখন একটি উচ্চ-মাত্রিক গ্রাফের পয়েন্ট (শীর্ষে) are
গ্রাফে, দুটি প্রান্তকে একটি প্রান্ত দ্বারা সংযুক্ত করা যেতে পারে , যার ওজন বিভাজকভাবে কিছুটা দূরত্বের বিপরীতে আনুপাতিক। সাধারণত, ওজন ফাংশনটি তাদের স্থানিক দূরত্ব এবং দ্বিপক্ষীয় ফিল্টারিংয়ের মধ্যে তাদের ভিজ্যুয়াল মিলের 8as এর মধ্যে মিশ্রণের কিছুটা পারস্পরিক কাজ করবে)।
তারপরে, এই গ্রাফটি প্রদত্ত, বিভাগকরণ অ্যালগরিদমগুলি শীর্ষ সূচীর সেরা ক্লাস্টারগুলি খুঁজতে পারে, যেমন, একটি ছোট্ট আন্তঃ-গ্রুপের দূরত্ব এবং একটি বৃহত অতিরিক্ত-গ্রুপের দূরত্ব রয়েছে এমন উল্লম্বের দলগুলি ।

নরমালাইজড কাট পদ্ধতির মধ্যে, গুচ্ছগুলির বিভিন্ন জনসংখ্যার আকার দ্বারা প্রবর্তিত কোনও পক্ষপাত এড়াতে কিছু অতিরিক্ত যত্ন নেওয়া হয়। তদতিরিক্ত, ওয়েট ম্যাট্রিক্সের এসভিডি গণনা করে গ্রাফ অন্বেষণ এড়ানো যেতে পারে, যা গ্রাফ তত্ত্বে সংযোগ ম্যাট্রিক্স হিসাবে পরিচিত ।


আরে, আমাকে কিছুক্ষণ সময় নিয়েছে, উত্তরের জন্য ধন্যবাদ, তবে ... আপনি উল্লিখিত 2 টি কৌশল সম্পর্কে আপনি কি সামান্যতম বিস্তৃত করতে পারেন? আমি এগুলি এখানে বিশদভাবে ব্যাখ্যা করার অর্থ নয়, তবে আমি সেগুলির প্রতিটি সম্পর্কে একটি বা দুটি বর্ণনামূলক বাক্যকে সত্যই প্রশংসা করব।
পেনেলোপ

আমি উত্তর প্রসারিত। এটি কিছুটা বিভ্রান্তিকর হলেও, উত্তরের মধ্যে যে টেক রিপোর্টটি আমি সংযুক্ত করেছি তা উল্লেখ করা ভাল (আমাকে স্বীকার করতে হবে যে আমি সুপারপিক্সেল লোক নই এবং আমি এখনও তাদের আগ্রহ সম্পর্কে কিছুটা সংশয়ী, যদিও তারা সত্যিই ট্রেন্ডি)।
সানসাইসো

গ্রাফ ভিত্তিক বিভাজন পদ্ধতিগুলির জন্য, আমি মনে করি এই কাজটি শিল্পের ফলাফলগুলির অন্যতম সেরা অবস্থার প্রস্তাব দেয়: গবেষণা. microsoft.com/pubs/167600/jmiv_bnm_final.pdf এটি একটি স্বজ্ঞাত কাগজ এবং কোড উপলব্ধ।
টোলগা বার্ডাল

3

আমি অনুমান করি বিভাগ বিভাজনের জন্য আর্ট অ্যালগরিদমগুলির রাজ্যের বিশ্বব্যাপী ওভারভিউয়ের জন্য সর্বশেষ জরিপগুলির সন্ধান করা দরকার। চ্যালেঞ্জগুলির সাথে একটি ভাল বিশ্বব্যাপী পর্যালোচনা সেজেলিস্কির বইয়ে উপস্থাপন করা হয়েছে ।

এখানে চিত্র বর্ণনা লিখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.