"বিভাগকরণ" এবং "দৃশ্যের লেবেলিং" এর তুলনায় "শব্দার্থক বিভাগ" কী?


97

শব্দার্থক বিভাগটি কি কেবল একটি প্লোনাস্ম বা "শব্দার্থক বিভাগ" এবং "বিভাগকরণ" এর মধ্যে পার্থক্য রয়েছে? "দৃশ্য লেবেলিং" বা "দৃশ্যের পার্সিং" এর মধ্যে কোনও পার্থক্য রয়েছে কি?

পিক্সেল-স্তর এবং পিক্সেলওয়্যার বিভাজনের মধ্যে পার্থক্য কী?

(পার্শ্ব-প্রশ্ন: আপনার কাছে যখন এই ধরণের পিক্সেল-ভিত্তিক টিকা আছে তখন আপনি কী নিখরচায় অবজেক্ট সনাক্তকরণ পান বা এখনও কিছু করার দরকার আছে?)

আপনার সংজ্ঞা জন্য একটি উত্স দিন।

উত্স যা "শব্দার্থক বিভাগ" ব্যবহার করে

  • জোনাথন লং, ইভান শেলহামার, ট্রেভর ড্যারেল: সিমান্টিক বিভাজনের জন্য সম্পূর্ণ কনভোলিউশনাল নেটওয়ার্ক । সিভিপিআর, 2015 এবং পামি, 2016
  • হংক, সেউনহুন, হিয়ানোউ নোহ এবং বোহ্যুং হান: "অর্ধ-তত্ত্বাবধানে সিমেটিক সেগমেন্টেশনের জন্য ডিপ নিউরাল নেটওয়ার্ক ডিক্লোলড হয়েছে" " আরএক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 1506.04924 , 2015।
  • ভি। লেম্পিটস্কি, এ। বেদালদী এবং এ। জিসারম্যান: শব্দার্থক বিভাগের জন্য একটি পাইলন মডেল। নিউরাল ইনফরমেশন প্রসেসিং সিস্টেমস, ২০১১ এর অগ্রযাত্রায়।

উত্স যা "দৃশ্যের লেবেলিং" ব্যবহার করে

উত্স যা "পিক্সেল-স্তর" ব্যবহার করে

  • পিনহেইরো, পেদ্রো ও। এবং রোনান কল্লোবার্ট: "কনভ্যুশনাল নেটওয়ার্কস সহ চিত্র-স্তর থেকে পিক্সেল-স্তরের লেবেলিং পর্যন্ত।" কম্পিউটার ভিশন এবং প্যাটার্ন স্বীকৃতি, 2015 সম্পর্কিত আইইইই সম্মেলনের কার্যক্রম ceed (দেখুন http://arxiv.org/abs/1411.6228 )

উত্স যা "পিক্সেলওয়ালা" ব্যবহার করে

  • লি, হংসশেং, রুই ঝাও এবং জিয়াওগাং ওয়াং: "পিক্সেলওয়্যার শ্রেণিবদ্ধকরণের জন্য কনভোলশনাল নিউরাল নেটওয়ার্কগুলির অত্যন্ত দক্ষ ফরোয়ার্ড এবং পশ্চাদপদ প্রচার" " আরএক্সিভ প্রিপ্রিন্ট আরএক্সিভ: 1412.4526 , 2014।

গুগল এনগ্রামস

"দৃশ্যের লেবেলিং" এর চেয়ে "সিমেন্টিক সেগমেন্টেশন" সম্প্রতি ব্যবহৃত হয়েছে বলে মনে হচ্ছে

এখানে চিত্র বর্ণনা লিখুন


অন্যান্য শর্তাবলী যা দেখতে খুব একই রকম বলে মনে হচ্ছে: (প্রতি-) পিক্সেল শ্রেণিবদ্ধকরণ / লেবেলিং
মার্টিন থোমা

12
এটা সত্যিই আকর্ষণীয় যে @ মার্টিনথোমার একটি অর্ক্সিব প্রিপ্রিন্ট সমীক্ষণিক বিভাগকে জরিপ করেছে, প্রশ্ন জিজ্ঞাসার প্রায় 6 মাস পরে প্রকাশিত হয়েছে [লিংক] ( আরেক্সিভি.আর . / পিডিএফ / ১60০২.০6541৪.পিডিএফ )। সাবাশ!
মোহাম্মদ হাসান

উত্তর:


92

"সেগমেন্টেশন" ইমেজকে কয়েকটি "সুসংগত" অংশে বিভক্ত করা হয়, তবে এই অংশগুলি কী বোঝায় তা বোঝার কোনও প্রচেষ্টা ছাড়াই attempt সর্বাধিক বিখ্যাত রচনাগুলির মধ্যে একটি (তবে অবশ্যই প্রথমটি নয়) হ'ল শি এবং মালিক "নর্মালাইজড কাটস এবং ইমেজ বিভাগকরণ" পামি 2000 । এই কাজগুলি নিম্ন স্তরের সংকেত যেমন রঙ, জমিন এবং সীমানার মসৃণতার ক্ষেত্রে "সংহতি" সংজ্ঞায়নের চেষ্টা করে। আপনি এই কাজগুলি জেস্টাল্ট তত্ত্বের সাথে সন্ধান করতে পারেন

অন্যদিকে "শব্দার্থ বিভাজন" চিত্রটিকে শব্দার্থগত অর্থপূর্ণ অংশগুলিতে বিভক্ত করার চেষ্টা করে এবং প্রতিটি অংশকে পূর্ব নির্ধারিত শ্রেণীর মধ্যে একটিতে শ্রেণিবদ্ধ করার চেষ্টা করে। আপনি প্রতিটি পিক্সেল (সম্পূর্ণ চিত্র / বিভাগের চেয়ে) শ্রেণিবদ্ধ করে একই লক্ষ্য অর্জন করতে পারেন। সেক্ষেত্রে আপনি পিক্সেল-ভিত্তিক শ্রেণিবিন্যাস করছেন যা একই ফলাফলের দিকে নিয়ে যায় তবে কিছুটা আলাদা পথে ...

সুতরাং, আমি মনে করি আপনি বলতে পারেন যে "সিমেন্টিক সেগমেন্টেশন", "দৃশ্যের লেবেলিং" এবং "পিক্সেলওয়াই শ্রেণিবিন্যাস" মূলত একই লক্ষ্য অর্জন করার চেষ্টা করছে: চিত্রটির প্রতিটি পিক্সেলের ভূমিকা শব্দার্থগতভাবে বোঝা। এই লক্ষ্যে পৌঁছানোর জন্য আপনি অনেকগুলি পথ অবলম্বন করতে পারেন এবং এই পাথগুলি পরিভাষাটির সামান্য ঘনত্বের দিকে নিয়ে যায়।


4
কোন পাথ সিমেটিক বিভাজনে নিয়ে যায় এবং কোনটি দৃশ্যের লেবেলিং বা পিক্সেলওয়্যার শ্রেণিবিন্যাসের দিকে পরিচালিত করে?
মার্টিন থোমা

4
@ মোজেস সাধারণত বলছেন, আপনি যদি "বিভাগকরণ" গবেষণা ক্ষেত্রে উদ্ভূত সরঞ্জাম এবং অ্যালগরিদম ব্যবহার করেন (যেমন, সিআরএফ, মসৃণতা প্রেরণাকারী শর্তাদি ইত্যাদি) তবে আপনি "শব্দার্থক বিভাজন" করছেন। অন্যদিকে, আপনি যদি স্থানীয়ভাবে চিত্রের শ্রেণিবদ্ধকরণে ব্যবহৃত সরঞ্জামগুলি এবং অ্যালগরিদমগুলি এটিকে স্থানীয়ভাবে প্রয়োগ করে থাকেন তবে আপনার কাজটিকে "পিক্সেলওয়াই লেবেলিং" হিসাবে বর্ণনা করার সম্ভাবনা বেশি। তবে, আমি মনে করি না যে বাস্তবে কোনও ব্যবহারিক পার্থক্য রয়েছে, কেবলমাত্র শব্দার্থক: এগুলি একই শেষ লক্ষ্যটির প্রতিশব্দ sy
শাই

63

আমি অবজেক্ট ডিটেকশন, অবজেক্ট রিকগনিশন, অবজেক্ট বিভাগীকরণ, চিত্র বিভাগ এবং ইমেটিক ইমেজ সেগমেন্টেশন সম্পর্কে প্রচুর কাগজপত্র পড়েছি এবং এখানে আমার সিদ্ধান্তগুলি যা সত্য হতে পারে না:

অবজেক্টের স্বীকৃতি: প্রদত্ত চিত্রটিতে আপনাকে সমস্ত অবজেক্ট সনাক্ত করতে হবে (বস্তুর একটি সীমাবদ্ধ শ্রেণি আপনার ডেটাশেটের উপর নির্ভর করে), সেগুলি একটি বাউন্ডিং বক্সের সাথে স্থানীয়করণ করুন এবং সেই লেবেলযুক্ত সেই সীমানা বাক্সটিকে লেবেল করুন। নীচের চিত্রটিতে আপনি শিল্পের অবজেক্টের স্বীকৃতি দানের একটি সাধারণ আউটপুট দেখতে পাবেন।

বস্তু স্বীকৃতি

অবজেক্ট ডিটেকশন: এটি অবজেক্ট রিকগনিশন এর মতো তবে এই টাস্কে আপনার কাছে কেবল দুটি ক্লাস অবজেক্ট শ্রেণিবদ্ধকরণ যার অর্থ অবজেক্ট বাউন্ডিং বাক্স এবং অ-অবজেক্ট বাউন্ডিং বাক্স। উদাহরণস্বরূপ গাড়ী শনাক্তকরণ: আপনাকে প্রদত্ত চিত্রে সমস্ত গাড়ি তাদের সীমানা বাক্সের সাহায্যে সনাক্ত করতে হবে।

অবজেক্ট ডিটেকশন

অবজেক্ট বিভাজন: বস্তুর স্বীকৃতির মতো আপনি কোনও চিত্রের সবগুলি জিনিসকে চিনতে পারবেন তবে আপনার আউটপুটটিতে চিত্রটির পিক্সেল শ্রেণিবদ্ধকরণ করা উচিত।

অবজেক্ট বিভাজন

চিত্র বিভাজন: চিত্র বিভাগে আপনি চিত্রের অঞ্চলগুলিকে ভাগ করবেন। আপনার আউটপুট এমন চিত্রের বিভাগ এবং অঞ্চলটিকে লেবেল করবে না যা একে অপরের সাথে সামঞ্জস্যপূর্ণ একই বিভাগে থাকা উচিত। কোনও চিত্র থেকে সুপার পিক্সেল উত্তোলন করা এই কার্য বা অগ্রভাগ-পটভূমি বিভাগের উদাহরণ se

চিত্র বিভাজন

শব্দার্থক বিভাগে: শব্দার্থক বিভাগে আপনাকে প্রতিটি পিক্সেলকে একটি শ্রেণীর অবজেক্ট (গাড়ি, ব্যক্তি, কুকুর, ...) এবং অ-অবজেক্ট (জল, আকাশ, রাস্তা, ...) দিয়ে লেবেল দিতে হয়। আমি শব্দার্থে বিভাগে অন্য শব্দগুলি আপনি চিত্রের প্রতিটি অঞ্চলকে লেবেল করবেন।

শব্দার্থ বিভাজন

আমি মনে করি পিক্সেল-স্তর এবং পিক্সেলওয়াই লেবেলিং মূলত ইমেজ বিভাজন বা শব্দার্থক বিভাগে থাকতে পারে। আমি এই লিঙ্কটিতে আপনার প্রশ্নের উত্তরও একইরকম দিয়েছি ।


8
আমি উদাহরণ বিভাজন যুক্ত করব, অর্থাত্ একই বস্তুর উদাহরণগুলির মধ্যে বিচ্ছিন্নতা
অ্যালেক্স

4
আমি যুক্তি দেব "চিত্র সনাক্তকরণ" "চিত্র সনাক্তকরণ" এর পরিবর্তে "চিত্রের শ্রেণিবিন্যাস" এর প্রতিশব্দ। এটি একটি চিত্রের মধ্যে এক বা একাধিক অবজেক্টকে সনাক্ত করা এবং এটি উপস্থিত কিনা তা বলতে সক্ষম হব। আমরা এটি কোথায় আছে তা জানতে চাইলে আমাদের বাউন্ডিং বাক্স ব্যবহার করে অবজেক্টগুলি সনাক্ত করতে হবে। এছাড়াও, কোনও কারণ আবিষ্কার করার জন্য কেবলমাত্র একটি একক শ্রেণি সনাক্ত করতে সক্ষম হওয়ার কোনও কারণ আমি দেখতে পাচ্ছি না।
পিটজ

আমি আংশিকভাবে আপনার সাথে একমত। চিত্র স্বীকৃতি কী তা আমি উল্লেখ করি নি, তাই চিত্রের স্বীকৃতি এবং শ্রেণিবিন্যাস একই অর্থ হতে পারে। তবে বস্তু সনাক্তকরণটি বেশিরভাগ ক্ষেত্রে দুটি শ্রেণির সমস্যা এবং মাল্টি ক্লাসের জন্য অবজেক্ট স্বীকৃতির জন্য ব্যবহৃত হয়। যাইহোক, আমার উত্তরের জন্য আমার কোনও প্রহরী নেই, প্রায় তিন বছর আগে কিছু কাগজ পড়ে আমার ধারণা ছিল! চিয়ার্স!
e_sorsh

আপনি এমন কিছু জায়গাগুলি বিশদভাবে বর্ণনা করতে পারেন যেখানে আপনি নিজের পড়াশোনাগুলি খুঁজে পান?
কুর্তান্দসো

36

পূর্ববর্তী উত্তরগুলি সত্যিই দুর্দান্ত, আমি আরও কয়েকটি সংযোজন উল্লেখ করতে চাই:

অবজেক্ট বিভাজন

এটি গবেষণা সম্প্রদায়ের পক্ষে নেমে যাওয়ার অন্যতম কারণ হ'ল এটি সমস্যাগতভাবে অস্পষ্ট। অবজেক্ট বিভাজন বলতে কেবল কোনও চিত্রের মধ্যে একক বা ছোট সংখ্যক অবজেক্ট সন্ধান করা এবং তাদের চারপাশে একটি সীমানা আঁকতে ব্যবহৃত হয় এবং বেশিরভাগ উদ্দেশ্যে আপনি এখনও ধরে নিতে পারেন এর অর্থ এটি। যাইহোক, এটি ব্লবগুলির বিভাজন বোঝাতেও ব্যবহৃত হতে পারে যা বস্তু হতে পারে, পটভূমি থেকে বস্তুর বিভাজন (সাধারণভাবে এখন ব্যাকগ্রাউন্ড বিয়োগ বা পটভূমি বিভাজন বা অগ্রভাগ সনাক্তকরণ বলা হয়), এবং এমনকি কিছু ক্ষেত্রে বাউন্ডিং বাক্স ব্যবহার করে অবজেক্ট স্বীকৃতিতে আন্তঃব্যক্তভাবে ব্যবহৃত হয় (এটি গভীরভাবে নিউরাল নেটওয়ার্কের অবজেক্টের সাথে অবজেক্টের স্বীকৃতিতে আগমন বন্ধ হয়েছিল, তবে পূর্বে অবজেক্টের স্বীকৃতিটিও পারে এর অর্থ এটিতে কেবল কোনও সামগ্রীর সাথে পুরো চিত্রটিকে লেবেল করা)।

"বিভাগকরণ" "শব্দার্থক" কী করে?

সিম্পি, প্রতিটি বিভাগ বা প্রতিটি পিক্সেল গভীর পদ্ধতির ক্ষেত্রে কোনও বিভাগের ভিত্তিতে একটি শ্রেণির লেবেল দেওয়া হয়। সাধারণভাবে বিভাগকে কিছু নিয়মে চিত্রের বিভাজন of মিউনশিফ্ট বিভাজন উদাহরণস্বরূপ, খুব উচ্চ স্তরের থেকে চিত্রের শক্তির পরিবর্তন অনুযায়ী ডেটা ভাগ করে নেওয়া। গ্রাফ কাটাভিত্তিক বিভাজন একইভাবে শেখা হয় না তবে সরাসরি প্রতিটি চিত্রের বৈশিষ্ট্যগুলি থেকে আলাদা হয় ived আরও সাম্প্রতিক (নিউরাল নেটওয়ার্ক ভিত্তিক) পদ্ধতিগুলি নির্দিষ্ট শ্রেণীর সাথে সম্পর্কিত স্থানীয় বৈশিষ্ট্যগুলি সনাক্ত করতে শিখতে লেবেলযুক্ত পিক্সেলগুলি ব্যবহার করে এবং তারপরে প্রতিটি পিক্সেলটির উপর ভিত্তি করে শ্রেণিভুক্ত করুন যে ক্লাসে p পিক্সেলের জন্য সর্বোচ্চ আস্থা রয়েছে। এইভাবে, "পিক্সেল-লেবেলিং" কার্যের জন্য আরও সৎ নাম এবং "সেগমেন্টেশন" উপাদানটি উদ্ভূত হয়।

ইনস্ট্যান্ট বিভাজন

যুক্তিযুক্তভাবে অবজেক্ট সেগমেন্টেশন এর সবচেয়ে কঠিন, প্রাসঙ্গিক এবং মূল অর্থ, "উদাহরণস্বরূপ বিভাগ" এর অর্থ কোনও দৃশ্যের মধ্যে পৃথক বস্তুর বিভাজন, যদিও সে একই ধরণের কিনা। যাইহোক, এটি এতটা জটিল হওয়ার কারণগুলির মধ্যে একটি কারণ দৃষ্টিভঙ্গির দিক থেকে (এবং কিছু উপায়ে দার্শনিক একটি) "অবজেক্ট" উদাহরণটি কী করে তা সম্পূর্ণ পরিষ্কার নয়। দেহের অঙ্গ প্রত্যঙ্গ কি বস্তু? এই জাতীয় "অংশ-অবজেক্টস" এগুলিকে কি কোনও বিভাগ বিভাগের অ্যালগরিদম দ্বারা পৃথক করা উচিত? তাদের সম্পূর্ণ থেকে পৃথক দেখা গেলেই কেবল সেগুলি করা উচিত? যৌগিক বস্তুর সম্পর্কে কী দুটি বিষয় পরিষ্কারভাবে সংযুক্ত করা উচিত তবে পৃথকযোগ্য এক বস্তু বা দুটি হওয়া উচিত (সঠিকভাবে তৈরি না হওয়াতে একটি কাঠিটির উপরে একটি কুড়াল, হাতুড়ি, বা কেবল একটি লাঠি এবং একটি শিলা থাকে?) এছাড়াও, এটি ' উদাহরণগুলি কীভাবে আলাদা করা যায় তা পরিষ্কার করুন অন্যান্য দেওয়ালগুলির সাথে এটি যুক্ত যা একটি পৃথক উদাহরণ রয়েছে? উদাহরণগুলিতে কোন অর্ডার গণনা করা উচিত? তারা হাজির হিসাবে? দৃষ্টিভঙ্গির নিকটবর্তীতা? এই অসুবিধা থাকা সত্ত্বেও, অবজেক্টগুলির বিভাজন এখনও একটি বড় বিষয় কারণ মানুষ হিসাবে আমরা তাদের "শ্রেণির লেবেল" নির্বিশেষে সমস্ত সময় অবজেক্টগুলির সাথে যোগাযোগ করি (আপনার চারপাশে এলোমেলো বস্তুগুলি কাগজের ওজন হিসাবে ব্যবহার করে, চেয়ার নয় এমন জিনিসগুলিতে বসে), এবং তাই কিছু ডেটাসেট এই সমস্যাটি পাওয়ার চেষ্টা করে, তবে সমস্যার দিকে তেমন মনোযোগ দেওয়া হয়নি এর মূল কারণটি এটি যথাযথভাবে সংজ্ঞায়িত হয়নি। এখানে চিত্র বর্ণনা লিখুন

দৃশ্য পার্সিং / দৃশ্য লেবেলিং

দৃশ্য পার্সিং হ'ল দৃশ্যের লেবেলিংয়ের কঠোরভাবে বিভাজন পদ্ধতি, যার নিজস্ব কিছু অস্পষ্টতা সমস্যা রয়েছে। .তিহাসিকভাবে, দৃশ্যের লেবেলিংয়ের অর্থ পুরো "দৃশ্য" (চিত্র )টিকে বিভাগগুলিতে ভাগ করা এবং সেগুলি সমস্তকে একটি শ্রেণির লেবেল দেওয়া। তবে এটির অর্থ চিত্রের ক্ষেত্রগুলিতে স্পষ্টভাবে বিভাজন না করে ক্লাস লেবেল দেওয়ার অর্থও ব্যবহৃত হয়েছিল। বিভাগকে সম্মানের সাথে, "শব্দার্থক বিভাগ" পুরো দৃশ্যের বিভাজন বোঝায় না । সিমেন্টিক সেগমেন্টেশনের জন্য, অ্যালগরিদমটি কেবলমাত্র তার জানা জিনিসগুলিকেই সেগমেন্ট করার উদ্দেশ্যে তৈরি হয়েছে এবং পিক্সেলগুলির লেবেল লাগানোর জন্য এটির ক্ষতি ফাংশন দ্বারা দন্ডিত হবে that উদাহরণস্বরূপ, এমএস-কোকো ডেটাসেটটি শব্দার্থক বিভাগের জন্য একটি ডেটাসেট যেখানে কেবল কিছু বস্তু খণ্ডিত। এমএস-কোকো নমুনা চিত্র

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.