পিক্সেল-ভিত্তিক এবং অবজেক্ট ভিত্তিক শ্রেণিবিন্যাসের মধ্যে পার্থক্য?


14

রিমোট সেন্সিং ডোমেনে পিক্সেল-ভিত্তিক এবং অবজেক্ট-ভিত্তিক শ্রেণিবদ্ধকরণের মধ্যে স্পষ্টতা বোঝার জন্য আমি লড়াই করছি এবং আশা করছি এই সম্প্রদায়ের যে কেউ অন্তর্দৃষ্টি দিতে পারে।

আমার এখনও অবধি প্রাপ্ত তথ্যের ভিত্তিতে আমার বর্তমান বোধগম্যতা এই লাইনের সাথে রয়েছে:

পিক্সেল ভিত্তিক শ্রেণিবিন্যাস: শ্রেণিকরণটি প্রতিটি পিক্সেল স্তরে করা হয়, কেবলমাত্র সেই পৃথক পিক্সেলের জন্য বর্ণালি তথ্য উপলব্ধ (যেমন স্থানীয় অঞ্চলে পিক্সেলের মান উপেক্ষা করা হয়) using এই অর্থে প্রতিটি পিক্সেল শ্রেণিবদ্ধকরণ অ্যালগরিদমের জন্য একটি প্রশিক্ষণের উদাহরণ উপস্থাপন করবে এবং এই প্রশিক্ষণের উদাহরণটি একটি এন-ডাইমেনশনাল ভেক্টরের আকারে হবে, যেখানে এন চিত্রের ডেটাতে বর্ণালী ব্যান্ডের সংখ্যা ছিল। তদনুসারে প্রশিক্ষিত শ্রেণিবদ্ধকরণ অ্যালগরিদম কোনও চিত্রের প্রতিটি পৃথক পিক্সেলের জন্য শ্রেণিবদ্ধ পূর্বাভাস দেয়।

অবজেক্ট-ভিত্তিক শ্রেণিবদ্ধকরণ: প্রতিটি পিক্সেলের স্থানীয় বৈশিষ্ট্য একে অপরের সাথে সম্পর্কিত হওয়ার কারণে একত্রে স্থানীয় পিক্সেলের স্থানীয় শ্রেণিতে শ্রেণিবদ্ধকরণ করা হয়। এই অর্থে শ্রেণিবদ্ধকরণ অ্যালগরিদমের জন্য একটি প্রশিক্ষণের উদাহরণে পিক্সেলগুলির একটি গ্রুপ থাকে এবং প্রশিক্ষিত শ্রেণিবদ্ধকরণ অ্যালগরিদম সেই অনুযায়ী পিক্সেলের জন্য গোষ্ঠী ভিত্তিতে একটি শ্রেণি পূর্বাভাস দেয়। অপরিশোধিত উদাহরণের জন্য, কোনও চিত্র সমান মাপের n বিভাগে বিভক্ত হতে পারে এবং প্রতিটি বিভাগকে তারপরে একটি শ্রেণি দেওয়া হবে (যার মধ্যে অবজেক্ট থাকে / এতে অবজেক্ট থাকে না)।

এই পদক্ষেপগুলির অর্থ সম্পর্কে এই চিন্তাভাবনাটি কি নির্ভুল, বা এমন কিছু আছে যা আমি মিস করেছি?

উত্তর:


9

আপনার বোঝাপড়াটি সাধারণত সঠিক, তবে, অবজেক্ট ভিত্তিক শ্রেণিবিন্যাস সম্পর্কিত আপনার বর্ণনায় বিপদ রয়েছে - 'অবজেক্ট' শব্দটি পিক্সেলের গ্রুপকে বোঝায়, এতে কোনও প্রদত্ত বস্তু রয়েছে কিনা তা নয়।
তদ্ব্যতীত, অবজেক্ট ভিত্তিক শ্রেণিবিন্যাসের কেন্দ্রীয় লক্ষ্যটি সমান আকারের অংশগুলি নয়, তবে চিত্রটিকে "কাটা" / পৃথক আকারের অভ্যন্তরীণ একজাতীয় অংশে আলাদা করতে হবে । শেষ অবধি, অবজেক্ট ভিত্তিক শ্রেণিবিন্যাসের প্রশিক্ষণের উদাহরণটি সাধারণত চিত্র বিভাজনে তৈরি হওয়া এক বা একাধিক অংশ হতে পারে।

সব মিলিয়ে উপরেরটি আপনার বর্ণনার উপর কেবলমাত্র সামান্য প্রকরণ।

এখন কেন্দ্রীয় অংশে - প্রতিটি পদ্ধতি কখন প্রয়োগ করতে হবে এবং কীভাবে সম্ভাব্যতার সাথে তাদের শক্তিগুলি একত্রিত করতে হয়।


আপনাকে ধন্যবাদ, এটি সত্যিই পরিষ্কার করতে সহায়তা করেছে। আমার সন্দেহ ছিল যে আমি অবজেক্ট-ভিত্তিক শ্রেণিবিন্যাসের সূক্ষ্মতাগুলি বেশ বুঝতে পারি নি! এটি আকর্ষণীয় যে আপনি হাইব্রিড পদ্ধতির সম্ভাবনার কথা উল্লেখ করেছেন, আমি এখনও এতদূর ভাবিনি। আমি কী জিজ্ঞাসা করতে পারি, যদি আমি অবজেক্টগুলি সনাক্তকরণ এবং শ্রেণিবদ্ধকরণের জন্য একটি স্লাইডিং উইন্ডো পন্থা অবলম্বন করি, তবে দূরবর্তী সেন্সিং ডোমেনে এই জাতীয় পদ্ধতির জন্য কোনও প্রযুক্তিগত শব্দ প্রয়োগ করা আছে?
আরডিজি

1
হ্যাঁ, এটিকে কনভলিউশন বলা হয়। আমার উত্তর দেখুন।
জন পাওয়েল

আমার মতে, পিক্সেল ভিত্তিক শ্রেণিবিন্যাসে শূন্য শক্তি রয়েছে। বাউন্ডিং বাক্স এবং অবস্থানের পূর্বাভাস দেওয়ার জন্য কনভলিউশন প্লাস রিগ্রেশন জড়িত আকর্ষণীয় ওয়ার্কফ্লো রয়েছে তবে পিক্সেল ভিত্তিক শ্রেণিবিন্যাসটির নিজস্ব কোনও মূল্য নেই, ইমো।
জন পাওয়েল

1
@ জনপোয়েল্লাকা বারিয়া - মাল্টিমিটেপোরাল অ্যাপ্লিকেশনগুলি বিবেচনা করার সময়, পিক্সেল-ভিত্তিক পদ্ধতির কিছু মূল্য রয়েছে, যেখানে শ্রেণিবদ্ধকরণ traditionalতিহ্যবাহী একক বারের চেয়ে পরিবর্তিত অঞ্চলগুলিতে বেশি মনোনিবেশ করে।
মিক্কেল ল্যাডহোম রাসমুসেন

1
অবশ্যই, হ্যাঁ, যথেষ্ট ন্যায্য। যদিও, যুক্তিযুক্তভাবে, অঞ্চল ভিত্তিক পদ্ধতিগুলি, ভেক্টরাইজড এবং তারপরে সময়ের সাথে তুলনা করলে সম্ভাব্যতর বৃহত্তর অন্তর্দৃষ্টি পাওয়া যায় তবে আপনার বক্তব্যটি ভালভাবে গ্রহণ করা হয়েছে।
জন পাওয়েল

12

পিক্সেল-ভিত্তিক শ্রেণিবিন্যাস হিসাবে, আপনি স্পট অন। প্রতিটি পিক্সেল একটি এন-ডাইমেনশনাল ভেক্টর এবং কিছু মেট্রিক অনুযায়ী সাপোর্ট ভেক্টর মেশিন, এমএলই, কিছু ধরণের বোনা শ্রেণিবদ্ধকরণ ইত্যাদি ব্যবহার করে নির্ধারিত হবে some

অঞ্চল ভিত্তিক শ্রেণিবদ্ধকারীদের হিসাবে, যদিও, জিপিইউগুলির সংমিশ্রণে, প্রচুর পরিমাণে ডেটা, মেঘ এবং অ্যালগরিদমের বিস্তৃত প্রাপ্যতা ওপেন সোর্স বৃদ্ধির জন্য ধন্যবাদ (সুবিধার্থে) বিগত কয়েক বছরে বিশাল উন্নয়ন হয়েছে been গিথুব দ্বারা)। কম্পিউটার ভিশন / শ্রেণিবিন্যাসের অন্যতম বৃহত উন্নয়ন ঘটেছে কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলিতে (সিএনএন)। কনভোলশনাল স্তরগুলি "শিখুন" বৈশিষ্ট্যগুলি যা রঙের উপর ভিত্তি করে traditionalতিহ্যবাহী পিক্সেল-ভিত্তিক শ্রেণিবদ্ধ হিসাবে তৈরি করতে পারে তবে প্রান্ত ডিটেক্টর এবং সমস্ত ধরণের অন্যান্য বৈশিষ্ট্য নিষ্কাশনকারীও তৈরি করে যা পিক্সেলের একটি অঞ্চলে থাকতে পারে (সুতরাং সমঝোতার অংশ) কখনই পিক্সেল-ভিত্তিক শ্রেণিবিন্যাস থেকে নিষ্কাশন করতে পারে না। এর অর্থ তারা অন্য কোনও ধরণের পিক্সেলের ক্ষেত্রের মাঝখানে একটি পিক্সেলকে ভুল-শ্রেণিবদ্ধ করার সম্ভাবনা কম - যদি আপনি কখনও শ্রেণিবিন্যাস চালিয়ে থাকেন এবং অ্যামাজনের মাঝখানে বরফ পেয়ে থাকেন তবে আপনি এই সমস্যাটি বুঝতে পারবেন।

তারপরে আপনি প্রকৃত শ্রেণিবদ্ধকরণের জন্য কনভোলিউশনের মাধ্যমে শিখে নেওয়া "বৈশিষ্ট্যগুলিতে" সম্পূর্ণ সংযুক্ত নিউরাল নেট প্রয়োগ করেন। সিএনএন এর অন্য দুর্দান্ত সুবিধাগুলির মধ্যে একটি হ'ল তারা স্কেল এবং আবর্তন আক্রমণকারী, কারণ সাধারণত কনভলিউশন স্তর এবং শ্রেণিবদ্ধকরণ স্তরগুলির মধ্যে অন্তর্বর্তী স্তর থাকে যা বৈশিষ্ট্যগুলিকে সাধারণীকরণ করে, পুলিং এবং ড্রপআউট ব্যবহার করে অতিরিক্ত চাপ এড়ানোর জন্য এবং চারপাশের সমস্যাগুলির সাথে সহায়তা করে স্কেল এবং ওরিয়েন্টেশন।

কনভ্যুসিভাল নিউরাল নেটওয়ার্কগুলিতে প্রচুর সংস্থান রয়েছে, যদিও এই ক্ষেত্রের অন্যতম পথিকৃৎ আন্ড্রেই কার্পাথির সেরা স্ট্যান্ডার্ড শ্রেণি হতে হবে , এবং পুরো বক্তৃতা সিরিজটি ইউটিউবে উপলব্ধ ।

অবশ্যই, পিক্সেল বনাম অঞ্চল ভিত্তিক শ্রেণিবদ্ধকরণের সাথে সম্পর্কিত অন্যান্য উপায় রয়েছে তবে বর্তমানে এটি শিল্প পদ্ধতির অবস্থা এবং মেশিন অনুবাদ এবং স্ব-ড্রাইভিং গাড়িগুলির মতো দূরবর্তী সংবেদনের শ্রেণিবিন্যাসের বাইরেও এটির অনেকগুলি অ্যাপ্লিকেশন রয়েছে।

টেনসরফ্লো স্থাপন ও এডাব্লুএস চালানোর নির্দেশাবলী সহ ট্যাগড প্রশিক্ষণ ডেটার জন্য ওপেন স্ট্রিট ম্যাপ ব্যবহার করে অঞ্চল ভিত্তিক শ্রেণিবিন্যাসের আরও একটি উদাহরণ এখানে ।

প্রান্ত সনাক্তকরণের ভিত্তিতে শ্রেণিবদ্ধের গুগল আর্থ ইঞ্জিন ব্যবহার করার একটি উদাহরণ এখানে রয়েছে, পাইভট সেচের জন্য এই ক্ষেত্রে - গাউসিয়ান কার্নেল এবং কনভোলিউশন ছাড়া আর কিছুই ব্যবহার না করে আবার অঞ্চল / প্রান্ত ভিত্তিক পদ্ধতির শক্তি দেখায়।

এখানে চিত্র বর্ণনা লিখুন

পিক্সেল-ভিত্তিক শ্রেণিবিন্যাসের তুলনায় বস্তুর সর্বোত্তমত্বটি মোটামুটিভাবে স্বীকৃত হলেও এখানে রিমোট সেন্সিং লেটারগুলির একটি আকর্ষণীয় নিবন্ধটি অবজেক্ট ভিত্তিক শ্রেণিবিন্যাসের কার্যকারিতা মূল্যায়ন করছে ।

পরিশেষে, একটি মজাদার উদাহরণ, কেবল এটি দেখানোর জন্য যে আঞ্চলিক / সমঝোতা ভিত্তিক শ্রেণিবদ্ধকারীদের সাথেও কম্পিউটার ভিশন এখনও সত্যই শক্ত - ভাগ্যক্রমে গুগল, ফেসবুক ইত্যাদির বুদ্ধিমান ব্যক্তিরা এর মধ্যে পার্থক্য নির্ধারণ করতে সক্ষম হয়ে অ্যালগরিদমে কাজ করছে কুকুর, বিড়াল এবং বিভিন্ন জাতের কুকুর এবং বিড়াল সুতরাং, দূরবর্তী সংবেদনে আগ্রহী ব্যবহারগুলি রাতে খুব সহজে ঘুমাতে পারেন: ডি

এখানে চিত্র বর্ণনা লিখুন


0

খুব সাধারণ উত্তরটি নিম্নরূপ:

আপনি যদি প্রশিক্ষণ সেট হিসাবে কেবল বর্ণালী তথ্য (পিক্সেল তীব্রতা) ব্যবহার করেন তবে আপনি পিক্সেল বেস শ্রেণিবদ্ধকরণ করেন।

যদি আপনি উভয় স্থানিক (পার্শ্ববর্তী পিক্সেল) এবং বর্ণাল তথ্য উভয়ই প্রশিক্ষণ সেট হিসাবে ব্যবহার করেন তবে আপনি অবজেক্ট বেস শ্রেণিবদ্ধকরণ করতে পারেন (বিভাগগুলি ভিত্তিক অ্যালগরিদম যেমন ডিবিএসস্ক্যান ব্যবহার করে)। কম্পিউটার ভিশনে এই ডিবিএসস্ক্যান সুপারপিক্সেল নিষ্কাশনের জন্য ব্যবহৃত হয়েছিল।

দ্রষ্টব্য: আপনি বৈশিষ্ট্য নিষ্কাশন জন্য বর্ণিত তথ্য যে কোনও অর্থে (আকার, আকার, প্রসঙ্গ / টেক্সচার) ব্যবহার করতে পারেন।

বর্ণালী তথ্য ব্যবহার করে বৈশিষ্ট্য নিষ্কাশন করতে আপনি বিভিন্ন পন্থা ব্যবহার করতে পারেন।

মূল প্রশ্নটি হল যে কেউ কীভাবে বৈশিষ্ট্য নিষ্কাশন করার জন্য সবচেয়ে সঠিক পদ্ধতির সন্ধান করতে পারে এবং বর্ণনামূলক তথ্য থেকে তথ্য বহন করতে উত্পন্ন সমস্যাটির জন্য দক্ষ অ্যালগরিদম (প্রান্ত সনাক্তকরণ, বর্ণালী-ভিত্তিক বিভাগকরণ, ক্লাস্টারিং) প্রয়োগ করতে পারে।

প্রশিক্ষণের সেট তৈরির জন্য বর্ণালি এবং স্থানিক উভয় তথ্যেই একটি দুর্দান্ত বিশ্লেষণ করার জন্য কনভলিউশন ম্যাট্রিক্সের কথা ভাবা যেতে পারে।

তথ্যসূত্র: রিমোট সেন্সিং এবং জিআইএস ডোমেনে কাজ করার জন্য 3 বছরের বেশি অভিজ্ঞতা থাকার পরে আমার জ্ঞান।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.