অসমীক্ষিত চিত্র বিভাজন


11

আমি একটি অ্যালগরিদম বাস্তবায়নের চেষ্টা করছি যেখানে একটি বিমানের টেবিলের উপর বেশ কয়েকটি বস্তু সহ একটি চিত্র দেওয়া হয়েছে, প্রতিটি বস্তুর জন্য বিভাগীয়করণের মুখোশগুলির আউটপুটটি পছন্দসই। সিএনএন-এর মতো নয়, এখানে উদ্দেশ্য হ'ল অপরিচিত পরিবেশে জিনিসগুলি সনাক্ত করা। এই সমস্যার সর্বোত্তম পন্থা কোনটি? এছাড়াও, কোনও বাস্তবায়ন উদাহরণ কি অনলাইনে পাওয়া যায়?

সম্পাদনা: আমি দুঃখিত, প্রশ্নটি কিছুটা বিভ্রান্তিকর হতে পারে। "অপরিচিত পরিবেশ" বলতে আমি যা বোঝাতে চেয়েছি তা হ'ল বস্তুগুলি অ্যালগোরিদমের সাথে অজানা থাকতে পারে। অ্যালগরিদমটি অবজেক্টটি কী তা বোঝার দরকার নেই, তবে কেবলমাত্র এটিটিকে আবিষ্কার করা উচিত। এই সমস্যাটির কাছে আমার কীভাবে যোগাযোগ করা উচিত?


"সিএনএন-এর বিপরীতে" অর্থবোধ করে না; সিএনএন হ'ল এক ধরণের মডেল, উদ্দেশ্য সহ কোনও ধরণের টাস্ক নয়। সিএনএন ব্যবহার করেও অসমর্কিত চিত্র বিভাজন করা যেতে পারে
নাথান

উত্তর:


4

দ্রুত উত্তর

O(n)O(n2)

কিছু ব্যাখ্যা

KO(n)K-মানগুলি ব্যর্থ হয় কারণ এটি উপবৃত্তাকার গুচ্ছগুলি খুঁজে পেতে এবং এলোমেলো আকারের নয় এটির নকশা ।

বিপরীতে আমাদের কাছে গড় শিফট রয়েছে যা স্বয়ংক্রিয়ভাবে ক্লাস্টারের সংখ্যা সন্ধান করতে সক্ষম হয় - যা দরকারী আপনি যখন কী সন্ধান করছেন তা যখন জানবেন না - এলোমেলো আকার সহ

KK

চিত্র বিভাজন ক্লাস্টারিংয়ের একটি পরামর্শ

আপনার রঙের স্থানটি আরজিবি থেকে এলইউভিতে রূপান্তর করুন যা ইউক্লিডিয়ান দূরত্বের জন্য ভাল।

K

  • O(α.n)
  • O(β.n)
  • α>β

গড় শিফট এলএসএইচ ধীর হলেও এটি আপনার প্রয়োজনের সাথে আরও ভাল ফিট করে। এটি এখনও রৈখিক থাকে এবং উল্লিখিত বাস্তবায়নের সাথে এটি স্কেলযোগ্য

পিএস: আমার প্রোফাইল পিকচারটি নিজের উপর গড় শিফট এলএসএইচের একটি অ্যাপ্লিকেশন, যদি এটি কীভাবে কাজ করে তা নির্ধারণ করতে সহায়তা করতে পারে।


3

আপনাকে সিভিপিআর 2018 এর জন্য জমা দেওয়া এবং স্বীকৃত এই কাজটি একবার দেখে নেওয়া দরকার: প্রতিটি জিনিসকে সেগমেন্ট টু সেগমেন্ট করা

এই কাজের মধ্যে, তারা সবকিছু ভাগ করার চেষ্টা করে, এমনকি নেটওয়ার্কের কাছে অজানা জিনিসগুলি। মাস্ক আর-সিএনএন ব্যবহার করা হয়েছে, একটি ট্রান্সফার লার্নিং সাব-নেটওয়ার্কের সাথে মিলিত হয়ে তারা প্রায় সমস্ত কিছুকে ভাগ করে নেওয়ার ক্ষেত্রে খুব ভাল ফলাফল পায়।


2

চিত্র বিভাজনের জন্য অত্যাধুনিক (SOTA) হ'ল ফেসবুকের মাস্ক-আরসিএনএন

এটি সাধারণত কোসো বা পাসকালের মতো ডেটাসেটে প্রশিক্ষিত হয় যা বাস্তব জীবনের বস্তুগুলির বৈশিষ্ট্যযুক্ত, আপনি এটি আপনার পছন্দসই একটি ডেটাसेटে পুনরায় প্রশিক্ষণ দিতে পারেন, বাস্তব বা না।

ফেসবুক অ্যাপাচি 2 লাইসেন্সের আওতায় একটি বাস্তবায়ন ( ডিটেক্ট্রন ) সরবরাহ করে। একবার চেষ্টা করে দেখো!


আসলে আমি মনে করি আমি বিভ্রান্তিমূলকভাবে প্রশ্নটি করেছি, আমার খারাপ bad আমি সবেমাত্র একটি সম্পাদনা পোস্ট করেছি, আপনি কি আবার এটি দেখতে পারেন?
মুহসিন ফাতিহ

2

আসলে, আপনার কাজ তদারকি করা হয়। Segnetএটির জন্য যে কোনও একটি বাস্তবায়ন এখানে অ্যাক্সেস করা যেতে পারে আপনার উদ্দেশ্যে ভাল স্থাপত্য হতে পারে । সেগনেট তত্ত্বাবধানে পড়াশুনা থেকে পিক্সেল-ভিত্তিক শ্রেণির লেবেলগুলির পূর্বাভাস দিতে শেখে। সুতরাং আমাদের সাথে সম্পর্কিত গ্রাউন্ড ট্রুথ লেবেলগুলির সাথে ইনপুট চিত্রগুলির একটি ডেটাসেট প্রয়োজন। ছবিগুলিতে লেবেল একক চ্যানেল, প্রতিটি পিক্সেল তার বর্গ দিয়ে লেবেল সঙ্গে হতে হবে ...

এছাড়াও, সম্পূর্ণ কনভোলিউশনাল নেটওয়ার্কগুলি দেখুন যা আপনার কাজের জন্য উপযুক্ত।


প্রশ্নের সম্পাদনার ভিত্তিতে আমি অতিরিক্ত তথ্য যুক্ত করি। এই কাজের জন্য প্রয়োগ করা যেতে পারে এমন অনেকগুলি পদ্ধতি রয়েছে। মূলত সবচেয়ে সহজটি হ'ল একটি ব্যাকগ্রাউন্ড লেবেল ব্যবহার করা এবং উল্লিখিত আর্কিটেকচারগুলিকে নিয়োগ করে যে ক্লাসগুলি আপনি পটভূমি হিসাবে জানেন না তাদের শ্রেণিবদ্ধ করা। এটি করার সাথে সাথে আপনার এমন লেবেল থাকবে যা পটভূমির শ্রেণীর জন্য ওভারল্যাপ থাকতে পারে যা এই পদ্ধতির সম্ভাব্য ক্ষতি হতে পারে তবে এর সুবিধাটি হ'ল আপনার প্রশিক্ষিত লেবেলগুলি ইনপুটগুলিতে ঘন ঘন ব্যবহৃত হয়, আপনার আর্কিটেকচারের তুলনামূলক হালকা সংস্করণ থাকতে পারে অজানা ক্লাসগুলি স্বীকৃতি দেয়।


আসলে আমি মনে করি আমি বিভ্রান্তিমূলকভাবে প্রশ্নটি করেছি, আমার খারাপ bad আমি সবেমাত্র একটি সম্পাদনা পোস্ট করেছি, আপনি কি আবার এটি দেখতে পারেন?
মুহসিন ফাতিহ

@ মুহসিন ফাতিহ সম্পাদিত।
মিডিয়া

এটি অবশ্যই সহজতর হবে এবং আরও ভাল পারফরম্যান্স অর্জন করবে, যদি এটি তদারকি করা কোনও কাজ হত তবে অব্যবহৃত চিত্রের বিভাজনও সম্ভব possible
নাথান

@ নাথান আমি সেই সময়ে আমার নিজের মতামতটি পরামর্শ দিয়েছি। অবশ্যই, এটি সম্ভব।
মিডিয়া

1

এটি এমন কিছু হতে পারে যা আপনি সন্ধান করছেন। যেহেতু আপনি চিত্র বিভাজনের জন্য জিজ্ঞাসা করেছেন এবং বিভাজন নয় semantic / instance, আমার ধারণা আমি আপনাকে চিত্রের প্রতিটি বিভাগের জন্য লেবেলিংয়ের প্রয়োজন নেই।

পদ্ধতিটি বলা হয় scene-cutযা কোন চিত্রকে অদৃশ্য ফ্যাশনে শ্রেণি-অজ্ঞেয় অঞ্চলে ভাগ করে। অন্দর বিশৃঙ্খল পরিবেশের ক্ষেত্রে এটি খুব ভাল কাজ করে।

কাগজের লিঙ্ক: আরক্সিভ

কোড: কোড

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.