বনের দৃশ্যের চিত্রায়িতভাবে (ট্রেইলের পাশে কোথাও দাঁড়িয়ে ক্যামেরার দৃষ্টিকোণ থেকে) কোনও ট্রেইল (লাইন বা পয়েন্ট-টু-পয়েন্ট কার্ভ হিসাবে) সনাক্ত করার জন্য কোনও গবেষণা / কাগজপত্র / সফ্টওয়্যার সম্পর্কে কি সচেতন?
আমি এমন একটি অ্যালগরিদম সন্ধান করার চেষ্টা করছি যা এর মতো একটি চিত্র নিতে পারে:
এবং একটি মুখোশ তৈরি করুন, সম্ভাব্য "ট্রেইল" সনাক্ত করে যেমন:
আপনি দেখতে পাচ্ছেন যে, আসল চিত্রটি কিছুটা ঝাপসা, যা উদ্দেশ্যমূলক। চিত্রের উত্স নিখুঁত ফোকাসের গ্যারান্টি দিতে পারে না, তাই আমার কাছে যুক্তিসঙ্গত পরিমাণে গোলমাল এবং অস্পষ্টতা পরিচালনা করতে সক্ষম হওয়া দরকার।
আমার প্রথম চিন্তাটি ছিল গাউসিয়ান অস্পষ্টতা প্রয়োগ করা এবং চিত্রটিকে ব্লকগুলিতে বিভক্ত করা, তীক্ষ্ণ বর্ণের পার্থক্যের সন্ধানকারী সংলগ্ন ব্লকের সাথে তুলনা (একটি ট্রেইল "প্রান্ত" নির্দেশ করে)। তবে, আমি দ্রুত বুঝতে পেরেছিলাম যে আলোছায়া এবং আলোর অন্যান্য পরিবর্তনগুলি সহজেই তা বন্ধ করে দেয়।
আমি এসআরএফ বৈশিষ্ট্যগুলি বের করার বিষয়ে ভাবছিলাম, তবে চিত্রটি যখন পুরোপুরি পরিষ্কার হয় এবং ধারাবাহিক আলো সহ আমি তখনই কেবল এসআরএফ / সিফ্টের সাথে সাফল্য পাই।
আমি চিত্রগুলি এবং মুখোশগুলি অনেক ছোট আকারে (উদাহরণস্বরূপ 100x75) স্কেল করার চেষ্টা করেছি, এগুলিকে 1xN ভেক্টরে রূপান্তর করেছি এবং এফএনএএন- ভিত্তিক নিউরাল নেটওয়ার্ককে প্রশিক্ষণের জন্য ব্যবহার করেছি (যেখানে চিত্রটি ইনপুট এবং মাস্কটি পছন্দসই আউটপুট)। এমনকি এত ছোট আকারে, 1% লুকানো স্তর সহ ইনপুট ভেক্টরের আকারের সাথে ট্রেনিং করতে 6 ঘন্টা সময় লেগেছে, এবং এখনও পরীক্ষার সেটে কোনও মুখোশের পূর্বাভাস দিতে পারেনি।
কেউ কি এই বিষয়ে অন্য কোন পদ্ধতি বা কাগজপত্রের পরামর্শ দিতে পারবেন?