ডিজিটির মাধ্যমে টেক্সচার শ্রেণিবদ্ধকরণ


12

একটি বিচ্ছিন্ন কোসাইন ট্রান্সফর্মের বৈশিষ্ট্যগুলি ব্যবহার করে কোনও চিত্রের জমিনকে শ্রেণিবদ্ধ করা কতটা কার্যকরী হবে? গুগলিং "টেক্সচার শ্রেণিবদ্ধকরণ ডিসিটি" স্নায়বিক নেটওয়ার্ক ব্যবহার করে কেবল এই বিষয়ে একটি একাডেমিক কাগজ সন্ধান করে।

আমার অ্যাপ্লিকেশনটির জন্য, আমার কাছে লেবেলযুক্ত চিত্রগুলির একটি বৃহত কর্পস রয়েছে, যাতে পুরো চিত্রটি একটি সামঞ্জস্যপূর্ণ টেক্সচার (যেমন কম্বল, গাছের বাকল, ঘাসের ক্ষেত ইত্যাদি) এর ক্লোজ-আপ শট।

পূর্ববর্তী প্রশ্নের প্রতিক্রিয়া দ্বারা অনুপ্রাণিত হয়ে আমি নিম্নলিখিত পদ্ধতির বিষয়টি বিবেচনা করছি:

  1. প্রতিটি চিত্রকে পিক্সেলের এনএক্সএন ব্লকে বিভক্ত করুন
  2. প্রতিটি ব্লকের ডিসিটি নিন
  3. প্রতিটি ডিসিটি 1xM অ্যারে সমতল করুন এবং কে-মিনস ক্লাস্টারিং অ্যালগরিদমকে এটি খাওয়ান এবং প্রতিটি ডিসিটির জন্য ক্লাস্টারের লেবেল পান
  4. # 3 থেকে প্রতি চিত্রের প্রতিটি লেবেল গণনা করে প্রতিটি চিত্রের জন্য ক্লাস্টারিং লেবেলের একটি হিস্টোগ্রাম গণনা করুন
  5. [(হিস্টোগ্রাম, চিত্রের লেবেল)] এর সেট সেট করে কোনও এসভিএম শ্রেণিবদ্ধকে প্রশিক্ষণ দিন

এই কাজ কিভাবে ভাল হবে? আমি SIFT / SURF অ্যালগরিদমের মাধ্যমে নিষ্ক্রিয় বৈশিষ্ট্যগুলি ব্যবহার করে একটি অনুরূপ সিস্টেম প্রয়োগ করেছি, তবে আমি কেবল প্রায় 60% নির্ভুলতা পেতে সক্ষম হয়েছি।

টেক্সচারকে শ্রেণিবদ্ধ করার জন্য আমি আর কোন উপায়ে ডিসিটি ব্যবহার করতে পারি?



2
@ আইভোফ্লিপস: এমএল-ক্লাস.অর্গ.এর জন্য +1। তবে এই প্রশ্নটি বৈশিষ্ট্যগুলি নিয়ে। শেষ পর্যন্ত, যদি আপনার বৈশিষ্ট্যগুলি সমস্যার জন্য উপযুক্ত না হয় তবে আপনার শ্রেণিবদ্ধকরণ অ্যালগরিদমটি কত ভাল matter
ডিমা

পাঠ্য শ্রেণিবিন্যাসের জন্য ব্যাংক অফ গ্যাবার ফিল্টার সম্ভবত খুব দরকারী।
mrgloom

উত্তর:


6

এতক্ষণ আপনি যা প্রস্তাব করছেন তা যুক্তিসঙ্গত পদ্ধতির মতো। তবে আমি মনে করি না আপনি যতক্ষণ না চেষ্টা করেছেন ততক্ষণ আপনি কীভাবে এটি কার্যকর কাজ করবেন তা আপনি জানেন, ঠিক যেমন আপনি এসআইএফটি চেষ্টা করেছেন tried

যদিও আমি একটি প্রশ্ন আছে। আপনি নিজেকে ডিসিটিতে সীমাবদ্ধ করছেন কেন? টেক্সচারের শ্রেণিবিন্যাসের জন্য প্রচুর উপস্থাপনা ব্যবহার করা হয়েছে: সহ-উপস্থিতি ম্যাট্রিক্স, স্থানীয় বাইনারি প্যাটার্ন ইত্যাদি text আপনি টেক্সচারের শ্রেণিবিন্যাসের জন্য কেবল ডিসিটি ব্যবহার করার জন্য একটি কাগজ খুঁজে পেয়েছেন তা বোঝায় যে এটি সর্বাধিক ব্যবহৃত বৈশিষ্ট্য নয় এই সমস্যার জন্য আমি আপনাকে সুপারিশ করব যে লোকেরা কী কী বৈশিষ্ট্য ব্যবহার করেছে এবং তারা কতটা ভাল কাজ করেছে তা দেখার জন্য আপনি আপনার সাহিত্য অনুসন্ধান আরও প্রশস্ত করুন।


4

যদি আপনি ছবিটি এনএক্সএন ব্লকে বিভক্ত না করে পরিবর্তে স্লাইডিং উইন্ডো ব্যবহার করেন - চিত্রের প্রতিটি পয়েন্টে কেন্দ্রিক ব্লকগুলির জন্য ডিসিটি গণনা করুন এটি মূলত ওয়েভলেট পদ্ধতির ব্যবহার হবে। ব্লকগুলিতে আপনার বিভাজন চিত্রটি স্লাইডিং উইন্ডো এবং ডাউনসাম্পলিং চিত্র ব্যবহার করার মতো। সুতরাং মূলত আপনি ওয়েভলেট টেক্সচার বিভাজন হ্রাস ফর্ম ব্যবহার করছেন। ডিসিটির পরিবর্তে গ্যাবার ওয়েভলেটটি সাধারণত ব্যবহৃত হয় কারণ: এতে আরও বেশি পরামিতি রয়েছে (+ স্কেল এবং + দিক) এবং মসৃণ মনোযোগ (উইন্ডোর তীক্ষ্ণ প্রান্তের পরিবর্তে)।


3

কেউ কেন ডিসি ভিত্তিক টেক্সচার সেগমেন্টেশন / শ্রেণিবিন্যাস (বা অন্য কোনও ক্রিয়াকলাপ) করতে চান তা সবচেয়ে বড় আকর্ষণ হ'ল বেশিরভাগ জেপিইজি চিত্র এবং এমপিইজি ভিডিও ইতিমধ্যে ডিসিটিতে রয়েছে। অন্যদিকে, এটি সাধারণত বিশ্বাস করা হয় যে গ্যাবার ভিত্তিক পদ্ধতির গণনা ব্যয়বহুল।

উচ্চ ফ্রিকোয়েন্সি এবং বা তির্যক ফ্রিকোয়েন্সিগুলির এমআইডি থেকে ডিসিটি সহ-কার্যকারিতা পিক্সেল ডোমেনের স্থানীয় পরিবর্তনের একটি ভাল প্রতিনিধিত্ব প্রতিফলিত করে।

তবে, এগুলি যতটা শোনাচ্ছে তত ভাল নাও হতে পারে। প্রথমে, বেশিরভাগ মানের ডিসিটি ব্লকগুলি 8x8 আকারের। সুতরাং এটি প্রকৃত ইমপ্লিকেশনটি হ'ল যদি দৃশ্যের প্যাটার্ন থাকে যা 8 পিক্সেল পয়েন্টের পর্যায়ক্রমিক থাকে তবে এই অনুরণনকারী প্রভাবটি সংলগ্ন ব্লকের সাথে সম্পর্কিত সহ-কার্যকারীর মিলের ক্ষেত্রে দৃশ্যমান হবে, যখন পর্যায়ক্রমে এই সম্পর্ক পরিবর্তিত হয়।

ডিসিটি বনাম গ্যাবরের খাঁটি ব্লকগুলির মধ্যে সমালোচনামূলক পার্থক্যটি বুঝুন যে গ্যাবারের একটি স্কেল রয়েছে। সুতরাং আপনি যদি টেক্সচারের "সাময়িকতা" বা "সূক্ষ্মতা / রুক্ষতা" পরিবর্তন করেন তবে গ্যাবোর এটি আবিষ্কার করবে যেখানে ডিসিটির নির্ধারিত মূল্যায়ন @ 8x8 ব্লকের আকার ঠিকমতো ফিট করতে সক্ষম হবে না।

যাইহোক, আমাদের যেটি অনুধাবন করা দরকার তা হ'ল একাধিক ব্লক একসাথে এই জাতীয় স্কেল ঘটনাটি মূল্যায়ন করার মাধ্যমে এই জাতীয় নিদর্শনগুলি তৈরি করা । উদাহরণস্বরূপ একটি মৌলিক পদ্ধতির হিসাবে, জিজ্ঞাসা করুন যে আমার যদি 16x16 ব্লক বা 32x32 আকারের ব্লক থাকত, তবে সহ-কার্যকারীর ক্ষেত্রে ফলাফলগুলি কী হত? সম্পর্কিত অবস্থানগুলিতে সহ-কার্যকারীরা শোষণের জন্য কিছু সম্পর্ক রাখে এবং একটিকে টেক্সচারের প্রকৃত স্কেল আবিষ্কার করতে দেয়।

এটি অবশ্যই অনুসরণ করার জন্য একটি ভাল গবেষণা বিষয়।

দ্রষ্টব্য: এমনকি এমপিইজি 7 (যারা এমপিইজি তৈরি করেছেন এমন কমিটির খুব নিকটবর্তী) - তারা গিগর ভিত্তিক বৈশিষ্ট্যগুলি ডিজিটি ভিত্তিক না করে টেক্সচারের জন্য প্রস্তাব করেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.