রূপসী মেলানো - সংশ্লেষ স্থানচ্যুতি সন্ধান করা


17

আমি একই বিষয়বস্তু সহ দুটি চিত্রের সারসংক্ষেপ পেয়েছি এবং আমি এই বস্তুর স্থানচ্যুতি এবং ঘূর্ণন সন্ধান করতে চাই। আমি এই সংক্ষিপ্তসারগুলির ঘোরানো বাউন্ডিং বাক্সগুলি এবং তার কোণগুলি এবং কেন্দ্রের পয়েন্টগুলি দিয়ে চেষ্টা করেছি তবে বাউন্ডিং বাক্সগুলির ঘূর্ণন সঠিকভাবে কনট্যুর ঘূর্ণন সম্পর্কে বলে না কারণ এটি কোণ +1, a + 90, a + 180 ইত্যাদির জন্য সমান same ডিগ্রী. আবর্তন এবং আবর্তনের স্থানচ্যুতি খুঁজে পাওয়ার জন্য কি অন্য কোনও ভাল উপায়? উত্তল হাল এর কিছু ব্যবহার, উত্তল ত্রুটি? আমি ওপেনসিভিতে পাঠ্য মিলে যাওয়া রূপগুলি সম্পর্কে শিখলাম তবে এটি কোনও লাভ হয়নি। কেউ কিছু উদাহরণ দিতে পারে?

উদাহরণ:

1 2 3 4

আমি উদাহরণস্বরূপ গোলাপী বর্গক্ষেত্র এবং দ্বিতীয় ক্ষেত্রে কলমটি সনাক্ত করতে চাই। অন্যান্য উদাহরণগুলি কিছু ছিদ্র, তারা ইত্যাদির সাথে স্কোয়ার হতে পারে I যেমনটি আমি বলেছি আমি কিছু ভার্চুয়াল জিনিস বানাতে চাই। যে কোনও পরামর্শের প্রশংসা করা হয়েছে কারণ আমি যতটা সম্ভব পদ্ধতিটি পরীক্ষা করতে চাই।


ছবি এখানে সহায়তা করবে
11'11

আমি কিছু সর্বজনীন ফাংশন করতে চাই। টেস্ট ছবি হিসাবে কিছু হতে পারে। আয়তক্ষেত্র হিসাবে সরল আকারের উপাদান, বা আরও জটিল আকারের।
krzych

2
ভাল, আপনি সব ক্ষেত্রে একক পদ্ধতি ফিট করতে পারবেন না। ব্যবহারিক পদ্ধতি বিপরীতে পরিসীমা, গোলমাল অনুমান, ব্যাকগ্রাউন্ড এবং নিজের আকারের উপর নির্ভর করে - এটি মসৃণতা, টপোলজি ইত্যাদি pictureএই কারণ ছবি কেন সহায়তা করবে।
عکس 2image

উত্তর:


4

রূপগুলির মধ্যে স্কেলের পার্থক্য সম্পর্কে আপনার কি চিন্তা করতে হবে? যদি না হয় তবে আপনি কেবল প্রতিটি কনট্যুরের সেন্ট্রয়েড এবং অন্যের কাছ থেকে বিয়োগ করে গণনা স্থানচ্যূতিকে খুঁজে পেতে পারেন। তারপরে আপনি সংক্ষিপ্তসারগুলির প্রধান অক্ষগুলি গণনা করতে পারেন এবং তাদের মধ্যে ঘূর্ণন কোণটি পেতে পারেন।

যদি স্কেলিং জড়িত থাকে তবে আপনি সংশ্লিষ্ট মূল অক্ষগুলির অনুপাত নিয়ে স্কেল ফ্যাক্টর গণনা করতে পারেন।


হ্যাঁ স্কেল এছাড়াও পৃথক হতে পারে। আমি প্রতিটি কনট্যুরের ফ্রিম্যান চেইন তৈরি ওপেনসিভি থেকে ফ্রিম্যান চেইনের অনুরূপ কিছু সম্পর্কেও ভেবেছিলাম এবং তারপরে তুলনা করে কোনওভাবে অনুবাদককে খুঁজে পাওয়ার চেষ্টা করেছি, তবে আমি এর জন্য কিছু ভাল অ্যালগরিদম বের করতে পারি না।
ক্রিজিচ

এটি ন্যূনতম ঘোরানো বাউন্ডিং বাক্স তৈরি করা এবং এর ঘূর্ণন এবং স্থানচ্যুতি গ্রহণের সমান। এই পদ্ধতির চেষ্টা করেছেন এবং ফলাফলগুলি সন্তুষ্ট নয়। সুতরাং আমি মনে করি এই পদ্ধতিটি মোটেই ভাল নয়।
krzych

কেন এটি কাজ করে না সে সম্পর্কে আপনি আরও নির্দিষ্ট করে বলতে পারেন? কনট্যুরগুলি কি কেবল অনুবাদ, ঘূর্ণন এবং স্কেলিংয়ের সাথে সম্পর্কিত, বা এগুলি অন্য উপায়ে বিকৃত করা যেতে পারে? কিছু ছবি সত্যিই সাহায্য করবে। আপনার যদি অ-অ্যাফাইন রূপান্তর বা র্যান্ডম গোলমাল পরিচালনা করতে হয় তবে আপনি আকারের প্রসঙ্গটি চেষ্টা করতে পারেন the আমাকে জানিয়ে দিন, আমি আপনাকে কিছু কাগজপত্র দেখিয়ে বলতে পারি।
Dima

এগুলি কেবল অনুবাদ, ঘূর্ণন এবং স্কেলিং দ্বারা সম্পর্কিত, ডিফর্মেশনগুলি বিভিন্ন ফটোগুলিতে সামান্য আলাদা কনট্যুর সনাক্তকরণের সাথে সংযুক্ত থাকে। প্রসঙ্গে আকৃতি? আপনি এই প্রসারিত করতে পারেন?
krzych

1
@kzych দেখে মনে হচ্ছে আপনার এখানে সবচেয়ে বড় সমস্যাটি প্রান্ত সনাক্তকরণে শব্দ হবে। আপনি ন্যূনতম ঘোরানো বাক্সটি কীভাবে খুঁজে পাবেন? কেন এখনও এটি সঠিকভাবে কাজ করে না তা আমি এখনও পরিষ্কার নই। আকারের প্রসঙ্গটি একটি কনট্যুর উপস্থাপনের একটি উপায়। বিশদগুলি এখানে: en.wikedia.org/wiki/Shape_context
Dima

2

আপনার যদি স্কেল বা প্রজেক্টিক বিকৃতি চেইন কোডগুলি সম্পর্কে চিন্তা করতে না হয় তবে এখানে সহায়তা করতে পারে। আপনার যদি একই স্কেলের প্রায় একই আকারের চেইন কোডগুলি থাকে তবে আপনি দ্বি-মাত্রিক এফএফটি পর্বের পারস্পরিক সম্পর্কের সাথে অনুবাদটি পেতে পারেন http://en.wikedia.org/wiki/Phase_correlation

আপনাকে যদি প্রজেক্টিভ বিকৃতি বিবেচনায় নিতে হয় তবে আপনি কনট্যুরের পরিবর্তে বৈশিষ্ট্য পয়েন্টগুলি (কোণগুলির মতো) ব্যবহারের সম্ভাবনাও বিবেচনা করতে পারেন।


ভাল চেইন কোড কীভাবে তৈরি করবেন? ওপেনসিভি থেকে মেবি কিছু (যতদূর আমি জানি এটিতে কেবল ফ্রিম্যান চেইন রয়েছে)? আপাতত আমি প্রতিটি কনট্যুর পয়েন্ট ব্যবহার করে চেন কোডগুলি তৈরি করছি এবং প্রতিবেশী পয়েন্টের x অক্ষের কোণটি গণনা করছি, তবে সম্ভবত আরও ভাল ধারণা আছে? চেইন সম্পর্কে আপনার যদি কোনও ভাল কাগজপত্রের রেফারেন্স থাকে তবে এটি প্রশংসিত হবে।
krzych

2

প্রশ্নে আপনি বলেন

আমি যেমন বলেছি আমি কিছু অবিশ্বাস্য জিনিস তৈরি করতে চাই

তবে আমি আশঙ্কা করছি সমস্যার একটি "সর্বজনীন" সমাধান খুঁজে পাওয়া বেশ কঠিন।

আপনি বাণিজ্যিকভাবে উপলব্ধ প্যাটার্ন লোকেটার সফটওয়্যারটি কিনতে পারেন এবং এটি আপনার অ্যাপ্লিকেশনটিতে সংহত করতে পারেন, সাধারণত তারা বিভিন্ন অ্যাপ্লিকেশনগুলির জন্য বেশ ভাল সম্পাদন করে। কেবল আপনাকে ধারণা দেওয়ার জন্য এটি এই জাতীয় পণ্যটির জন্য রেফারেন্স ম্যানুয়াল ww

এছাড়াও, আপনি কিছু নির্দিষ্ট ক্ষেত্রে (উদাহরণস্বরূপ আপনার চিত্রের কলমের জন্য) একটি অ্যাডহক সমাধান বিকাশ করতে পারেন।

অন্যথায় আপনি গণনামূলক জ্যামিতির ( http://www.cs.sunysb.edu/~algorith/files/shape-siversityity.shtml ) রুপযুক্ত খুব মৌলিক ভিত্তি থেকে শুরু করে কঠোর সমস্যাটি অধ্যয়ন করতে পারেন , যেখানে আপনার "রূপকগুলি" বলা হয় "বহুভুজ", স্টাফগুলি পড়ার মতো:

এম ডি বার্গ, ও। ডেভিলারস, এম। ক্রেভেল্ড, ও শোয়ার্জকপফ, এবং এম। টিইলাউড। অনুবাদগুলির অধীনে দুটি উত্তল বহুভুজের সর্বাধিক ওভারল্যাপটি গণনা করা হচ্ছে। তাত্ত্বিক কম্পিউটার বিজ্ঞান, 31: 613–628, 1998।

এবং

এইচ। অহন, ও চেওং, সি পার্ক, সি শিন এবং এ। ভিগেরন। কঠোর গতির অধীনে দুটি প্ল্যানার উত্তল সেটগুলির ওভারল্যাপটি সর্বাধিক করা। গণনা জ্যামিতি: তত্ত্ব এবং অ্যাপ্লিকেশন, 37: 3-15, 2007।

এবং "চিত্রগুলিতে যৌগিক অবজেক্টগুলির হায়ারার্কিকাল রিয়েল-টাইম রিকগনিশন অব ইমেজস" সমাপ্ত করে মার্কাস উলরিচ যিনি এমভিটেকের সাথে সহযোগিতা করেন , অন্য একটি সফটওয়্যার হাউজ বিক্রয় অবজেক্ট রিকগনিশন সফ্টওয়্যার সরঞ্জামগুলি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.