ধরা যাক আমার কাছে 5 টি চিহ্নিতকারী রয়েছে। আমি এটিআরটুলকিটের মতো একটি বাড়ানো রিয়েলিটি ফ্রেমওয়ার্ক ব্যবহার করে প্রতিটি চিহ্নিতকারীগুলির মধ্যে আপেক্ষিক দূরত্বগুলি সন্ধান করার চেষ্টা করছি । আমার ক্যামেরা ফিডে আপনাকে প্রথমে 20 ফ্রেমগুলি আমাকে প্রথম 2 টি চিহ্নিতকারী দেখায় যাতে আমি 2 টি চিহ্নিতকারীগুলির মধ্যে রূপান্তরটি কাজ করতে পারি। দ্বিতীয় 20 ফ্রেম আমাকে কেবল 2 য় এবং 3 য় চিহ্নিতকারী দেখায় এবং আরও অনেক কিছু। শেষ 20 ফ্রেমগুলি আমাকে 5 তম এবং 1 ম চিহ্নিতকারী দেখায়। আমি সমস্ত 5 টি চিহ্নিতকারী চিহ্নিতকারী অবস্থানের একটি 3 ডি মানচিত্র তৈরি করতে চাই।
আমার প্রশ্ন হ'ল ভিডিও ফিডের নিম্নমানের কারণে দূরত্বগুলির সাথে ভুল ব্যবহার হবে তা জেনে আমি কীভাবে সংগ্রহ করেছি সমস্ত তথ্য প্রদত্ত ভুলত্রুটি কীভাবে কমিয়ে আনব?
আমার নির্বোধ দৃষ্টিভঙ্গিটি হ'ল প্রথম চিহ্নিতকারীটিকে বেস পয়েন্ট হিসাবে ব্যবহার করা হবে, প্রথম 20 ফ্রেম থেকে ট্রান্সফর্মেশনগুলির গড় গ্রহণ করা এবং ২ য় মার্কার স্থাপন করা এবং তৃতীয় এবং চতুর্থ স্থানের জন্য এগিয়ে রাখা। 5 তম চিহ্নিতকরণের জন্য এটি 5 তম এবং 1 ম এবং চতুর্থ এবং 5 তম মধ্যে রূপান্তরগুলির মাঝামাঝি রেখে এটি 4 এবং 1 ম এর মধ্যে স্থাপন করুন। আমি মনে করি এই পদ্ধতির প্রথম মার্কার প্লেসমেন্টের দিকে পক্ষপাত রয়েছে যদিও ফ্রেম প্রতি 2 টিরও বেশি মার্কার দেখতে ক্যামেরাটিকে বিবেচনা করে না।
শেষ পর্যন্ত আমি চাই যে আমার সিস্টেমটি এক্স সংখ্যার চিহ্নিতকারীর মানচিত্রটি কার্যকর করতে সক্ষম হয়। প্রদত্ত যে কোনও ফ্রেমে এক্স পর্যন্ত মার্কার উপস্থিত হতে পারে এবং চিত্রের মানের কারণে অ-সিস্টেমিক ত্রুটি রয়েছে।
এই সমস্যার সঠিক দৃষ্টিভঙ্গি সম্পর্কিত যে কোনও সহায়তা প্রশংসিত হবে।