আমি কীভাবে চিত্রগুলির সেট থেকে 3 ডি কাঠামো পুনর্গঠন করতে পারি?


24

আমার নীচের উপায়ে গোষ্ঠীভুক্ত (লাইন বিভাগগুলির সেট) একটি সেট রয়েছে:

এসআমি={আমি0,আমিπ4,আমি2π4,...,আমি7π4}

কোথায়

  • একটি কংক্রিট অবজেক্টের ফটোগুলি ক্রম বোঝায়। এসআমি
  • একটি চিত্র বোঝাতে সঙ্গেটি (দৃষ্টিকোণ= 0 মানে সামনের দৃশ্য)। আমিটি=0

এখান থেকে উদাহরণ (রিয়ার ভিউ): আমিπ

এখানে চিত্র বর্ণনা লিখুন

প্রদত্ত দিয়ে আমি কীভাবে অবজেক্টের 3 ডি কাঠামো পুনর্গঠন করতে পারি ?এসআমি

কেউ কি আমাকে কিছু কাগজপত্র দেখিয়ে দিতে বা কিছু কীওয়ার্ড দিতে পারেন? আমি জানি যে প্রচুর নিবন্ধ রয়েছে যা পয়েন্টের মেঘের সাথে কাজ করে এবং এগুলি, তবে আমি লাইনগুলি দিয়ে কাজ করছি বলে সেগুলি কাজ করে না।

উত্তর:


20

আসলে এটি বেশ শক্ত বিষয়। ক্লাসিকাল মাল্টি-ভিউ 3 ডি পুনর্নির্মাণটি প্রথম স্থানে পয়েন্ট মিলের সাথে ডিল করে, অর্থাত প্রতি ইমেজে একই পয়েন্টটি সন্ধান করে। প্রতিটি চিত্রের জন্য ক্যামেরা (দর্শন) পরামিতি দেওয়া, মূল 3 ডি পয়েন্টটি পুনর্গঠন করা যায়। (লেজার বা একটি প্রজেক্টর ব্যবহার করে দৃশ্যটি আলোকিত করা যায় যাতে তুলনামূলক সহজে ম্যাচিং করা যায়))

ক্ষেত্রটির বাইবেল হর্টলি এবং জিসারম্যান দ্বারা কম্পিউটার ভিশনে একাধিক ভিউ জ্যামিতি

বইটিতে ট্রাইফোকাল টেনসর সম্পর্কে একটি বিভাগ রয়েছে, যা 3 টি দর্শনের মধ্যে একটি বহুমাত্রিক বাধা। এটিতে কেবল পয়েন্ট নয় তবে লাইন চিঠিপত্রের সীমাবদ্ধতাও রয়েছে। এটি খুব ভালভাবে পুনর্গঠনের জন্য ব্যবহার করা যেতে পারে।

সুতরাং আপনার সংক্ষিপ্তসারগুলি প্রথম স্থানে মিলে যাওয়া উচিত এবং ক্যামেরার প্যারামিটারগুলি জেনে পুনর্গঠন করা যেতে পারে (বইটিতে ক্যামেরা ক্যালিব্রেশনও রয়েছে)। তারপরে আপনার 3 ডি তে কনট্যুর থাকবে তবে এর চেয়ে বেশি কিছুই হবে না। বাস্তব পৃষ্ঠগুলির জন্য আপনাকে ঘন পয়েন্টের মিল করতে হবে। যদিও আমি উল্লিখিত টেনসরটি দেখতে দেখতে ভাল লাগছে এটি সরলরেখার জন্য ব্যবহৃত হয় এবং আমি নিশ্চিত যে একটি আধুনিক গাড়িটি সমস্ত দিকে বাঁকানো রেখা রয়েছে।

আমি জানি না আপনি কীভাবে এই রূপগুলি পেয়েছিলেন তবে আপনি যে চিত্রটি পোস্ট করেছেন তা দেখে আমি সেই অ্যালগরিদমের দৃ the়তা সম্পর্কে যথেষ্ট সংশয়ী, সুতরাং পুনর্নির্মাণটি খুব কম হবে।

আরেকটি পদ্ধতি এটা আমার মন থেকে এসেছে চাক্ষুষ জাহাজের কাঠাম বা স্থান খোদাই । কনট্যুর গণিতও করা উচিত। প্রতিটি কনট্যুরের পদ্ধতিটি চালনা করে আপনি মডেলটি রাখতে পারেন।


π/4

1
প্রজেকশন দ্বারা আপনি কীভাবে অফ-কনট্যুর 3 ডি পয়েন্ট পাবেন তা আমি দেখতে পাচ্ছি না। স্পোর্টসগুলির মধ্যে প্রসারিত এনআরবিএস পৃষ্ঠগুলির সাথে কাজ করার জন্য 3 ডি মডেলিং টেকনিক রয়েছে, তবে আপনাকে তার জন্য বৈশিষ্ট্যযুক্ত স্প্লাইন সরবরাহ করতে হবে। (সম্ভবত কোনও 3 ডি শিল্পী এই প্রসঙ্গে শব্দের বৈশিষ্ট্যটি সংজ্ঞায়িত করতে পারে তবে আমাকে নয়)) আবার আমি মনে করি শেপ-থেকে-কনট্যুর (ভিজ্যুয়াল হলের মতো) আপনার জন্য মোটামুটি মডেল তৈরি করতে পারে। এর পরে আপনি ইমেজগুলির উপর ভিত্তি করে এটি পরিমার্জন করতে পারেন। তবে এর জন্য কোনও মানক উপায় নেই।
বুলেটিন ফডোর

2

যদিও ফডর হার্টলি এবং জিসারম্যান বই উল্লেখ করেছেন তা অবশ্যই ব্যবহারিক অ্যালগরিদমের চেয়ে সাধারণ বোধগম্যতার চেয়ে বেশি পড়ার জন্য উপযুক্ত। এটি বেশ পুরানো এবং এই পদ্ধতিগুলি কার্যকর নয়। আপনার সমস্যা সম্পর্কে - সমস্যাটি গঠন নিজেই খুব অস্বাভাবিক। যেমনটি ফোডোর দ্বারা উল্লিখিত ছিল সংক্ষিপ্তসারগুলির পরিবর্তে ম্যাচের বৈশিষ্ট্য পয়েন্টগুলি দিয়ে শুরু করা আরও অনেক সহজ। পয়েন্টগুলির ক্ষেত্রে উপলভ্য আধুনিক পদ্ধতির একদম সেরা ওভারভিউ হ'ল পেইজটি ট্রাইজেস "বান্ডেল অ্যাডজাস্টমেন্ট - একটি আধুনিক সংশ্লেষ" তবে বান্ডিল সমন্বয় ব্যবহারের আগে আপনার সিফ্টের বা টেমপ্লেট । 3D পুনর্গঠনের জন্য গুগল মতো কিছু সম্পূর্ণ পদ্ধতির উদাহরণের সাথে চিত্রগুলিতে মিলিত পয়েন্ট থাকবে । আপনি এর জন্য ওপেন সোর্স প্যাকেজগুলিও ব্যবহার করতে পারেন, বেশ কয়েকটি উপলব্ধ।

আপনি যদি কনট্যুর ব্যবহারের জন্য জেদ করেন তবে সমস্যাটি আরও অনেক কঠিন, যদিও এখনও (সবে) ট্র্যাকটেবল। প্রথমে আপনি সমস্ত চিত্রগুলিতে সম্পর্কিত কনট্যুরগুলি সনাক্ত করতে এবং মেলাতে পারবেন, তারপরে ব্যয়টি লিখুন - প্রতিটি চিত্রের ক্যামেরার অবস্থান এবং অরিয়েন্টেশন থেকে ফাংশন হিসাবে প্রতিটি মিলিত রূপক গোষ্ঠীর জন্য প্রত্যাখ্যান ত্রুটির যোগফল sum এরপরে ক্যামেরার অবস্থানের সেটটি সন্ধান করুন যা এই ব্যয়টির কার্যকারিতা হ্রাস করে। এই প্রক্রিয়াটির প্রতিটি পদক্ষেপ অত্যন্ত কঠিন, এবং ট্রিগসের মতো ভাল ওভারভিউ নেই। "সংশ্লেষ" "" বান্ডেল সামঞ্জস্য "" পুনরায় প্রত্যাখ্যান ত্রুটি "" "3 ডি পুনর্নির্মাণ" এর শর্তগুলির সংমিশ্রণ হিসাবে আপনি কিছু প্রাসঙ্গিক কাগজগুলি গুগল করতে পারেন।


যদিও এটি সিফটি-এর মতো বৈশিষ্ট্যগুলি নির্ধারণ করতে সহজতর সমস্যা রয়েছে যে আমার ডোমেনের সিফটি প্রায়শই চকচকে গাড়ির পৃষ্ঠায় ছায়া / প্রতিচ্ছবি আঁকায়, তাই এসআইএফটিটি ব্যবহার করে আমি প্রচুর পরিমাণে শব্দের বৈশিষ্ট্যগুলি পেয়ে যাচ্ছি যা কোনও বাস্তবের উপর নির্ভর করে না গাড়ির আকৃতি তাই আমার নির্ভুলতা হ্রাস পেয়েছে।
ওম-নাম-মনোনীত

আপনি যদি গাড়ীর দিকে তাকিয়ে থাকেন জানেন তবে আপনি মডেল-ভিত্তিক পদ্ধতির চেষ্টা করতে পারেন। জেনেরিক গাড়ি মডেলকে প্যারামিট্রাইজ করুন এবং সমস্ত চিত্র পিক্সেল ব্যবহার করে ছবিতে এটি ফিট করার চেষ্টা করুন। ক্যামেরা পরামিতি এবং গাড়ী মডেল প্যারামিটারের ফাংশন হিসাবে ব্যয় ফাংশন লিখুন এবং এটি হ্রাস করুন। এটি কাজ করতে পারে (বা নাও পারে) - আপনার মনে হয় বেশ সমস্যা আছে।
আয়না

দুর্ভাগ্যক্রমে, আপনি কী করার প্রস্তাব দিয়েছিলেন তা আমি বুঝতে পারি নি। দয়া করে কিছু উদাহরণ সরবরাহ করুন (এটি বাহ্যিক নিবন্ধ, সম্পর্কিত কাজ বা এরকম কিছু হতে পারে)।
ওম-নাম-মনোনীত

আমি বলতে চাচ্ছি সক্রিয় আকৃতি মডেল en.wikipedia.org/wiki/Active_shape_model বা somethings imilar
mirror2image

2

চিত্রগুলি থেকে মডেল পুনর্গঠন দেখুন যা আপনি যা করছেন তার থেকে কিছুটা আলাদা তবে আমি কীভাবে চিত্রগুলি থেকে 3 ডি মডেলের দিকে যেতে পারি সে সম্পর্কে কথা বলি। মেশল্যাবও পরীক্ষা করে দেখুন , এতে কিছু পুনর্নির্মাণ অ্যালগরিদম রয়েছে যাতে আপনি নিজের ডেটা ফিড করতে সক্ষম হতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.