কোনও কম্পিউটার ভিশনের অ্যালগরিদমগুলি বিশেষত গভীরতার চিত্রগুলিকে লক্ষ্যবস্তু করে?


9

আমি গতিযুক্ত ভিত্তিক অ্যাপ্লিকেশনটি ব্যবহার করার জন্য চিহ্নিতকরণ সনাক্তকরণ অ্যালগরিদমগুলিতে সন্ধান করছি এবং আমি যে কাজটি সন্ধান করতে পেরেছি তার বেশিরভাগ অংশই 'স্বাভাবিক' চিত্রগুলিতে বৈশিষ্ট্য সনাক্তকরণের উপর স্পষ্টভাবে দৃষ্টি নিবদ্ধ করে।

যাইহোক, কিনটেক্ট হার্ডওয়্যার (মূলত, একবার আপনি সামঞ্জস্য করেছেন) প্রতি পিক্সেল 11-বিট গভীরতার মান সরবরাহ করে।

এই গভীরতার চিত্রটিতে বস্তুর প্রান্তের চারপাশের ছায়া থেকে বিভিন্ন ভিজ্যুয়াল আর্টিক্টসও রয়েছে (উদাহরণস্বরূপ এই ভিডিওতে শক্তিশালী কালো সীমানা দেখুন http://www.youtube.com/watch?v=-q8rRk8Iqww&feature= সম্পর্কিত )।

কিছু traditionalতিহ্যবাহী মেশিন দর্শন কৌশলগুলি (যেমন: প্রান্ত সনাক্তকরণ) এটির সাথে ভালভাবে কাজ করে, অন্যরা তা করে না এবং দেখে মনে হচ্ছে নেট সম্পর্কে এই বিষয়ে আলোচনা করা খুব কমই রয়েছে।

একটি সাধারণ উদাহরণ হিসাবে, গভীরতার মানটি ব্যবহার করা একবার চিহ্নিতকারী ব্লকের অবস্থান সনাক্ত করার পরে এটি তুচ্ছ করে তোলে।

সুতরাং, কেউ কি এমন কোনও আলোচনা / কাগজপত্র / ইত্যাদি দেখেছেন যা বৈশিষ্ট্য সনাক্তকরণের জন্য গভীরতার চিত্রটি প্রক্রিয়াকরণ করে?

"গভীরতা" চিহ্নিতকারী (মুদ্রিত বি / ডাব্লু মার্কার পরিবর্তে কার্যকরভাবে অরিগামি ব্লক) সনাক্ত করার জন্য কেউ কি কোনও ভাল অ্যালগরিদমের সুপারিশ করতে পারেন?

আমি এ পর্যন্ত যা করেছি তা হ'ল চিত্রগুলি প্রক্রিয়া করার জন্য ওপেনসিভি ব্যবহার করে অ্যাডহক পরীক্ষা-নিরীক্ষা করা হয়েছিল, তবে স্থির বা দ্রুতগতির কাছে এটিই নেই।

আপনি যদি কোনও ধরণের পরীক্ষা ছাড়াই বাণিজ্যিক মেশিন ভিশন পণ্যের সাথে লিঙ্ক করেন তবে দয়া করে কেন এটি উপযুক্ত বলে মনে করছেন তা আপনার উত্তরে উল্লেখ করুন।


এর জন্য প্রচুর কাগজপত্র এবং প্রোগ্রাম রয়েছে। দুঃখিত, কম ব্যান্ডউইদথে আরও বিশদে উত্তর দিতে পারবেন না। আরজিবিডেমো অ্যাপ্লিকেশনটি দেখুন, এতে কোনও অবজেক্ট শনাক্তকারী অন্তর্ভুক্ত রয়েছে। এছাড়াও, সফ্টওয়্যারটির জন্য পয়েন্টক্লাউড লাইব্রেরি (পিসিএল), আরওএস, ওপেনসিভি, এবং কাগজগুলির জন্য সম্ভবত গুগল স্কলার। আপনি উল্লেখ করেছেন যে ওপেনসিভি আপনার পক্ষে সন্তোষজনক নয় তবে পিসিএল এবং আরজিবিডেমো হতে পারে।

আমি এমন একটি ডেমো প্রয়োগের সন্ধান করছি না যা আত্মীয়কে দেখায় বা কিছু পিসি ডেমো দেখায় যে কীভাবে কীনােক্ট বা একটি চিত্র প্রক্রিয়াকরণ সরঞ্জামকিট (যেমন ওপেনসিভি) থেকে 3 ডি মডেল তৈরি করা যায়। গভীরতার চিত্রগুলির উপর ভিত্তি করে বৈশিষ্ট্য স্বীকৃতির জন্য আমি অ্যালগরিদমগুলি খুঁজছি ।

আরজিবিডেমো সেই অ্যালগরিদমগুলি প্রয়োগ করে। কোডের জন্য কোড বা রেফারেন্স পড়ুন।

উত্তর:


8

আমার প্রিয় 2.5D / রেজিস্ট্রেশন এবং স্বীকৃতির জন্য 3D বৈশিষ্ট্য বর্ণনাকারী হয় স্পিন ইমেজ (মূল কাগজ + আরও বিস্তারিত পিএইচডি থিসিস এবং সফ্টওয়্যার CMU থেকে পাওয়া)।

অন্যান্য সাম্প্রতিক অগ্রগতি (উপযুক্ত অ্যালগোরিদমের জন্য অন-লাইন অনুসন্ধানযোগ্য) এর মধ্যে রয়েছে: থ্রিডি-সিফ্ট, ফাস্ট পয়েন্ট ফিচার হিস্টোগ্রাম, নরমাল অ্যালাইন্টেড রেডিয়াল ফিচারস (এনএআরএফ), গভীরতা কার্নেল বর্ণনাকারী। পুরানো পদ্ধতিগুলি অঞ্চল প্যাচগুলি সনাক্ত করতে কেবল বক্ররেখা এবং প্রান্তের মতো পৃষ্ঠের বৈশিষ্ট্যগুলি ব্যবহার করে।

কোনটি সেরা? আপনি কী সন্ধান করতে চান তার উপর নির্ভর করে, ভিউপয়েন্টের চালান, অতিরিক্ত গোলমাল ইত্যাদি


7

আপনি সমস্ত মূল শব্দটি ঠিকঠাক পেয়েছেন, আমি অবাক হয়েছি যে উপাদানটির সন্ধানের জন্য আপনি সত্যিই কোনও সম্পর্কিত নিবন্ধটি খুঁজে পান নি।

ভাগ্যক্রমে, আমি আইইইই এক্সপ্লোরের ডিজিটাল লাইব্রেরিতে অ্যাক্সেস পেয়েছি। আমার আগে এই বিশেষ অ্যালগরিদমের কোনও প্রয়োজন নেই, তবে এটি খুব আকর্ষণীয় দেখায় তাই এখানে দ্রুত অনুসন্ধানের কিছু ফলাফল যা আমার মনে হয় প্রাসঙ্গিক হতে পারে (তাদের শিরোনাম অনুসারে তাদের বিচার করবেন না, তাদের বিমূর্তি দেখুন):

দুর্ভাগ্যক্রমে, আমি মনে করি না যে আপনি এই কাগজপত্রের কোনওটিতে অ্যাক্সেস করতে পারবেন, অন্তত আইইইই এক্সপ্লোর লাইব্রেরির মাধ্যমে নয়। আপনার যদি অ্যাক্সেস না থাকে তবে আপনি সম্ভবত গুগল পণ্ডিতের সাথে পেতে পারেন এবং সেখানে কিছু নিখরচায় কাগজের ডাটাবেস রয়েছে ( যখন আমি আইইইই অ্যাক্সেস না পেয়ে মেন্ডেলি ডাটাবেস ফিরে পেয়েছিলাম)। এছাড়াও, কেবল কাগজের বিমূর্ত বা এলোমেলো অংশগুলির গুগলিং অংশগুলি মাঝে মাঝে কিছু ফলাফল দেয় (আপনি নিবন্ধটির প্রায় শেষ সমাপ্ত প্রকাশিত সংস্করণগুলিতে হোঁচট খেতে পারেন)।

উল্লিখিত কাগজপত্রগুলি অনুসন্ধান করার জন্য আমি যে অনুসন্ধান অনুসন্ধানগুলি ব্যবহার করেছি সেগুলি হ'ল : 3 ডি চিত্র , গভীরতার চিত্র , গতিযুক্ত । প্রথম দুটি ক্যোয়ারী সন্ধানের সময় আপনি প্রসেসিংয়ে ফেলে দিতেও পারেন ।

আশা করি এটি কিছু সাহায্য করবে! আমি দুঃখ বোধ করছি আমি আরও বেশি করে সাবজেক্টে উঠতে পারছি না, সত্যিই আকর্ষণীয় মনে হচ্ছে।



@ অ্যাঙ্কট্র্যাক্ট থেকে মানকফ, আমি কেবল কাজটি ট্র্যাকিংয়ে মনোনিবেশ করতে দেখছি এবং মনে হয় এটি খুব বেশি বৈশিষ্ট্য সনাক্তকরণের সাথে সরাসরি তথ্য ব্যবহারে মনোনিবেশ করে। তবে, আমি কেবল বিমূর্তটি পড়েছি, তাই নিশ্চিত নয়।

কাগজের শিরোনামগুলি গুগল করা those কাগজগুলির বেশ কয়েকটির জন্য পিডিএফ সন্ধান করার জন্য যথেষ্ট। আর একটি ভাল উত্স হ'ল সিটিসিয়ার : citeseerx.ist.psu.edu/index কাগজের তালিকার জন্য ধন্যবাদ!
রিথুঙ্ক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.