একটি ভরা কাচের বস্তু সনাক্ত করা হচ্ছে


10

আমাকে এই প্রশ্ন থেকে স্ট্যাকওভারফ্লোতে প্রেরণ করা হয়েছে , যদি প্রশ্নটি খুব নির্দিষ্ট হয়ে আসে এবং দয়া করে এখানে বিন্যাসে না থাকে তবে দয়া করে ক্ষমা করবেন use

কাজটি এটিতে নির্দিষ্ট তরলযুক্ত একটি গ্লাস খুঁজে পাওয়া। আমি আপনাকে ছবিগুলি দেখাব এবং তারপরে বর্ণনা করব যে আমি কী অর্জন করতে চাইছি এবং কীভাবে আমি এখন পর্যন্ত ছবিগুলির নীচের বিবরণে অর্জন করার চেষ্টা করছি।

ছবিগুলি : (মনে হচ্ছে ছবি ও লিঙ্কগুলি পোস্ট করার জন্য আমার কমপক্ষে 10 খ্যাতি দরকার, তাই লিঙ্কগুলি করতে হবে :( অন্যথায় আপনি স্ট্যাকের ওভারফ্লো প্রশ্নটি দেখতে পারেন)

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

এখানে চিত্র বর্ণনা লিখুন

একটি বিশদ বিবরণ : আমি একটি অ্যালগরিদম বাস্তবায়নের চেষ্টা করছিলাম যা ওপেনকভিতে একটি নির্দিষ্ট আকারের একটি গ্লাস সনাক্ত করবে (গ্লাসটি কোনও ভিন্ন ক্যামেরার শট কোণ / দূরত্বে রূপান্তরিত হতে পারে)। অন্যান্য আকারের অন্যান্য চশমাও থাকবে। আমি যে গ্লাসটি অনুসন্ধান করছি তাতে কিছু রঙিন তরলও ভরাট হবে যা এটি অন্যান্য রঙযুক্ত চশমা থেকে আলাদা করবে।

এখনও অবধি, আমি কাঁচের কয়েকটি বৈশিষ্ট্য সন্ধান করার জন্য SIFT বৈশিষ্ট্য নিষ্কর্ষকটি ব্যবহার করার চেষ্টা করেছি এবং তারপরে এটিতে থাকা কাচের সাথে অন্যান্য ফটোগুলির সাথে সেগুলি মেলে।

এই পদ্ধতিটি কেবলমাত্র খুব নির্দিষ্ট অবস্থাতেই কাজ করেছিল যেখানে আমার খুব নির্দিষ্ট অবস্থানে কাচ থাকবে এবং পটভূমিটি শেখার চিত্রগুলির মতো হবে। সমস্যাটি হ'ল কাঁচটি 3 ডি অবজেক্ট এবং আমি কীভাবে সেই বৈশিষ্ট্যগুলি বের করতে জানি না (কোনও কোনও ভাবে সংযুক্ত-ভিন্ন ভিন্ন কোণ থেকে একাধিক ফটো?)।

এখন আমি জানি না যে আমি কী ব্যবহার করতে পারি। আমি এ সম্পর্কে কিছু সংকেত পেয়েছি (এখানে /programming/10168686/algorithm-improvement-for-coca-cola-can-shape-regnifications#answer-10219338 ) তবে লিঙ্কগুলি ভাঙ্গা মনে হয়েছে।

অন্য সমস্যাটি হ'ল এই জাতীয় কাচের বিভিন্ন "শূন্যতার মাত্রা" সনাক্ত করা, তবে আমি নিজেও গ্লাসটি সঠিকভাবে খুঁজে পেতে সক্ষম হইনি।

এই কার্যক্রমে আপনার প্রস্তাবনাগুলি কী হবে? স্থানীয় 3 ডি অবজেক্ট বৈশিষ্ট্যটি খুঁজে পাওয়ার জন্য কি অন্য কোনও উপায়ে ব্যবহার করা ভাল? না কি অন্য পদ্ধতির সম্পূর্ণ ব্যবহার করা ভাল? আমি একাধিক ফটোগুলির সেট থেকে অ্যালগরিদমগুলি "শেখার" বিষয়ে শুনেছি তবে বাস্তবে আমি এটি কখনও দেখিনি।

কোন পরামর্শ সত্যিই প্রশংসা করা হবে


সি # তে সম্পূর্ণ উত্স কোড নমুনা সহ কোনও চূড়ান্ত সমাধান?
কুইকিনেট

বাহ এটা বেশ একটি নির্দিষ্ট অনুরোধ। সমস্যার এখনও সমাধান নেই এবং আমি এটি সমাধানে আরও বেশি সময় বিনিয়োগ করব না। আমি বিশ্বাস করি, এখানে উল্লিখিত কাগজ দ্বারা বিচার করে, যে বৈজ্ঞানিক ভিত্তিতে খুব শীঘ্রই কোনও সমাধান হবে না, কারণ প্রস্তাবিত অ্যালগরিদমের খুব কম নির্ভুলতার হার ছিল। যাইহোক, এই প্রকল্পটি যেহেতু আমার কাজের জন্য, তাই আমি ক্লায়েন্টের সাথে সমঝোতার বিষয়ে বিতর্ক শেষ করেছিলাম, কারণ টাস্কটি এখনকার দিনগুলি সম্পূর্ণ করার পক্ষে অবাস্তব। "কাপের মতো দেখায় এমন কিছু" এর জন্য কিছু নিয়মিত হর-জাতীয় বৈশিষ্ট্য সনাক্তকারী ব্যবহার করেছেন এবং তারপরে বিয়ার সনাক্ত করতে হলুদ রঙ নির্বাচন করেছেন। আসল কাজটি নয়
ব্যবহারকারী 1916182

উত্তর:


2

আপনার লিঙ্কে উল্লিখিত কাগজটি মনে হচ্ছে এটি একটি।

বিশেষ আগ্রহের মধ্যে সারণি 1 রয়েছে (নীচে অন্তর্ভুক্ত)। নির্ভুলতার হারগুলি দুর্দান্ত নয়, যদিও তারা অন্যান্য পদ্ধতির চেয়ে ভাল।

এখানে চিত্র বর্ণনা লিখুন


0

হয়তো এই কাগজ আপনাকে সহায়তা করতে পারে: http://ai.stanford.edu/~ang/papers/iros09-ScalableLearningObjectDetectionGPU.pdf

যদিও তারা গভীরতর চিত্রগুলি অর্জনের জন্য 2D চিত্রের পাশাপাশি সক্রিয় স্টেরিও সিস্টেমটি ব্যবহার করে, তারা কীভাবে প্যাচ-ভিত্তিক বৈশিষ্ট্যগুলি ব্যবহার করে, অনেক ছোট ছোট টুকরো টুকরো করে বস্তুর একটি অভিধান তৈরি করে এবং পরে শ্রেণিবদ্ধকারীকে প্রশিক্ষণ দেয় তা আকর্ষণীয়। আপনার সনাক্তকরণের হার উন্নত করতে আপনি এই বৈশিষ্ট্যগুলি যুক্ত করতে পারেন।


আমি মনে করি না এই কাজটি বন্য প্র্যাক্সিসগুলিতে খুব ভালভাবে ব্যবহার করা যেতে পারে। কাগজে বর্ণিত রোবটটির গভীরতার তথ্য সনাক্ত করার জন্য গভীরতার সেন্সর প্রয়োজন ... সেলফোন বা কোনও কিছুর এলোমেলো ছবি তোলার সময় কোনও কিনেক্ট বহন করা খুব ব্যবহারিক নয় ... তবে হ্যাঁ, প্যাচ ভিত্তিক বৈশিষ্ট্যগুলি খুব আকর্ষণীয় পদ্ধতির!
ব্যবহারকারী 1916182

-1

ফেসিয়াল রিকগনিশন সফ্টওয়্যার এর কথা এলে এখানে অনেক কাজ করা হয়েছে। উদাহরণস্বরূপ, আপনি যদি ফেসবুকে লক্ষ্য রাখেন যে ফটোগুলি ট্যাগ করার সময় মুখগুলির অবস্থানটি বক্স করা এবং আপনাকে প্রস্তাব দেওয়া হয়।

আমি নিউরাল নেটওয়ার্ক ব্যবহার করে ছবিগুলিতে মুখের স্বীকৃতি নিয়ে প্রচুর সাহিত্য দেখেছি এবং একটি দ্রুত গুগল অনুসন্ধান নিঃসন্দেহে এই বিষয়ে বিশাল পরিমাণের তথ্য সরিয়ে দেবে। এই নেটওয়ার্কগুলি ইনপুট হিসাবে চিত্রের পিক্সেল নেয়। আপনার ক্ষেত্রে, অস্বচ্ছতার পরিবর্তন / আলো কাচের থেকে প্রতিবিম্বিত হওয়ার ফলে নেটওয়ার্কটি শিখতে পারে এমন বৈশিষ্ট্যগুলি হতে পারে।

একটি সমস্যা হ'ল প্রশিক্ষণের ডেটা এবং এগুলির প্রাক-প্রক্রিয়াজাতকরণ হিসাবে আপনার যে সমস্ত ফটো ব্যবহার করতে হবে তার সংখ্যা (যেমন মুখগুলি নিজেকে চিহ্নিত করুন)। আপনার নেটওয়ার্ককে যথেষ্ট প্রশিক্ষণের জন্য পর্যাপ্ত চিত্রের জন্য যদি এটি করা অসম্ভব হয় তবে আপনাকে শেখার পর্যায়ে কিছু শর্টকাট সন্ধান করতে হবে। এই কাগজটি আপনি যা করতে চান তার সাথে প্রাসঙ্গিক: http://www.ll.mit.edu/ প্রজাতন্ত্র / জার্নাল / pdf / vol04_no2 / 4.2.5.neuranetwork.pdf

ভাগ্যক্রমে এটি একটি খুব সক্রিয় ক্ষেত্র এবং এই ধরণের সমস্যার জন্য প্রয়োজনীয় কোডের বেশিরভাগটি অনলাইনে সহজেই উপলব্ধ।

একবার আপনি চিত্রগুলিতে চশমা সনাক্ত করতে সক্ষম হয়ে গেলে সেখান থেকে আরও বিশ্লেষণ করতে পারেন perform


এটি সম্পূর্ণ অপ্রাসঙ্গিক
ব্যবহারকারী 1916182

আকর্ষণীয় আপনার এটি বলা উচিত। যাইহোক এখানে নিউরাল নেটওয়ার্কগুলির উপর ভিত্তি করে ফেসবুক দ্বারা ব্যবহৃত সনাক্তকরণ আলগোরিদিমগুলির একটি লিঙ্ক। শুভকামনা, github.com/facebookresearch/tetectron
রোলস্ট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.