ডিপ নিউরাল নেটওয়ার্ক ব্যবহার করে অবজেক্টের আকার পরিমাপ করা


10

আমার দৈর্ঘ্যের স্থল সত্যের সাথে 100 টি যানবাহনের বড় ডেটাসেট রয়েছে (100k এরও বেশি নমুনা)। গাড়ির দৈর্ঘ্য পরিমাপ / অনুমান করার জন্য কি কোনও গভীর নেটওয়ার্ককে প্রশিক্ষণ দেওয়া সম্ভব? আমি গভীর নিউরাল নেটওয়ার্ক ব্যবহার করে অবজেক্ট সাইজের অনুমান সম্পর্কিত কোনও কাগজপত্র দেখিনি।


1
খুব ভাল প্রশ্ন। এআই তে আপনাকে স্বাগতম!
ডিউকঝৌ

(মডারেটরের কাছে নোট) - এটি ওপিকে একটি প্রশ্ন জিজ্ঞাসা করার জন্য একটি স্থানধারকের উত্তর, যেহেতু আমি মন্তব্য করতে পারি না আপনার ডেটা চিত্র বা টেক্সট সেট করে? hisairnessag3 ওপেনসিভি থেকে কোনও বস্তু সনাক্তকরণ ডিএনএন
আদনান এস

উত্তর:


4

হ্যাঁ! এটি অবশ্যই করা যেতে পারে। আপনার যেহেতু একটি লেবেলযুক্ত ডেটাসেট রয়েছে, এটি এটিকে আরও সহজ করে তোলে!

আমি এই প্রকল্পটি একবার দেখে নেব এবং আপনাকে কোথায় যেতে হবে তা আপনাকে পাওয়া উচিত।

বাস্তবায়ন বিশদটি বেশ সহজবোধ্য হওয়া উচিত। আমি যদি আরও সাহায্য করতে পারি তবে আমাকে জানান।


1
কেউ কেন ভোট দিচ্ছেন তা ব্যাখ্যা করার দরকার নেই। অনেক প্রোগ্রামারদের মন্তব্যগুলি দেখার জন্য পর্যাপ্ত সময় নেই, তারা ভোটের দিকে তাকান যে উত্তরটি মূল্যবান কিনা তা দেখার জন্য। আপনি যদি আবার প্রশ্নটি পড়ে থাকেন তবে আপনি দেখতে পাবেন যে প্রশ্নটি বিশেষত ডিএনএন ব্যবহার সম্পর্কে এবং অন্য কিছু নয়। আপনার ভাগ করা প্রকল্পটি ওপেনসিভি ব্যবহারের বিষয়ে ... আপনি যদি ভাগ করেছেন সেই পোস্টের নীচে মন্তব্যগুলি পড়েন তবে আপনি দেখতে পাবেন যে লোকেরা ডিএনএন সম্পর্কে জিজ্ঞাসা করছে, তবে পোস্টটি নিজে ডিএনএন ব্যবহার করে না। যাইহোক আমি সেই ব্যক্তি নই যিনি আপনার উত্তরটি ভোট দিয়েছিলেন
BH85

2
এটি প্রয়োজনীয় নয় তবে সহায়ক। আপনি যদি কোনও গভীরতার দিকে অনুসন্ধান করেন তবে ডিএনএনগুলির জন্য এই বিশেষ ব্যবহারের ক্ষেত্রে কোনও প্রকল্প বা কাগজপত্র পাবেন না। এটি বলা হওয়ার সাথে সাথে, ওপি শুরু হওয়ার আশায় আমি নিকটতম সম্ভাব্য প্রকল্পটি উল্লেখ করেছি। অতিরিক্তভাবে, আমি প্রশ্নের উত্তর দিয়েছি। প্রশ্ন ছিল এটি করা যেতে পারে।
hisairnessag3

আপনার উত্তরের জন্য ধন্যবাদ! আমি মনে করি এটি কীভাবে / কেন সম্ভব তার সামান্য ব্যাখ্যা দিয়ে এটি উন্নত হবে। কমপক্ষে স্থাপত্যের একটি রূপরেখা খুব সহায়ক হবে।
বেন এন

1

হ্যাঁ এটি সম্ভব, তবে প্রথমে আপনাকে চিত্রের কিছু বস্তু সনাক্ত করতে হবে , হয় 1) যানবাহন নিজেই, এবং তারপরে সেই গাড়ির পরিচিত আকার বা 2) ক্যামেরার থেকে একই দূরত্বে একটি অজানা অবজেক্টটি ( একটি কর্কট, একটি স্টপ সাইন, ড্রাইভারের মাথা, একটি শিটল্যান্ড পোনি ... যাই হোক না কেন) এবং তারপরে গাড়িটির খুব কাছাকাছি যে আকারটি আছে তা ক্রমাঙ্কিত করতে সেই জিনিসটি ব্যবহার করুন।

কোনও ছবিতে থাকা কোনও গাড়ি ক্যামেরা থেকে অজানা দূরত্বের হবে, যার ফলে গাড়ির অবজেক্টটি ফটো থেকে ফটোতে আরও বড় বা ছোট প্রদর্শিত হবে। আপনি যদি গাড়িটি চিনেন না বা একটি পরিচিত আকার রয়েছে এমন কমপক্ষে কোনও পৃথক বস্তু, গাড়িটির শারীরিক আকার অব্যবহৃত হবে - আপনার আকারের অনুমানের কোনও ভিত্তি আপনার নেই।

গাড়িটি যদি অজানা থাকে, তবে আপনার ভিজ্যুয়াল ক্লুগুলি থাকলেও (এখানে কোনও আলাদা জিনিস উপস্থিত রয়েছে বা ক্যামেরা থেকে গাড়ীর দূরত্ব জানা যায়), ক্যামেরার লেন্সের প্রশস্ত কোণ-নেসের অজানা পরিমাণ অজানা গাড়ির আকারটি বিকৃত করতে পারে (উচ্চতা বনাম প্রস্থ), এর আপাত মাত্রাগুলি অনুমান করার ক্ষমতাটিকে আরও জটিল করে তোলে।


গাড়ির লাইসেন্স প্লেটটি কি সেই পরিচিত জিনিস হতে পারে যা গাড়ির আকারটি ক্রমাঙ্কণ করতে ব্যবহৃত হত? লাইসেন্স প্লেটগুলি সাধারণত একই আকারের হয়।
নাজি

1
লাইসেন্স প্লেটগুলি একই আকারের যে অনুমানগুলি তৈরি করে থাকে সে সম্পর্কে আপনাকে যত্নবান হতে হবে। উদাহরণস্বরূপ, একটি অস্ট্রেলিয়ান প্লেট এবং মার্কিন প্লেট বিভিন্ন আকারের। এটি যদি আপনার অ্যাপ্লিকেশনটির জন্য সমস্যা না হয় (এটি কেবল কখনও এক দেশে চলবে), আপনি প্লেটের জন্য একটি রেফারেন্স আকার ধরে নিতে পারেন। যদিও আপনাকে এখনও যত্নবান হতে হবে, কারণ প্লেটটি সাধারণত আপনার দিকে মনোনিবেশ করে না। গাড়িটি যদি 45 ডিগ্রি তে থাকে তবে প্লেটের প্রস্থটি 0 0 এর চেয়ে কম দূরত্বেও কম পিক্সেল নিতে পারে।
pshlady

1

আমি মনে করি এই কাগজটি আপনাকে সহায়তা করতে পারে: ডিপ লার্নিং এবং জ্যামিতি ব্যবহার করে 3 ডি বাউন্ডিং বক্স অনুমান

তিনি গাড়ির আকার জানতে শিখতে 1 ভিজিজি -19 (ইমেজনেটে ​​পূর্বনির্ধারিত) ব্যবহার করেছেন


আপনার মতোই, আমি ধরে নিয়েছি এটি একটি 3 ডি বাউন্ডিং বাক্সটি অনুমান করা সম্পর্কে যেখানে ডেটা 2D চিত্রে উপস্থাপন করা হয়। Hisairnessag3 দ্বারা উল্লিখিত প্রকল্পটিতে কেবলমাত্র 2D বাউন্ডিং বাক্সটিকে সম্বোধন করতে দেখা যায় যা 3 ডি প্রকৃতির সম্পর্কে কোনও শিখে নেওয়া অনুমানমূলক আচরণ নয় যা ছবিতে থাকতে পারে।
জিম

এই কাগজটি 2D ক্রপযুক্ত চিত্র (কেবলমাত্র পছন্দসই জিনিসটি ধারণ করে) ব্যবহার করে গাড়ির আকার এবং অরিয়েন্টেশন অনুমান করে।
ক্রিএক্স ডিএসএ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.