লোকেরা কেন রোবট নেভিগেশনের জন্য লেজার সেন্সরের পরিবর্তে ক্যামেরা ব্যবহার করে?


11

আমি শহুরে পরিবেশে রোবট স্থানীয়করণ এবং নেভিগেশনে কাজ করছি। আমি ক্যামেরা ব্যবহার করতে চাই তবে আমি এলআরএফ ডেটা বা অন্যান্য লেজার ডেটা সম্পর্কে কিছুটা বিভ্রান্ত।

লোকেরা কেন ক্যামেরা ব্যবহার করতে চায়?

এলআরএফ বা অন্যান্য লেজার ডেটা কেন নয়?

কেউ কি ক্যামেরার পক্ষে দয়া করে ব্যাখ্যা করতে পারবেন?

উত্তর:


15

গুগল কারের মতো একটি 3 ডি লেজার রেঞ্জ সন্ধানকারী বা LIDAR ক্যামেরার চেয়ে অনেক বেশি ব্যয়বহুল। অন্য কারণটি হ'ল যখন LIDAR এর ক্ষেত্রে প্রতিটি পিক্সেলের দূরত্ব পাওয়া যায়, তখন প্রক্রিয়া করার জন্য উত্পন্ন ডেটা প্রচুর। আপনাকে ডেটা দ্রুত স্থানান্তর এবং প্রসেস করতে হবে যা ক্রমবর্ধমান ব্যয় হিসাবে আবার আসে। শেষ অবধি ক্যামেরাগুলির সাধারণত দীর্ঘকালীন জীবনকাল থাকে, তাই কম রক্ষণাবেক্ষণের প্রয়োজন হয়।

তুলনামূলক কম সস্তা ক্যামেরা এবং কম্পিউটার ভিশন সহ, বেশ ভাল ফলাফল অর্জন করা যায়।

উদাহরণ:

  1. অবজেক্ট সনাক্তকরণ (দ্রষ্টব্য যে কোনও ব্যক্তির টানা স্যুটকেসটি লাল রঙে হাইলাইট করা হয়নি)।
  2. অনুসরণকরণ

3
ব্যয় একেবারে উত্তর। কোয়ালিটি লেজার স্ক্যানারগুলি (শেষ ব্যবহারকারীর জন্য) প্রায় 10,000 ডলার প্রায় শুরু হয়। গুণমানের ক্যামেরাগুলি ব্যয়ের প্রায় দশমাংশ।
চক

1
আপনি LIDAR কি ধরণের সম্পর্কে ভাবছেন? আমি এমন একটি ব্যবহার করেছি যা প্রতি স্ক্যানে প্রায় 1000 পয়েন্ট প্রত্যাবর্তন করেছিল (2D বিমানের উপরে), তবে একটি সাধারণ আধুনিক ক্যামেরা লক্ষ লক্ষ পিক্সেল দেয়, যা আরও অনেক তথ্য।
ব্যবহারকারী 253751

2
@ এমমিবিস - ভেলোডেন ভিএলপি -16 16 প্লেন জুড়ে প্রতি সেকেন্ডে প্রায় 300k পয়েন্ট করে, এবং সিক এলএমএস 511 1 প্লেন জুড়ে প্রতি সেকেন্ডে প্রায় 50k পয়েন্ট করে। ভিএলপি -১ এর ৩ 360০ ডিগ্রি দেখার ক্ষেত্র রয়েছে এবং এটি প্রায় ৮ কিলোমিটার, এলএমএস 511 -র 190 ডিগ্রি মতামত রয়েছে এবং এটি 10 ​​কিলোমিটারের মতো, তবে শিল্প ব্যবহারের জন্য রাগডাইজড। এগুলি দূরত্বের পরিমাপ , ছবি নয়। ক্যামেরাগুলি অবশ্যই একটি উচ্চতর রেজোলিউশন ফিরিয়ে দিতে পারে, তবে সাধারণত স্টেরিও ইত্যাদিতে এত উচ্চতর ফায়ারপাওয়ার লাগে যে ফ্রেমগুলি খুব কম রেজোলিউশন বিঅ্যান্ডডাব্লুতে ডাউন স্যাম্পলড হয় বা রিফ্রেশের হার খুব কম থাকে।
চক

1
সুতরাং প্রতি সেকেন্ডে 300 মিলিয়ন পয়েন্ট, বনাম 50 মিলিয়ন-ইশ পিক্সেল প্রতি সেকেন্ড। ক্যামেরায় স্থানান্তর করার জন্য আরও ডেটা রয়েছে। অবশ্যই উভয় ক্ষেত্রেই আপনি ডেটা / ডাউনসাম্পলটি বাতিল করতে পারেন যদি আপনি এগুলির সমস্ত দ্রুত প্রক্রিয়া করতে না পারেন।
ব্যবহারকারী 253751

4

বেনসের উত্তরের সেই পয়েন্টগুলি ছাড়াও, ক্যামেরাগুলি:

  • অনেক জটিল বৈশিষ্ট্য গণনা করুন যার ফলশ্রুতি ফ্রেম এবং অবজেক্টের স্বীকৃতিগুলির মধ্যে খুব শক্তিশালী মিল রয়েছে
  • উচ্চ কৌণিক রেজোলিউশন (টিপিক্যাল কম> উচ্চ পরিসীমা থেকে যায় -> 0.025 )0.50.025
  • লোয়ার পাওয়ার ব্যবহার
  • প্যাসিভ সেন্সর (কোনও লেজারের 'ক্লিন' সিগন্যালের প্রয়োজন হয় না)

3

শহুরে পরিবেশে নেভিগেশন

লেজারের উপর নির্ভর করে আপনি যেখানে এটি ব্যবহার করতে পারেন সেখানে আইনী বাধা থাকতে পারে। চারপাশে শহরে লেজার রশ্মি ছুড়তে বিশেষ অনুমতি / লাইসেন্সের প্রয়োজন হতে পারে।


5
অবশ্যই, লেজারের উপর নির্ভর করে । তবে আমরা এখানে স্টারশিপ অস্ত্র সম্পর্কে কথা বলছি না। বারকোড স্ক্যানার ব্যবহার করার জন্য আপনার অনুমতি বা লাইসেন্সের দরকার নেই for
ডেভিড রিচার্বি 4'16

বেশিরভাগ বাণিজ্যিক এলআরএফ (ভেলোডেন, হোকুইও) ক্লাস 1 লেজার ব্যবহার করে এবং তারা সম্পূর্ণ নিরাপদ। গুগল, উবার ইত্যাদি ইতিমধ্যে এই জাতীয় এলআরএফ ইনস্টল করে বাইরে তাদের প্রোটোটাইপগুলি পরীক্ষা করছে। আমি সত্যই মনে করি না যে তাদের আইনী বিভাগটি ক্ষুব্ধ বাবা-মায়ের অভিযোগের সাথে
জড়িয়ে পড়েছে

2

ইতিমধ্যে উত্তর হিসাবে অন্যান্য। ক্যামেরা সাধারণত অনেক তুলনায় সস্তা এল আশের আর Ange এফ inders।

আপনি যখন ক্যামেরা সম্পর্কে কথা বলতে চান তখন বোঝায় 2D ক্যামেরা তাই না? এখানে কিছু 3 ডি ক্যামেরা রয়েছে যেমন আইএমএম ও 3 ডি 3 এক্স ক্যামেরার পরিবার পাওয়া যায়। এই ক্যামেরাটির কোনও লেজার স্ক্যানারের যথাযথতা নাও থাকতে পারে তবে তারা যুক্তিসঙ্গত ফ্রেমের হারে 3 ডি গভীরতার ডেটা সরবরাহ করে ~ 1k এর মূল্যে


1

একটি স্ট্যান্ডার্ড আরজিবি ক্যামেরা বনাম এসএমএলএর জন্য লিডার ব্যবহার করার কোনও সুবিধা আছে কি?

আপনি এই লিঙ্কটি পরীক্ষা করতে পারেন যেখানে আমি আগে কিছুটা অনুরূপ প্রশ্নের উত্তর দিয়েছি। (প্রত্যেকের সুবিধা এবং অসুবিধা)

শহুরে পরিবেশে

আপনি যদি গুগলের মতো স্বায়ত্তশাসিত গাড়িগুলি উল্লেখ করছেন তবে প্রচুর বিবেচনা এবং সীমাবদ্ধতা রয়েছে (সুরক্ষা, ব্যয় ইত্যাদি)।

আপনি যদি গবেষণা এবং শেখার বিষয়ে আগ্রহী হন তবে আমি প্রস্তাব দিচ্ছি যে আপনি যে কোনও হার্ডওয়্যার প্ল্যাটফর্ম উপলব্ধ use

মনে রেখ:

  1. অত্যন্ত ব্যয়বহুল একটি LIDAR সহ একটি গাড়ি সহজে বিক্রি করা যাবে না।
  2. একটি গাড়ি স্বায়ত্তশাসিতভাবে মানুষের চারপাশে চলাচল করছে, ভুলের ক্ষেত্রে মারা যেতে পারে। সুতরাং গবেষণা এবং শেখার স্বার্থে আলগোরিদিম বিকাশের চেয়ে বিবেচনাগুলি ভিন্ন।

0

আমি মনে করি না লোকেরা কেবলমাত্র ক্যামেরা ব্যবহার করতে "সত্যই" চায়। যদি প্রতিটি গবেষক লিডারকে বহন করতে পারে তবে তারা সবাই বাইরের পরিবেশের জন্য রোবটগুলিতে LiDARs লাগিয়ে দিত।

ক্যামেরাগুলি বেশ সস্তা এবং পিক্সেল / সুপারপিক্সেল রেজোলিউশনের একমাত্র সীমা হল আপনি নিজের অ্যালগরিদম / সফ্টওয়্যারটিতে প্রক্রিয়া করতে পারেন।

বেশিরভাগ গবেষক (আমাকে সহ) স্ট্রাকচার্ড লাইট ক্যামেরা ব্যবহার করেন (যদিও তারা বাইরে কাজ করেন না, সুতরাং রোবট বাইরে থাকাকালীন আমরা এই সেন্সরগুলিতে আরজিবি ক্যামেরাগুলিতে স্যুইচ করি)। এই আলোক সমস্যার একটি সমাধান হ'ল আমরা নিয়ামক / সিপিইউর প্রক্রিয়াকরণ সক্ষমতার উপর ভিত্তি করে মোটামুটি গভীরতা নির্ধারণের জন্য স্টেরিও ক্যামেরা (স্টিরিও ভিশন / মাল্টি ভিউ গভীরতা) যা মোটামুটি ব্যয়বহুল। আমি এখনও ব্যক্তিগতভাবে অন্বেষণ করতে পারি এমন আরও একটি সমাধান হ'ল একাধিক কিনেক্ট / আসুস এক্সশনস ইত্যাদি ব্যবহার করা, যেখানে আপনি গভীরতার সহিত পাশাপাশি বিদেশের জন্য একাধিক আরজিবি ক্যামেরা পাবেন।

LiDARs সাধারণত খুব ব্যয়বহুল (হাজার হাজার ones সত্যই ভালদের জন্য)। যদিও ভবিষ্যতে কিছু সংস্থাগুলি সুইপের মতো $ 250 "LiDARs" নিয়ে বেরিয়ে আসার সাথে এটি পরিবর্তন হতে পারে ।

এছাড়াও, এলআরএফ / লিডারগুলির সীমিত পরিসীমা এবং রেজোলিউশন রয়েছে (যেমন, একটি নির্দিষ্ট দূরত্ব ছাড়িয়ে তারা গভীরতার সমাধান করতে পারে না নির্বিঘ্নে এবং তাই তারা 0 মানগুলি ফেরত দেয় (আমি লিডারদের সম্পর্কে বিশেষত নিশ্চিত নই, তবে গভীরতার ক্যামেরাগুলি সর্বাধিক (যার উপরে) রয়েছে) পাশাপাশি সর্বনিম্ন ব্যাপ্তি (যার নীচে) তারা আপনাকে গভীরতা দেয় না)।

আশাকরি এটা সাহায্য করবে.


0

আমি আরও একটি কারণ যুক্ত করতে যাচ্ছি যে অকপটে আমি আশা করছিলাম যে অন্য কেউ উপস্থিত হবে। কারণ আমরা কেন প্রথম স্থানে রোবট তৈরি করব? আমাদের নোংরা কাজ করতে আবেগহীন মেশিন?

আমি মনে করি যে কোনও রোবট যেভাবে আমরা স্তন্যপায়ী প্রাণীর মতো নির্ভেজালভাবে "দৃষ্টি" উপর নির্ভর করতে পারে তা তাদেরকে আমাদের মতো করে তোলে। আমার জন্য তাই লেজার এবং সোনাররা প্রতারণা করছে। প্রতারণার স্থিতিতে আমাদের যে আইএমএইচওতে ফোকাস করা উচিত তা হ'ল উচ্চ ফ্রেম-রেট, উচ্চ গতিশীল পরিসর এবং কম শৈল্পিকাগুলি সহ আরও ভাল ক্যামেরা তৈরি করা এবং এমন সফ্টওয়্যার লিখুন যা সেগুলি থেকে প্রয়োজনীয় ডেটা পেতে পারে। (অথবা ২০১২-পরবর্তী পোস্টে কথা বলার জন্য, আমাদের নেটওয়ার্কগুলি তাদের কাছ থেকে কী ডেটা প্রয়োজন তা পেতে প্রশিক্ষণ দিন)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.