কম্পিউটার ভিশন অ্যালগরিদম (এটি কীভাবে সম্ভব?)


9

আমি সম্প্রতি এমন একটি সংস্থা জুড়ে হোঁচট খেয়েছি যা এমন একটি কম্পিউটার ভিশন প্রযুক্তি বলে মনে হয়েছে যা শপ লিফটিং স্বয়ংক্রিয়ভাবে সনাক্ত করতে সক্ষম এবং এর ব্যবহারকারীদের সতর্ক করতে সক্ষম।

LINK এ

সংস্থার সরবরাহকৃত কয়েকটি ভিডিও এবং উদাহরণ দেখে আমার সম্পূর্ণ বিস্মিত ও হতবাক হয়ে গেছে যে তারা পৃথিবীতে কীভাবে এই কার্যকারিতা অর্জন করতে পারে।

আমি বুঝতে পেরেছি যে এখানে কেউই কীভাবে এটি অর্জন করতে পেরেছিল তা সঠিকভাবে বলতে সক্ষম হবে না তবে কি কেউ সচেতন - এবং আমাকে নির্দেশ করতে পারে - এই ক্ষেত্রে গবেষণা বা বিকল্পভাবে সম্ভবত এই জাতীয় কিছু কীভাবে বাস্তবায়ন করা যেতে পারে বা সম্পর্কে বিবরণ প্রদান করতে পারে বা কেউ শুরু হতে পারে যেখানে গাইডেন্স?

আমার বোধগম্যতা ছিল কম্পিউটার ভিশনের অ্যালগোরিদমগুলি এই অত্যাধুনিক হওয়ার থেকে বহু বছর দূরে ছিল। এই ধরণের প্রয়োগ কি সত্যিই সম্ভব? কেউ এই ধারণা কীভাবে অর্জন করতে পারে তা নিয়ে अनुमान করতে ইচ্ছুক কেউ?


2
এটি এত কঠিন বলে মনে হচ্ছে না। গেমস সমস্ত সময় বস্তুর মধ্যে সংঘর্ষ সনাক্ত করে; আপনি কেন কোনও ব্যক্তি এবং আইটেমগুলির একটি বালুচর মধ্যে সংঘর্ষ সনাক্ত করতে পারলেন না এবং তারপরে যখন কোনও ব্যক্তি বিনা পারিশ্রমিক না দিয়ে দরজার দিকে হাঁটছিলেন তখন একটি অ্যালার্ম বাড়াতে পারেন?
রবার্ট হার্ভে

যথাযথভাবে। এটি কেবল অবজেক্টের স্বীকৃতি এবং সংঘর্ষ সনাক্তকরণ। যদি তারা এটিকে স্ক্যানারে লাগায় না তবে এটি সহজে স্ক্যানারের উপর দিয়ে বস্তুগুলি সরিয়ে নিয়ে এসে যায় তবে এটির থেকে কিছুটা উপরে। বস্তুটি স্ক্যানারের সাথে সংঘর্ষে উপস্থিত হয়েছিল তবে বাস্তবে তা হয়নি।
অ্যান্ড্রু টি ফিনেল

যাইহোক, ওয়েবসাইটে বর্ণিত সনাক্তকরণ ব্যবস্থার কোনওটিরও (স্নেহসঞ্চার, ঝুড়ি-ক্ষতি এবং স্ব-চেকআউট) এমনকি পরিশীলভাবে এমন পরিশীলিত কোনও কিছুর প্রয়োজন নেই। তারা খুব সীমাবদ্ধ অঞ্চল (ক্যাশিয়ার কাউন্টার) পরীক্ষা করে এবং বার-কোড স্ক্যানার যা বলছে তা আসলে স্ক্যান করে তার বিপরীতে ঝুড়িতে দেখা আইটেমগুলি ক্রস-চেক করতে পারে।
রবার্ট হার্ভে

1
আমি দুঃখিত আমি বিভ্রান্ত উদাহরণস্বরূপ উদাহরণস্বরূপ গ্রহণ করা যাক। আমার কাছে দুটি আইটেম রয়েছে, একটি স্বল্প দামের আইটেম, একটি উচ্চ। আমি স্বল্পমূল্যের আইটেমটি উচ্চ মূল্যের একটির নীচে রেখে স্ক্যান করি। এই মুহুর্তে আমরা পস সিস্টেমে যা স্ক্যান করেছিলাম তা ক্যাশিয়ারের হাতে ক্যামেরায় যা দৃশ্যমান হয় তার সাথে তুলনা করতে পারি তবে এর জন্য সিস্টেমটি কয়েক হাজার সম্ভাবনার বিপরীতে "ব্যাগের মধ্যে কী রয়েছে" তা বুঝতে সক্ষম হতে পারে প্রান্তিক মানের একটি ক্যামেরার মাধ্যমে আইটেম। এটি অত্যন্ত জটিল বলে মনে হচ্ছে। আমি কী মিস করছি?
ম্যাক্সিম গের্স্কোভিচ

6
আমি মনে করি আপনি এটি কতটা ভাল কাজ করে তা নিয়ে খুব বেশি ধারণা করছেন। আমি বাজি ধরছি আপনার একটি শালীন ত্রুটির হার রয়েছে এবং এটি সম্ভবত সিস্টেমটি খেলা খুব সহজ। আমি এটিকে হুইসেল ব্লোয়ার টাইপ সিস্টেম হিসাবে আরও দেখছি, যেখানে এটি কেবলমাত্র ভিডিওর মধ্যে সম্ভাব্য স্থানগুলি সনাক্ত করে যা মানুষের পর্যালোচনা প্রয়োজন। যেমন, অসত্যতা ভাল সহ্য করা হয়।
খ্রিস্ট

উত্তর:


5

আপনি আর্টের অবস্থা সম্পর্কে ভুল তথ্য দিয়েছেন। বেশ কয়েক বছর আগে আমি এমন একটি সংস্থার জন্য কাজ করেছি যা বিভিন্ন উদ্দেশ্যে বিভিন্ন ধরণের সিস্টেম তৈরি করেছিল। একটি ছিল একটি অত্যন্ত সফল বিমানবন্দর অ্যাড্রেস-কন্ট্রোল সিস্টেম, যা সহজেই কোনও ব্যক্তির প্রস্থান হলের পথে ভুল পথে হাঁটানো এবং বলের মতো জিনিসগুলি বা লোকেরা সঠিক পথে পরিচালিত করার মধ্যে পার্থক্যটি সহজেই বলতে পারে। রিয়েল-টাইমে কোনও দৃশ্যে অবজেক্টগুলি সনাক্ত করা সহজ নয়, তবে আমরা এটি সুপার কম্পিউটারগুলিতে নয়, এম্বেড করা সিপিইউতে করছিলাম।

আমি সেখানে কিছুই দেখিনি যা কয়েক বছর আগে বিশ্বাসযোগ্য ছিল না।


4

আসলে এই সংস্থা ভারতে কম্পিউটার ভিশন এবং ম্যানুয়াল রিভিউয়ের একটি হাইব্রিড ব্যবহার করে। এটি খাঁটি কম্পিউটার ভিশন নয় বিশেষত সুইটহার্টিংয়ের মতো উপাদানগুলির জন্য। আসলে আমি এমন একজন খুচরা ব্যবসায়ীকে জানি যে আমার সংরক্ষণ করা সিস্টেমের পারফরম্যান্সের কারণে নয়, ভারতে ব্যান্ডউইথ শিপিং ভিডিওর কারণে এই সিস্টেমটিতে বেশ সমস্যা আছে। এই ম্যানুয়াল কোডিংটি কীভাবে তারা ত্রুটিগুলি হ্রাস করে এবং এটি এখন কিছু বিক্রেতাদের সাথে একটি সাধারণ প্রযুক্তি অনুসন্ধান।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.