উপরে থেকে লোক সনাক্ত করুন


16

আমি মাটির 3 মিটার উপরে কেবল একটি ক্যামেরা ব্যবহার করে লোক সনাক্ত করার জন্য কিছু পদ্ধতি আবিষ্কার করার চেষ্টা করছি। এটি ক্যামেরায় ফিরে আসা একটি ফ্রেম:

এখানে চিত্র বর্ণনা লিখুন

আপডেট: ভিডিও পরীক্ষা -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi

এটি করার জন্য, প্রথমে আমি বুঝতে পারি যে আমাকে একটি পটভূমি-পূর্বভূমি বিভাজন করতে হবে। এটা সহজ অংশ।

অগ্রভাগের মুখোশের সাহায্যে আমি সরল ক্রিয়াকলাপগুলিকে এই জাতীয় Hough চেনাশোনাগুলি সন্ধানের জন্য রূপান্তর করতে সক্ষম হয়েছি, তবে এই পথটি কেবলমাত্র 60% মাথা সনাক্ত করে, অনেকগুলি মিথ্যা ধনাত্মক সহ।

আমি রঙের বিভাজন যেমন অন্য কিছু সাধারণ কৌশল ব্যবহার করতে পারি, তবে আমি দেখতে পেয়েছি যে লোকেদের মাথাগুলি তাদের চুলের স্টাইল, রঙ, চুলের পরিমাণ, ...

যদিও এ সম্পর্কে আমার কাছে অন্যান্য বিকল্প হ'ল এইচওজি বর্ণনাকারী বা হর-এর মতো বৈশিষ্ট্যগুলি ব্যবহারের সম্ভাবনা, তবে মডেলগুলি প্রশিক্ষণের জন্য আমার উপরে থেকে লোকদের একটি বিস্তৃত ডাটাবেস প্রয়োজন। আমি এর মতো কিছু পাইনি।

আমি ভেবেছিলাম এটি খুব ঘন ঘন সমস্যা হবে তবে আমি সাহিত্যে বা ইন্টারনেটে খুব একটা খুঁজে পাই না। এই কাজটি সমাধানে যে কোনও সহায়তা প্রশংসিত হবে :-)

আপডেট: আরও তথ্যের জন্য, পথচারীদের প্রবাহ ট্র্যাকিংয়ের জন্য কিছু জেনেরিক পদ্ধতি বাস্তবায়ন করার লক্ষ্য। প্রথম প্রোটোটাইপ একটি মলে পরীক্ষা করা হবে।


1
আপনি যদি কিছু ভিডিও পোস্ট করতে পারেন তবে এমন সম্ভাবনা রয়েছে যে কেউ প্রোটোটাইপ লিখবেন। আপনি কি পোস্ট করতে পারেন?
আন্দ্রে রুবস্টেইন

@ আন্দ্রে, আমি সমস্যাটি দেখিয়ে একটি ভিডিও পরীক্ষা আপলোড করেছি।
এম্পেট্রেস

@ এমপেট্রেস যদি আপনার এই সমস্যাটি পরীক্ষা করার জন্য সংস্থান আছে, তবে আপনার কাছে মাধ্যমিক ক্যামেরা সন্ধানেরও সংস্থান থাকতে পারে? দুটি ক্যামেরার (এক শীর্ষ দর্শন, এবং একটি সম্মুখ বা একটি কোণ থেকে) ভিউগুলি একত্রিত করা এবং উভয় থেকে তথ্য ব্যবহার আকর্ষণীয় এবং পথচারীদের প্রবাহ ট্র্যাকিংয়ের (যেমন আপনার প্রয়োজনীয়
যথাযথতার

4
এই কাজটিকে সাহিত্যে "লোক গণনা" বলা হয়।
mrgloom

আপনি এই ভিডিওর জন্য লিঙ্ক সরবরাহ করতে পারেন। এটি সরবরাহিত লিঙ্কটিতে আর উপলভ্য নয়
গার্বিতা তিওয়ারি

উত্তর:


11

এমন কি অন্য কোনও জিনিস রয়েছে যা মানুষের পাশে যেতে পারে? যদি তা না থাকে তবে আপনি কেবল আপনার অগ্রভাগের মুখোশগুলিতে ব্লবগুলি (সংযুক্ত উপাদানগুলি) খুঁজে পেতে পারেন এবং এগুলি আপনার লোক।

তারা একে অপরের সাথে "সংঘর্ষ" করতে পারে, দুজনের পরিবর্তে একটি ব্লব তৈরি করে। এই ক্ষেত্রে, আপনি গতি ট্র্যাকিং করতে পারেন এবং ট্রাজেক্টোরি এবং গতিটি মসৃণ রয়েছে তা ব্যবহার করে অস্পষ্টতাটি সমাধান করতে পারেন।

যদি অন্য কোনও অবজেক্ট থাকে (যেমন কুকুর, গাড়ি), তবে আপনার এমন একটি শ্রেণিবদ্ধ তৈরি করা উচিত যা ব্লব পরামিতিগুলি পেতে পারে:

  • ব্লব পরিসংখ্যান (আকার, দৃity়তা, ইত্যাদি।)
  • রঙ
  • এজ তথ্য
  • গতি (ট্র্যাকিংয়ের ক্ষেত্রে)

এবং সঠিক শ্রেণি (হিউম্যান / নো হিউম্যান) প্রদান করে।


1
আমি এমন একটি শক্তিশালী পদ্ধতি খুঁজছি যা মানব / অ-মানবিক মধ্যেও পার্থক্য করতে পারে। এইভাবে, আপনার উত্তর সম্পর্কে চিন্তা করার পরে আমি মনে করি যে আপনি পরামর্শ হিসাবে ব্লব পরামিতিগুলি ব্যবহার করেছেন, কিছু বৈশিষ্ট্য ট্র্যাকিং এবং ব্লবের কিছু পরিসংখ্যান সম্পর্কিত তথ্য যথেষ্ট শক্তিশালী হওয়া উচিত।
এম্পেট্রেস

8

আমি ছিলাম "পরীক্ষিত পদ্ধতিগুলি ভালভাবে ব্যবহার করার জন্য আমার একটি উদাহরণের একটি বিস্তৃত ডাটাবেস প্রয়োজন যা আমার কাছে নেই" একটি খুব ছোট সংস্থায় যে "এটি সামর্থ্য করতে পারে না" পজিশনে। আমি খুব আফসোস করছি যে যতটা সম্ভব সম্ভব ডেটা পাওয়ার জন্য আমি যা প্রয়োজন তা করলাম না। আমি মনে করি এটি শেষ পর্যন্ত তাদের সাথে একটি পার্থক্য তৈরি করেছিল।

যেকোন ধরণের বাস্তব বিশ্ব দৃষ্টি সনাক্তকরণে এমন এক মিলিয়ন জিনিস রয়েছে যা আপনি চেষ্টা না করা পর্যন্ত এটি ভাবেননি এবং এটি ব্যর্থ হয়েছে। এটি অনেক পুরানো সমস্যা, প্রদর্শিত হওয়ার থেকে অনেকগুণ বেশি কঠিন। আমি "বামনদের কাঁধে দাঁড়ানো" (বা প্রায় ভাল হিসাবে ভাল, বামনগুলির একটি বড় স্তূপের উপরে) নিউটনের পদ্ধতির সাথে লেগে থাকার পরামর্শ দেব। এটি, এমন একটি পদ্ধতি ব্যবহার করুন যা আপনি ইতিমধ্যে জানেন যে কাজ করে এবং শক্ত হয় is এর পরিবর্তে "যথেষ্ট পরিমাণে ভাল" লাগবে এমন সমস্ত স্টাফ খারাপভাবে ব্যর্থ হবে।

পথচারীদের সনাক্তকরণে শিল্পের স্টেটটি শেষ অবধি আমি জানতাম এইচওজি যা মূলত সেটিংয়ে পরীক্ষিত হয়েছিল। আপনি ট্র্যাকিং চান তাই আপনাকে এটি খুঁজে পেতে গুগল পন্ডিতের কাছে কিছুটা খেলতে হবে। আমার মূল বিষয়টি কিনুন, আমি একইরকম অবস্থানে ছিলাম এবং সেখান থেকে আমি আপনাকে আপনার ডাটাবেস, আপনাকে যা কিছু করতে হবে তা ব্যবহার করার পরামর্শ দিচ্ছি এবং আপনি যা কিছু কাজ জানেন তা ব্যবহার করুন, যা ইতিমধ্যে একটি পরিচিত ব্যর্থতার হার দিয়ে পরীক্ষা করা হয়েছে, এমন কিছু নয় যা শুধু ভাল শোনাচ্ছে। কম্পিউটার ভিশন অ্যালগরিদমের 40 বছরের ডেথ মার্চ যা "তারা যেমন কাজ করবে তেমন শব্দ" আপনি এর অংশ হতে চান এমন কিছু নয়।

পিএস কম্পিউটার ভিশন সমালোচনা করার চেষ্টা করছে না। এটি আমার প্রিয় অঞ্চলগুলির একটি। তবে এটি ইতিহাস থেকে জানা যায় যে হাজার হাজার ভুল পদক্ষেপ গ্রহণ করতে হবে এবং খুব বেশি সঠিক পদক্ষেপ নেই। ইতিমধ্যে এই সঠিক পদক্ষেপগুলির মধ্যে কিছু খুঁজে পাওয়া গেছে এমন কাউকে অনুসরণ করা ভাল।


হতে পারে আপনি ঠিকই বলেছেন, এবং এইচওজি বর্ণনাকারীর প্রশিক্ষণ ও পরীক্ষা করার জন্য আমার একটি ভাল ডাটাবেস তৈরি করতে কিছুটা সময় ব্যয় করা উচিত। এইভাবে, আপনি কি জানেন যে প্রশিক্ষণটি সঠিকভাবে তৈরি করতে কোন ন্যূনতম আকারের এই ডাটাবেসটি থাকবে?
এম্পেট্রেস

1
আমি জানি না. যতটা সম্ভব বিস্তৃত বিভিন্ন। এছাড়াও, এইচওজি আবিষ্কারক, এটি একটি "হ্যাঁ একজন ব্যক্তি আছে" বা "কোনও ব্যক্তি" কোনও চিত্রের প্রতিক্রিয়া এবং অন্য কিছুই দেয় না। এটি ব্যক্তি কোথায় (অবস্থান) বা পিক্সেল ব্যক্তি (সেগমেন্টেশন) বা এক ব্যক্তি বনাম একাধিক ব্যক্তি রয়েছে কিনা সে সম্পর্কে কিছুই জানায় না। আমি মনে করি HOG- র সাথে কিছু অভিযোজন হয়েছে (কিছু পেটেন্ট করা হয়েছে) তবে আপনি যা চান তা হ'ল ব্যক্তি ট্র্যাকিং এবং এইচওজি যেমন এটি দাঁড়িয়েছে কেবল সনাক্তকরণ সম্পর্কিত , এমনকি অবস্থান নয়। আমি এটি কখনই করি নি তবে ব্যক্তিগত ট্র্যাকিং একটি দীর্ঘস্থায়ী বিষয়। ব্যক্তি ট্র্যাকিংয়ের কাগজপত্রগুলি দেখুন।
জন রবার্টসন

1
@ জন রবার্টসন এইচওজি সনাক্তকারী নয় এটি কেবল বর্ণনাকারী এবং এটি কিছু শ্রেণিবদ্ধের সাথে ব্যবহার করা হয়েছে (উদাহরণস্বরূপ এসভিএম + এইচওজি) এবং এটি বস্তুর অবস্থান ফিরে আসতে পারে।
mrgloom

1
@ এমগ্রগলুম আপনি ঠিক বলেছেন এটি উইন্ডোযুক্ত অনুসন্ধান করে লোকেশনটি ফেরত দেয়। এটি কেবলমাত্র বৃহত্তর কর্পোরেশন দ্বারা পেটেন্ট করা একটি পদ্ধতি ব্যবহার করে দ্রুত। আমি এখানে প্রযুক্তিগত অর্থে ডিটেক্টর শব্দটি ব্যবহার করার অর্থ হচ্ছিলাম না, কেবল সাধারণ ইংরেজী অর্থে যে এটি সনাক্তকারী কিছু। এটি কেবল একটি শিথিল অর্থে অবস্থান সরবরাহ করে যে উইন্ডোটির ভিতরে উইন্ডোটির স্কেলগুলির প্রায় 80-90% এর মধ্যে কেউ রয়েছে তবে উইন্ডোটির কোন অংশটি ব্যক্তির অন্তর্গত তা কোনও সনাক্তকরণ ছাড়াই। আমি বর্ণনাকারী / আবিষ্কারক প্রযুক্তিগত পার্থক্য সঙ্গে পরিচিত।
জন রবার্টসন

3

আমি মনে করি আপনি এখান থেকে কয়েকটি উত্তর একত্রিত করে শুরু করতে পারেন

এই উত্তরে দুটি পৃথক পন্থা উল্লেখ করা হয়েছে , প্রধান পার্থক্য সহ যে আপনি মুখগুলি দেখেন না তাই আপনার পক্ষে মুখ সনাক্তকরণ অসম্ভব। তবে অন্য পদ্ধতিটি এখনও প্রযোজ্য: আবহাওয়াটি কোনও পথচারী বা তার ক্রিয়াকলাপ (গতিবিধি) এর উপর ভিত্তি করে না সিদ্ধান্ত নিন ।

এটি, আপনার পূর্বাভাস অনুসারে, কোনও প্রকারের অগ্রভাগ-ব্যাকগ্রাউন্ড বিভাজন ব্যবহার করার পরামর্শ দিবে। একটি খুব দ্রুত গুগলিং সাম্প্রতিক এই নিবন্ধটি দেখতে পেয়েছে যা বেশ আশাব্যঞ্জক বলে মনে হয়েছে, তবে যেহেতু আমি ব্যক্তিগতভাবে এটি কখনই করিনি, আপনার বা অন্য কারও কাছে এই ধাপে নির্দিষ্ট অ্যালগরিদমের জন্য আরও ভাল পরামর্শ থাকতে পারে।

এখন, আমি যুক্ত প্রথম উত্তরটি একটি খুব সাধারণ পদ্ধতির ধারণা দেয়। এই উত্তরটি আপনাকে আপনার পরবর্তী পদক্ষেপগুলি সম্পর্কে ধারণা দিতে পারে: বস্তুগুলি ট্র্যাক করুন এবং গতি বা চলমান দিকের ভিত্তিতে তাদের মধ্যে পার্থক্য করার চেষ্টা করুন ।

অবশেষে, আপনার যে সমস্যাটি হয়েছিল তা আমি কখনই মোকাবিলা করি নি, তাই আমি সম্ভবত খুব বেশি সাহায্য করি না, তবে আমি যে উত্তরগুলির সাথে লিঙ্ক করেছি সেগুলি আপনাকে কোথায় শুরু করার জন্য কিছু সাধারণ ধারণা দিতে পারে। এটি আমাকেও অবাক করে দিয়েছিল যে আপনার সমস্যার উত্তর খুঁজতে গিয়ে আমি পূর্বের কোনও রচনা এবং নিবন্ধগুলি খুঁজে পাইনি, তবে তারপরে, সম্ভবত এই সমস্যাটি বর্ণনা করার জন্য আপনাকে কারওর প্রয়োজন হবে


আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ। অগ্রভাগ বিভাগ সম্পর্কে নিবন্ধটি খুব আকর্ষণীয় দেখায়। আপনি এবং @ অ্যান্ড্রে যেমন পরামর্শ দিয়েছেন, প্রতিটি ব্লকের মানুষের সংখ্যা নির্ধারণের জন্য আমি ব্লব বিশ্লেষণের পদ্ধতি অনুসরণ করব।
এম্পেট্রেস

@ এমপেটারেস আপনার ফলাফলগুলি সম্পর্কে যদি আমাদের জানান, এবং আপনি একবার চেষ্টা করে পরীক্ষা করে দেখতে পেরেছিলেন তবে এই পদ্ধতিটি কতটা সফল হয়েছিল
পেনেলোপ

1

লোকদের গণনা করা, এখানে বর্ণিত হিসাবে আমার এক ধরণের কাজ রয়েছে। তবে আমার প্রয়োজনটি হ'ল ক্যামেরাটি মাথার উপর দিয়ে নয়, বাম / ডান দিকের লোকদের মুখোমুখি হওয়া উচিত।

বলা হচ্ছে, আমার মামলার সম্ভাব্য সমাধান অন্বেষণ করে আমি আপনার মামলার (ওভারহেড সনাক্তকরণ) একটি আকর্ষণীয় পদ্ধতিতে হোঁচট খেয়েছি। এই সমাধানগুলি স্টেরিও ক্যামেরা ব্যবহার করে যাতে আপনি ব্লবগুলি পরিচালনা করতে পারেন (লোকেরা খুব কাছাকাছি চলেছে) গভীরতা দেখে (উদাহরণস্বরূপ কেবলমাত্র লোকেদের গড় স্তরের স্তরে দেখতে পারেন)।

এই পণ্যটি আপনাকে আরও ভাল ব্যাখ্যা দিতে পারে: ডিজিওপ । আরও প্রযুক্তিগত ব্যাখ্যার জন্য ব্রোশিওরটি দেখুন।

পিএস আমি সংস্থার প্রতিনিধিত্ব করছি না, কেবল একটি ভাল ডকুমেন্টেড সমাধান দেখিয়েছি


ভাগ করে নেওয়ার জন্য আপনাকে ধন্যবাদ, সমস্যাটি সমাধান করার জন্য এটি একটি আকর্ষণীয় উপায় বলে মনে হচ্ছে।
পান্না
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.