অসঙ্গতি সনাক্তকরণের মাধ্যমে বিড়ালদের চাক্ষুষভাবে সনাক্ত করা


17

আমার একটি শখের প্রকল্প রয়েছে যা আমি মেশিন লার্নিংয়ের আমার এত সীমিত অভিজ্ঞতা বাড়ানোর উপায় হিসাবে প্রতিশ্রুতিবদ্ধ হওয়ার কথা ভাবছি। আমি এই বিষয়ে কোর্সেরা এমওসি নিয়েছি এবং শেষ করেছি। আমার প্রশ্নটি প্রকল্পের সম্ভাব্যতার সাথে সম্পর্কিত।

কাজটি নিম্নলিখিত:

প্রতিবেশী বিড়ালরা সময়ে সময়ে আমার বাগানে ঘুরতে আসে, যেগুলি তারা আমার লনে মলত্যাগ করার ঝোঁক থেকে আমি পছন্দ করি না। আমি একটি সতর্কতা ব্যবস্থা রাখতে চাই যা একটি বিড়াল উপস্থিত থাকলে আমাকে সতর্ক করে দেয় যাতে আমি আমার সুপার সোকারটি ব্যবহার করে তাড়া করতে যাই। সরলতার জন্য, বলুন যে আমি কেবল কালো এবং সাদা বর্ণের একটি বিড়াল সম্পর্কে যত্নশীল।

আমি ক্যামেরা মডিউল সহ একটি রাস্পবেরি পাই সেটআপ করেছি যা বাগানের কোনও অংশের ভিডিও এবং / বা ক্যাপচার করতে পারে।

নমুনা চিত্র:

নমুনা বাগানের চিত্র

আমার প্রথম ধারণাটি ছিল শ্রেণিবদ্ধকে বিড়াল বা বিড়ালের মতো জিনিসগুলি সনাক্ত করতে প্রশিক্ষণ দেওয়া, কিন্তু আমি উপলব্ধি করতে পেরেছি যে আমি প্রচুর পরিমাণে ইতিবাচক নমুনা অর্জন করতে পারব না, আমি এটিকে বিস্মৃত সনাক্তকরণের পক্ষে ত্যাগ করেছি।

আমি অনুমান করি যে আমি যদি প্রতিদিনের দ্বিতীয় সেকেন্ডে একটি ছবি ক্যাপচার করি তবে আমি প্রতিদিন পাঁচটি বিড়াল (প্রায় ,000০,০০০ এর মধ্যে সূর্যের আলো সহ) ছবি সহ শেষ করব।

অসঙ্গত সনাক্তকরণ ব্যবহার করে এটি কি সম্ভব? যদি তা হয় তবে আপনি কোন বৈশিষ্ট্যগুলি প্রস্তাব করবেন? আমার এখন পর্যন্ত আমার ধারণাগুলি কেবল নির্দিষ্ট রঙের সাথে পিক্সেলের সংখ্যা গণনা করা হবে; কিছু ধরণের ব্লব সনাক্তকরণ / চিত্র সেগমেন্টিং করুন (যা আমি কীভাবে করব তা জানি না এবং এইভাবে এড়াতে চাই) এবং তাদের উপর একই বর্ণ বিশ্লেষণ কর।


1
সম্ভবত এই প্রশ্নটি ক্রস বৈধতা এসই সাইটের পক্ষে আরও উপযুক্ত। পার্থক্যটি আমার কাছে কিছুটা অস্পষ্ট ...
ফ্রস্ট

4
আমি মনে করি যে প্রশ্নটি এই সাইটের পক্ষে খুব উপযুক্ত, কারণ এটি মেশিন লার্নিংয়ের ব্যবহারিক প্রয়োগ সম্পর্কে আলোচনা করে। বিটিডব্লিউ, নির্বোধ প্রশ্ন, বিড়ালের এত কম ছবি কেন? এগুলি কি কেবল পাঁচ সেকেন্ডের জন্য আসে?
insys

@ আইসিস, ভুট্টার সাথে আমার সতর্কতার বিষয়ে গুজবগুলি দেখা যায় যে কৃপণ সম্প্রদায়ে ছড়িয়ে পড়েছে। তারা আগের মতো স্থির থাকে না। আমি অনুমান করি যে এটি আমার পছন্দসই, আরও পরিশীলিত সমাধানটিকে জটিল করে তুললেও, বিড়ালদের আমার বাগান থেকে বাঁচার আসল উদ্দেশ্য ডাব্লু / আর / টি টি ভাল জিনিস w
ফ্রস্ট

2
সুস্পষ্ট পরবর্তী পদক্ষেপের মতো মনে হচ্ছে (আপনি বিড়াল সনাক্তকরণ কাজ করার পরে) একটি রাস্পবেরি পাই যা সুপার সোকার দ্বারা নিয়ন্ত্রিত :-)
ক্রাইটেন

1
@ ক্রিটেন সম্পর্কিত: ইউটিউব পাইথনের সাথে আপনার বাড়ির

উত্তর:


8

একটি গতি / পরিবর্তন সনাক্তকরণ পদ্ধতির সাহায্যে আপনি আপনার সমস্যাটিকে উল্লেখযোগ্যভাবে সহজ করতে পারেন। উদাহরণস্বরূপ, আপনি প্রতিটি চিত্র / ফ্রেমকে প্রথম থেকে একটির সাথে তুলনা করতে পারেন (উদাহরণস্বরূপ, এক মিনিট আগে), তারপরে কেবল পিক্সেলগুলি বিবেচনা করুন যা আগের সময়ের থেকে পরিবর্তিত হয়েছে। তারপরে আপনি পরিবর্তনের আয়তক্ষেত্রাকার অঞ্চলটি নিষ্কাশন করতে পারেন এবং এটি আপনার শ্রেণিবদ্ধকরণ বা অসাধারণ সনাক্তকরণের ভিত্তি হিসাবে ব্যবহার করতে পারেন।

এই ধরণের পদ্ধতির গ্রহণ করা আপনার শ্রেণিবদ্ধকে উল্লেখযোগ্যভাবে সহজ করতে পারে এবং আপনার মিথ্যা টার্গেটের হার হ্রাস করতে পারে কারণ আপনি বিড়ালের আকারের (উদাহরণস্বরূপ, কোনও ব্যক্তি বা পাখি) আকারের নয় এমন কিছু উপেক্ষা করতে পারবেন। তারপরে আপনি নিষ্কাশিত পরিবর্তন অঞ্চলগুলি ব্যবহার করতে পারবেন যা আপনার শ্রেণিবদ্ধকারী (বা অসাধারণ ডিটেক্টর) এর প্রশিক্ষণ সেট গঠনের জন্য ফিল্টার করা হয়নি।

আপনার কল্পিত অনুপ্রবেশ সনাক্তকরণ সিস্টেমে একটি লেজারের বুড়ি মাউন্ট করার আগে আপনার ভুয়া টার্গেট রেট যথেষ্ট কম পাওয়া নিশ্চিত হয়ে নিন।


1
এটি নিয়ন্ত্রিত পরিবেশের জন্য একটি দুর্দান্ত ধারণা তবে আমি এই ক্ষেত্রে এর প্রয়োগযোগ্যতার বিষয়ে নিশ্চিত নই, যেহেতু আমরা এমন প্রাকৃতিক পরিবেশ নিয়ে কাজ করছি যেখানে ক্রমাগত পরিবর্তন হচ্ছে, যেমন আবহাওয়ার পরিবর্তন, সূর্য, উদ্ভিদ এবং গাছের অবস্থানের কারণে continuous বাতাস, asonsতু ইত্যাদি আমি বিশ্বাস করি যে আপনি বর্ণনা করেছেন যে পরিবর্তনটি এই অঞ্চলে যে কোনও ক্ষেত্রে পুরো চিত্রের আকারের কাছাকাছি বৃদ্ধি পেতে পারে।
insys

@ আইনসিস - আমি আপনার বক্তব্যটি দেখছি তবে আমি একমত নই - আমি বিশ্বাস করি এটি আবিষ্কারককে পরিবর্তন করতে আরও দৃ more়তর করে তোলে। আপেক্ষিক ফ্রেমের মধ্যে সময়ের পার্থক্যটি ছোট (minute সেকেন্ড থেকে এক মিনিট) হওয়া উচিত তাই সূর্য, seasonতু, আবহাওয়া নগণ্য হওয়া উচিত। আমি সম্মত হই যে বাতাস গাছের চলাচলের কারণ ঘটায় তবে শ্রেণিবিন্যাসের ধাপগুলি এড়াতে পারে যেহেতু তাদের আকার / আকৃতি / রঙ একটি বিড়ালের চেয়ে আলাদা। এছাড়াও, একই সময়ে দুটি ফ্রেম ব্যবহার করা বিভিন্ন আলোকসজ্জার অবস্থার (যেমন, একটি রোদ বনাম মেঘলা দিনে একটি বিড়াল) ভালভাবে পরিচালনা করতে পিক্সেলের তীব্রতাকে স্বাভাবিককরণ সক্ষম করে।
বগাট্রন

আসলে, আমি আপনার উত্তরটি সম্পর্কে এখন আরও বিভ্রান্ত হয়ে পড়েছি যে আমি আপনার মন্তব্যের মাধ্যমে পড়েছি :) সম্ভবত আমি ভুল বুঝেছি, তবে আপনি যদি সত্যই "উত্তোলিত পরিবর্তন অঞ্চলগুলি" ব্যবহার করেন তবে আপনার ইতিবাচক নমুনাগুলি তৈরি করতে, আপনার প্রশ্নে উল্লিখিত হিসাবে, আপনি কীভাবে কীভাবে তৈরি করেন? তারা বিড়াল নিশ্চিত? তারা কিছু হতে পারে। যেমন, আপনার শ্রেণিবিন্যাসের পদক্ষেপটি সনাক্ত করতে শেখানো শেখানো ব্যতীত অন্য কোনও কিছুই সনাক্ত করতে ব্যর্থ হবে - যা কোনও ধরণের পরিবর্তন। সুতরাং এটি আসলে "পরিবর্তন" সনাক্তকারীটির কাজটি পুনরাবৃত্তি করছে।
insys

তদ্ব্যতীত, আলোকসজ্জা পরিস্থিতি অবশ্যই উদ্বেগের বিষয়, তবে, আমি যদি আপনার বক্তব্যটি সঠিকভাবে বুঝতে পারি তবে এটি স্পষ্ট নয় যে 1 মিনিটের ব্যবধানে নেওয়া দুটি অনুরূপ চিত্র পিক্সেলটির তীব্রতাকে স্বাভাবিক করার দিকে কী করবে?
insys

তোলা অঞ্চলগুলি ইতিবাচক বা নেতিবাচক উদাহরণগুলির প্রতিনিধিত্ব করতে পারে - বিড়ালের শ্রেণিবদ্ধকে প্রশিক্ষণ দেওয়ার জন্য আপনি এটি ব্যবহার করেন। তীব্রতার বিষয়ে, ধরুন শ্রেণিবদ্ধকারী প্রাথমিকভাবে রৌদ্রোজ্জ্বল চিত্র থেকে উত্তোলিত অঞ্চলগুলি থেকে প্রশিক্ষিত হয়। শ্রেণিবদ্ধ তখন সহজেই উজ্জ্বল সাদা পশম সহ বিড়ালগুলি খুঁজে পেতে পারে তবে এটি মেঘলা দিনে (যখন সাদা পশম প্রায় তেমন উজ্জ্বল হয় না) বা সন্ধ্যার কাছাকাছি সময়ে ভাল কাজ করে না। দুটি চিত্রের একটি সাধারণকরণ সম্পাদন করা এই সমস্যাটি হ্রাস করতে সহায়তা করে (যেমন, একজোড়া উজ্জ্বল চিত্র এবং একজোড়া ম্লান চিত্র শ্রেণিবদ্ধের অনুরূপ প্রদর্শিত হবে)।
বোগাট্রন

4

এটি একটি আকর্ষণীয় এবং বেশ উচ্চাকাঙ্ক্ষী প্রকল্প :)

আমি নিশ্চিত নই যে অনিয়ম সনাক্তকরণ (কমপক্ষে আপনি অনুসরণ করা কোর্সে বর্ণিত অর্থে) এক্ষেত্রে খুব মানানসই অ্যালগরিদম হবে।

কোর্সের শেষে যেখানে ফটো ওসিআর ওয়ার্কফ্লো প্রদর্শিত হয়েছিল সেই বিষয়ে যা আলোচনা হয়েছে তা হতে আমি আরও কার্যকরী পদ্ধতির বিষয়টি বিবেচনা করব।

পদ্ধতির মধ্যে আপনার ইমেজটিকে ছোট "ব্লকগুলি" হিসাবে বিভক্ত করা এবং তদারকি করা শেখার অ্যালগরিদম ব্যবহার করে একে অপরের মাধ্যমে যাওয়া এবং প্রতিটি ব্লক বিড়াল রয়েছে কিনা তা অনুসারে শ্রেণিবদ্ধ করার চেষ্টা করবে। যদি একটি ব্লকে বিড়াল থাকে তবে অ্যালার্মটি বন্ধ হয়ে যায়। বোনাস হিসাবে, আপনি বিড়ালের অবস্থানও পেয়েছেন, যাতে আপনি আপনার প্রকল্পের ভবিষ্যতের পদক্ষেপ হিসাবে কিছু "স্বয়ংক্রিয়" প্রতিক্রিয়া অন্তর্ভুক্ত করার কথা ভাবতে পারেন।

এখানে সুবিধাটি হ'ল আপনাকে আপনার বাগানের সাথে নির্দিষ্ট একটি ডেটাसेट ব্যবহার করে আপনার অ্যালগরিদম প্রশিক্ষণ করতে হবে না (যা আপনি উল্লেখ করেছেন যে জাল তৈরি করা কঠিন) তবে আপনি জাল থেকে বিড়ালের চিত্র ব্যবহার করতে পারেন (উদাহরণস্বরূপ সম্ভবত আপনি অনুসন্ধান করতে পারেন) "ঘাসের উপর বিড়াল" বা কিছু) এবং সম্ভবত আপনার (বা অন্যান্য) বাগানগুলির ফটোগুলির প্যাচ। সুতরাং আপনাকে আপনার ক্যামেরা থেকে ফটো সংগ্রহ করতে আপনার সময় ব্যয় করতে হবে না এবং আপনি ইতিবাচক (অর্থাত্ বিড়াল) এর একটি খুব ছোট (তুলনামূলক) নমুনা থাকার ঝুঁকি এড়াতে পারবেন না।

এখন, অবশ্যই একটি সঠিক বিড়াল ডিটেক্টর তৈরি করা কতটা সহজ অন্য বিষয় topic


এবং যদি আপনার ব্লকটি কাটটি দুই বা ততোধিক টুকরোতে বিভক্ত করে তবে কি হবে? ব্লক করার কৌশলটি একটি খুব সাধারণ পন্থা, তবে কোনও ক্যামেরা যখন কোনও নির্দিষ্ট অবস্থানে সম্পূর্ণরূপে স্থির হয়, তখন আমার দৃষ্টিকোণ থেকে গতি সনাক্তকরণটি একটি ভাল এবং কম সময় গ্রহণকারী পদ্ধতি।
অ্যাডিসান্টোস

@ আসসান্টোস - আপনি যা বলছেন তা সত্য হতে পারে এবং চলমান এবং অচলিত অংশগুলির মধ্যে পার্থক্য অনুমানের জন্য এর সুবিধা রয়েছে। তবে প্রশিক্ষণের জন্য, বোগাস্ট্রন যেভাবে এটি বর্ণনা করেছেন, এটি টেবিলে কী কী উপকার নিয়ে আসে তা স্পষ্ট নয়। সামগ্রিকভাবে, আমার মতে এটি জটিলতা যুক্ত করে, যা ডিবাগিংয়ের সময়টিকে উল্লেখযোগ্যভাবে দীর্ঘায়িত করে। সরানো উইন্ডোটির সুবিধা এটির সরলতার মধ্যে।
insys

বিটিডব্লিউ, আপনি যে বিভাজনটির কথা উল্লেখ করেছেন তা সম্পর্কিত, একটি সুস্পষ্ট কৌশল হ'ল আপনার উইন্ডোজকে ওভারল্যাপ করা উচিত, যাতে বিভক্ত অবস্থানটি আপনার শ্রেণিবদ্ধকে প্রভাবিত করে না।
insys

আমি আমার প্রস্তাবকে (গতি সনাক্তকরণ) একটি বিড়ালের টেক্সচার সহ সিফ্ট অ্যালগরিদমের ব্যবহার যুক্ত করব। এসআইএফটি পদ্ধতিটি ব্লকের সেই কৌশলটির সাথেও ব্যবহার করা যেতে পারে তবে সেক্ষেত্রে আপনি প্রয়োজনের তুলনায় আরও বেশি ব্লকের তুলনা করবেন। লক্ষ্য করুন যে একটি বিড়াল চলাচল করে, তবে একটি গাছ বা একটি গুল্ম এত বেশি নয়।
অ্যাডিসান্টোস

3

গতি / পরিবর্তন সনাক্তকরণের কৌশল অবশ্যই যথেষ্ট, তবে আমি একটি অতিরিক্ত ক্রিয়াকলাপ যোগ করব। আমি সেই অঞ্চলগুলিকে চিহ্নিত করব যেগুলি সম্ভবত পরিবর্তিত হওয়ার সম্ভাবনা রয়েছে, উদাহরণস্বরূপ, মই এমন একটি জায়গা বলে মনে হচ্ছে যেখানে মানুষ (বিড়াল) এবং ঘাস যেখানে কুকুর, বিড়াল বা মানুষ হতে পারে।

আমি অবজেক্ট এবং ট্রাজেক্টোরির আকার সহ একটি মানচিত্র ক্যাপচার করব এবং এটির সাহায্যে আমি একটি বস্তু সনাক্তকরণের লক্ষ্যে একটি ক্লাস্টার তৈরি করব (পিক্সেলের নিরিখে চিত্রের মধ্যে নির্দিষ্ট আকারের সাথে) যা একটি নির্দিষ্ট গতি এবং ট্রাজেক্টোরি দিয়ে সরে যায়।

আপনি আর ব্যবহার করে এটি অর্জন করতে পারেন বা চলাচল সনাক্ত করতে এবং বিভিন্ন বস্তু অনুসরণ করার জন্য আমি ওপেনসিভি পরামর্শ দেব।


2

ওপেনসিভির ব্যাকগ্রাউন্ড বিয়োগটি আপনার কঠোর সম্পর্কে পদক্ষেপগুলি সন্ধান করবে। এরপরে আপনি বিড়াল, মানুষ, গাছ এবং ইত্যাদির মধ্যে পার্থক্য করতে শ্রেণিবদ্ধ বা আকৃতি বিশ্লেষণ ব্যবহার করতে পারেন


1

এটা কি পাখি? এটা কি বিড়াল? আমাদের কাছে কালো-সাদা বিড়াল আকারের! Magpies এখানে। যাতে ব্যর্থ হয়।

প্রথম জিনিসটি হ'ল সবুজ অঞ্চলগুলিকে বাদ দেওয়া, বিড়ালগুলি খুব কম সবুজ।

তারপরে পাথর এবং সিঁড়ির মতো স্থিতিশীল জিনিসগুলি সরাতে বাকিটিকে একটি রেফারেন্স ইমেজের সাথে তুলনা করুন।

সর্বনিম্ন আকারের অবজেক্টগুলি সনাক্ত করা সম্ভব হওয়া উচিত, তবে শ্রেণিবিন্যাসের জন্য রেজোলিউশন খুব কম। আপনার প্রতিবেশীও তার নতুন রিমোট কন্ট্রোল ড্রোন পরীক্ষা করতে পারে।

দুটি ক্যামেরার সাহায্যে আপনি অবজেক্টগুলির 3 ডি ম্যাপিং করতে এবং উড়ন্ত বস্তুগুলি মুছে ফেলতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.