আমি একটি কম্পিউটার প্রোগ্রাম লিখেছি যা কম্পিউটার দৃষ্টি (গাউসিয়ান ব্লার, প্রান্তিককরণ, হাফ-ট্রান্সফর্ম ইত্যাদি) এর জন্য কিছু স্ট্যান্ডার্ড চিত্র ব্যবহার করে একটি স্ট্যাটিক ইমেজ (.jpeg, .png, ইত্যাদি) মুদ্রা সনাক্ত করতে পারে। প্রদত্ত চিত্র থেকে উত্পন্ন কয়েনের অনুপাত ব্যবহার করে, আমি নিশ্চিত করে বলতে পারি কোনটি মুদ্রা কোনটি। যাইহোক, আমি আমার আত্মবিশ্বাসের স্তরগুলিতে যুক্ত হতে চাই এবং এটিও নির্ধারণ করতে চাই যে আমি যে মুদ্রাটি টাইপ-এ (ব্যাসার্ধ অনুপাত থেকে) হ'ল তাও সঠিক কোলো [u] আর এর কিনা। সমস্যাটি হ'ল ব্রিটিশ কয়েন এট আল এর জন্য। (তামা, রৌপ্য, সোনার), সম্পর্কিত রঙগুলি (তামা থেকে সোনার উদাহরণ) খুব মিল।
আমার একটি রুটিন রয়েছে যা রেডগ্রাইন ব্লু (আরজিবি) 'রঙ-স্পেস' এবং এই রঙটিকে হিউস্যাচুরেশনব্রাইটনেস (এইচএসবি বা এইচএসভি) 'রঙ-স্পেস' এ রূপান্তর করতে রুটিনের ক্ষেত্রে প্রদত্ত মুদ্রার গড় রঙটি বের করে।
তিনটি মুদ্রার বর্ণের মধ্যে পার্থক্য করার চেষ্টা করার সাথে আরজিবি খুব ভাল কাজ করে না (উদাহরণের সাথে সংযুক্ত [বেসিক] চিত্রটি দেখুন)। বিভিন্ন মুদ্রার ধরণের রঙের জন্য আমার কাছে নিম্নলিখিত রেঞ্জগুলি এবং সাধারণ মান রয়েছে:
দ্রষ্টব্য: এখানে আদর্শ মানটি একটি বাস্তব চিত্রের 'পিক্সেল-ওয়াইন' মানে ব্যবহার করে নির্বাচিত একটি।
**Copper RGB/HSB:** typicalRGB = (153, 117, 89)/(26, 0.42, 0.60).
**Silver RGB/HSB:** typicalRGB = (174, 176, 180)/(220, 0.03, 0.71).
**Gold RGB/HSB:** typicalRGB = (220, 205, 160)/(45, 0.27, 0.86)
আমি প্রথমে একটি নির্ধারিত গড় মুদ্রার রঙ (আরজিবি ব্যবহার করে) এবং আরজিবি মানকে ভেক্টর হিসাবে বিবেচনা করে উপরে বর্ণিত প্রতিটি মুদ্রার ধরণের সাধারণ মানের মধ্যে 'ইউক্যালিডিয়ান দূরত্ব' ব্যবহার করার চেষ্টা করেছি; তামা জন্য আমাদের হবে:
যেখানে পার্থক্যটির সর্বনিম্ন মান ( ) আমাদের জানায় যে প্রদত্ত মুদ্রাটি কোন ধরণের হতে পারে। এই পদ্ধতিটি নিজেকে খুব সঠিক হিসাবে দেখিয়েছে।
আমি কেবল উপরের সরবরাহিত ধরণের সাধারণ মানের সাথে কয়েনের বর্ণের তুলনা করার চেষ্টা করেছি। যদিও তাত্ত্বিকভাবে ইমেজগুলির বিভিন্ন brightজ্জ্বল্য এবং স্যাচুরেশন স্তরের সাথে সামঞ্জস্য করার জন্য এটি আরও অনেক ভাল 'রঙ-স্পেস' সরবরাহ করে তবে এটিও যথেষ্ট সঠিক ছিল না।
প্রশ্ন: রঙের উপর ভিত্তি করে একটি মুদ্রার প্রকার নির্ধারণ করার জন্য সেরা পদ্ধতি কী (কোনও স্থির চিত্র থেকে)?
আপনার সময় জন্য অনেক ধন্যবাদ।
সম্পাদনা 1
দ্রষ্টব্য: আমি নীচে আলোচিত সমস্ত ধারণার চেষ্টা করেছি এবং কিছুই অর্জন করতে পেরেছি না। আলোক পরিস্থিতিগুলির বৈচিত্র (এমনকি একই চিত্রের মধ্যেও) এই সমস্যাটিকে খুব শক্ত করে তোলে এবং এটি বিবেচনায় নেওয়া উচিত।
সম্পাদনা 2 (ফলাফলের সংক্ষিপ্তসার)
আপনার উত্তরের জন্য ধন্যবাদ। আমার নিজের আরও গবেষণা (আপনার উত্তর এবং মতামত সহ) আলোকপাত করেছে যে স্বেচ্ছাসেবী আলো, স্বেচ্ছাসেবক ক্যামেরা (মোবাইল ডিভাইস), মুদ্রার বর্ণের ওঠানামা (এমনকি একই প্রজাতির / প্রকারের জন্যও) জেনেরিক ক্ষেত্রে এই সমস্যাটি মোকাবিলা করতে কতটা শক্তিশালী তা ঠিক তুলে ধরা হয়েছে even ইত্যাদি। আমি প্রথমদিকে ত্বকের রঙ স্বীকৃতি (গবেষণার একটি অত্যন্ত সক্রিয় ক্ষেত্র) এর দিকে লক্ষ্য করেছি এবং একা ককেশীয়দের জন্য ত্বকের রঙ স্বীকৃতি নিয়ে এখনও অনেক সমস্যা রয়েছে ( এই কাগজটি দেখুন বর্তমান কৌশলগুলি পর্যালোচনা করার জন্য ), এবং এই সমস্যাটিতে তিনটি স্বতন্ত্র রঙের অবজেক্ট রয়েছে যেগুলির মধ্যে ক্রমাগত এবং বিচিত্র ক্রোমাক্সিটি কম্পিউটার দৃষ্টিভঙ্গির এই বিষয়টিকে শ্রেণিবদ্ধ করা এবং সেই অনুযায়ী মোকাবেলা করতে খুব কঠিন করে তোলে (বাস্তবে আপনি এটিতে ভাল পিএইচডি করতে পারেন) could !)।
আমি নীচে ডিডাব্লু দ্বারা খুব সহায়ক পোস্ট থেকে গামুট প্রতিবন্ধক পদ্ধতিটি দেখেছি । এটি প্রথম দর্শনে ইমেজ এবং আলোর কন্ডিশনের চেয়ে পৃথক পৃথক কয়েন বস্তুগুলিকে রঙগুলিতে রূপান্তর করার প্রাক প্রাক প্রক্রিয়া পদক্ষেপ হিসাবে প্রতিশ্রুতিবদ্ধ ছিল। তবে, এই প্রযুক্তিটিও পুরোপুরি কার্যকরভাবে কাজ করে না (এবং ম্যাপিংয়ের জন্য চিত্র / হিস্টোগ্রামগুলির একটি গ্রন্থাগার জড়িত - যা আমি toোকাতে চাই না) এবং এর চেয়ে অনেক জটিল নিউরাল নেটওয়ার্ক আর্কিটেকচার পদ্ধতিগুলিও কার্যকর করে না। আসলে এই কাগজটি বিমূর্তে বলেছে যে:
"current machine colour constancy algorithms are not good enough for colour-based
object recognition.".
এর অর্থ এই নয় যে এই বিষয়ে খুব বেশি আপ টু ডেট কাগজপত্র নেই out তবে আমি সেগুলি খুঁজে পাচ্ছি না এবং এটি বর্তমানে খুব সক্রিয় গবেষণা অঞ্চল বলে মনে হয় না।
উত্তর AVB দ্বারা এছাড়াও সহায়ক ছিল এবং আমি এল মধ্যে তাকিয়ে আছে একটি বি * সংক্ষিপ্তভাবে।
"The nonlinear relations for L*, a*, and b* are intended to mimic the nonlinear
response of the eye. Furthermore, uniform changes of components in the L*a*b* colour
space aim to correspond to uniform changes in perceived colour, so the relative
perceptual differences between any two colours in L*a*b* can be approximated by
treating each colour as a point in a three dimensional space."
আমি যা পড়েছি তা থেকে, আমার ডিভাইস নির্ভর চিত্রগুলির জন্য এই রঙের স্থানটিতে রূপান্তরটি জটিল হবে - তবে আমি যখন আরও কিছুটা সময় পাব তখন আমি এটিকে বিস্তারিতভাবে দেখব (কোনওরকম প্রয়োগের দিকে দৃষ্টি দিয়ে)।
আমি এই সমস্যার নিবিড় সমাধানের জন্য আমার নিঃশ্বাস ধরে রাখছি না এবং এল এ বি * এর সাথে চেষ্টা করার পরে আমি মুদ্রার রঙ অবহেলা করব এবং আমার বর্তমান জ্যামিতিক শনাক্তকরণ অ্যালগরিদমগুলি (সঠিক উপবৃত্তাকার হাফ ট্রান্সফর্ম ইত্যাদি) সন্ধান করতে চাই।
সবাইকে ধন্যবাদ. এবং এই প্রশ্নের শেষ নোট হিসাবে, এখানে একটি নতুন জ্যামিতিক সনাক্তকরণ অ্যালগরিদম সহ একই চিত্র এখানে রয়েছে, যার কোনও রঙ স্বীকৃতি নেই: