এগুলি কেবলমাত্র আমি ধারণা সম্পর্কে চিন্তাভাবনা করেছি, এটি কখনও চেষ্টা করে দেখিনি তবে আমি এই জাতীয় সমস্যাগুলি সম্পর্কে ভাবতে পছন্দ করি!
তুমি শুরু করার আগে
ছবিগুলির স্বাভাবিককরণ বিবেচনা করুন, যদি অন্যগুলির তুলনায় একটি উচ্চতর রেজোলিউশন হয় তবে এই বিকল্পটি বিবেচনা করুন যে তাদের মধ্যে একটির অপরটির সংকোচিত সংস্করণ, সুতরাং রেজোলিউশনটি স্কেলিং করলে আরও সঠিক ফলাফল পাওয়া যায় provide
চিত্রের বিভিন্ন সম্ভাব্য অঞ্চলগুলি স্ক্যান করার বিষয়টি বিবেচনা করুন যা চিত্রের জুমযুক্ত অংশগুলি এবং বিভিন্ন অবস্থান ও ঘূর্ণন উপস্থাপন করতে পারে। এটি জটিল হয়ে উঠতে শুরু করে যদি চিত্রগুলির মধ্যে একটির অন্যটির স্কিউ সংস্করণ হয় তবে এগুলি আপনার চিহ্নিতকরণ এবং আপোস করা উচিত এমন সীমাবদ্ধতা sort
মাতলাব চিত্রগুলি পরীক্ষা ও মূল্যায়নের জন্য একটি দুর্দান্ত সরঞ্জাম।
অ্যালগরিদম পরীক্ষা করা হচ্ছে
আপনার পরীক্ষা করা উচিত (সর্বনিম্ন) টেস্ট ডেটার একটি বৃহত মানব বিশ্লেষিত সেট যেখানে মিলগুলি আগে থেকেই জানা যায়। উদাহরণস্বরূপ, যদি আপনার পরীক্ষার ডেটাতে আপনার 1,000 টি চিত্র থাকে যেখানে এর 5% চিত্র মেলে তবে আপনার কাছে এখন যুক্তিসঙ্গতভাবে নির্ভরযোগ্য বেঞ্চমার্ক রয়েছে। 10% ধনাত্মক সন্ধানকারী একটি অ্যালগরিদম আমাদের পরীক্ষার ডেটাতে 4% ধনাত্মক সন্ধান করে one তবে, একটি অ্যালগোরিদম সমস্ত মিল খুঁজে পেতে পারে তবে এতে একটি বিশাল 20% মিথ্যা ধনাত্মক হারও রয়েছে, তাই আপনার অ্যালগোরিদমকে রেট দেওয়ার বিভিন্ন উপায় রয়েছে।
পরীক্ষার ডেটা যতটা সম্ভব গতিশীলতার কভার করার জন্য ডিজাইন করার চেষ্টা করা উচিত যা আপনি আসল বিশ্বে খুঁজে পেতে পারেন।
এটি লক্ষণীয় যে আপনার দরকারী প্রতিটি অ্যালগরিদম অবশ্যই এলোমেলো অনুমানের চেয়ে আরও ভাল সম্পাদন করতে হবে, অন্যথায় এটি আমাদের পক্ষে অকেজো!
তারপরে আপনি একটি নিয়ন্ত্রিত উপায়ে আপনার সফ্টওয়্যারটিকে বাস্তব বিশ্বে প্রয়োগ করতে এবং এটির ফলাফলগুলি বিশ্লেষণ করতে শুরু করতে পারেন। এটি সফ্টওয়্যার প্রজেক্টের ধরণ যা ইনফিনিটামের জন্য চালিয়ে যেতে পারে, সবসময়ই আপনি তৈরি করতে পারেন এমন উন্নতি এবং উন্নতি হতে পারে, এটি কখনই শেষ না হওয়া প্রকল্পের ফাঁদে পড়ে যাওয়া সহজ হিসাবে ডিজাইন করার সময় মনে রাখা উচিত to
রঙ বালতি
দুটি ছবি সহ, প্রতিটি পিক্সেল স্ক্যান করুন এবং রঙগুলি গণনা করুন। উদাহরণস্বরূপ আপনার 'বালতি' থাকতে পারে:
white
red
blue
green
black
(অবশ্যই আপনার কাউন্টারগুলির উচ্চতর রেজোলিউশন হবে)। প্রতিবার যখন আপনি একটি 'লাল' পিক্সেল পান, আপনি লাল কাউন্টারটিকে বাড়িয়ে তোলেন। প্রতিটি বালতি বর্ণ বর্ণের প্রতিনিধি হতে পারে, উচ্চতর রেজোলিউশন আরও নির্ভুল তবে আপনার গ্রহণযোগ্য পার্থক্য হারের সাথে পরীক্ষা করা উচিত।
আপনার মোট পরিমাণ একবার হয়ে গেলে এটি দ্বিতীয় চিত্রের মোটের সাথে তুলনা করুন। আপনি দেখতে পাবেন যে প্রতিটি চিত্রের মোটামুটি অনন্য পদচিহ্ন রয়েছে, যা ম্যাচগুলি সনাক্ত করতে যথেষ্ট।
প্রান্ত সনাক্তকরণ
এজ সনাক্তকরণ ব্যবহার সম্পর্কে কীভাবে ।
(উত্স: উইকিমিডিয়া.অর্গ )
দুটি অনুরূপ ছবি প্রান্ত সনাক্তকরণের সাথে আপনাকে ব্যবহারযোগ্য এবং মোটামুটি নির্ভরযোগ্য অনন্য পদচিহ্ন সরবরাহ করতে হবে।
উভয় ছবি তুলুন এবং প্রান্ত সনাক্তকরণ প্রয়োগ করুন। সম্ভবত প্রান্তগুলির গড় বেধ পরিমাপ করুন এবং তারপরে চিত্রটি ছোট হতে পারে তার সম্ভাবনা গণনা করুন এবং প্রয়োজনে পুনরুদ্ধার করুন। নীচে বিভিন্ন ঘূর্ণায়মান প্রয়োগ গ্যাবার ফিল্টার (এক ধরণের প্রান্ত সনাক্তকরণ) এর একটি উদাহরণ রয়েছে ।
পিক্সেলের জন্য ছবি পিক্সেলের তুলনা করুন, ম্যাচগুলি এবং নন ম্যাচগুলি গণনা করুন। যদি সেগুলি ত্রুটির নির্দিষ্ট প্রান্তের মধ্যে থাকে তবে আপনার একটি মিল আছে। অন্যথায়, আপনি একটি নির্দিষ্ট পয়েন্ট পর্যন্ত রেজোলিউশন হ্রাস করার চেষ্টা করতে পারেন এবং ম্যাচের সম্ভাবনা উন্নতি করে কিনা তা দেখতে পারেন।
আগ্রহের অঞ্চলগুলি
কিছু চিত্রের স্বতন্ত্র বিভাগ / আগ্রহের অঞ্চল থাকতে পারে। এই অঞ্চলগুলি সম্ভবত বাকী চিত্রের সাথে খুব বিপরীত হয় এবং মিলগুলি খুঁজে পেতে আপনার অন্যান্য চিত্রগুলিতে অনুসন্ধান করার জন্য এটি একটি ভাল আইটেম। উদাহরণস্বরূপ এই চিত্রটি নিন:
(উত্স: metthegimp.org )
নীল রঙের নির্মাণকর্মী আগ্রহের অঞ্চল এবং এটি অনুসন্ধানের বিষয় হিসাবে ব্যবহার করা যেতে পারে। আপনার আগ্রহের অঞ্চল থেকে আপনি সম্পত্তি / ডেটা বের করতে এবং আপনার ডেটা সেটটি অনুসন্ধান করতে সেগুলি ব্যবহার করার জন্য সম্ভবত বেশ কয়েকটি উপায় রয়েছে।
আপনার যদি 2 টিরও বেশি আগ্রহের অঞ্চল থাকে তবে আপনি তাদের মধ্যে দূরত্বগুলি পরিমাপ করতে পারেন। সরলীকৃত উদাহরণটি ধরুন:
(উত্স: per2000.eu )
আমাদের আগ্রহের 3 স্পষ্ট অঞ্চল রয়েছে। অঞ্চল 1 এবং 2 এর মধ্যে দূরত্ব 200 পিক্সেল হতে পারে, 1 থেকে 3 400 পিক্সেলের মধ্যে এবং 2 এবং 3 200 পিক্সেল হতে পারে।
অনুরূপ অঞ্চলের আগ্রহের জন্য অন্যান্য চিত্র অনুসন্ধান করুন, দূরত্বের মানগুলিকে স্বাভাবিক করুন এবং আপনার সম্ভাব্য মিল রয়েছে কিনা তা দেখুন। এই কৌশলটি ঘোরানো এবং ছোট আকারের চিত্রগুলির জন্য ভাল কাজ করতে পারে। আপনার যত বেশি আগ্রহের অঞ্চল রয়েছে, প্রতিটি দূরত্বের পরিমাপ মেলে ম্যাচের সম্ভাবনা বাড়ে।
আপনার ডেটা সেটের প্রসঙ্গটি সম্পর্কে চিন্তা করা গুরুত্বপূর্ণ। উদাহরণস্বরূপ যদি আপনার ডেটা সেটটি আধুনিক শিল্প হয় তবে আগ্রহের অঞ্চলগুলি সম্ভবত বেশ কার্যকরভাবে কাজ করবে, কারণ আগ্রহের অঞ্চলগুলি সম্ভবত চূড়ান্ত চিত্রের মৌলিক অংশ হিসাবে ডিজাইন করা হয়েছিল । তবে আপনি যদি নির্মাণ সাইটের ছবিগুলির সাথে লেনদেন করছেন, অবৈধ কপির দ্বারা আগ্রহের অঞ্চলগুলি কুৎসিত হিসাবে ব্যাখ্যা করা যেতে পারে এবং উদারপন্থীভাবে ক্রপ / সম্পাদনা করা যেতে পারে। আপনার ডেটাসেটের সাধারণ বৈশিষ্ট্যগুলি মনে রাখবেন এবং সেই জ্ঞানটি কাজে লাগানোর চেষ্টা করুন।
চালাতে
দুটি চিত্রকে রূপায়িত করা হ'ল পদক্ষেপের একটি সেট দিয়ে একটি চিত্র অন্যকে রূপান্তরিত করার প্রক্রিয়া:
দ্রষ্টব্য, এটি অন্য চিত্রের বিবর্ণ হওয়ার চেয়ে আলাদা!
অনেকগুলি সফ্টওয়্যার প্যাকেজ রয়েছে যা চিত্রগুলিকে আকার দিতে পারে। এটি একটি ট্রানজিশনাল ইফেক্ট হিসাবে traditionতিহ্যগতভাবে ব্যবহৃত হয়, দুটি চিত্র সাধারণত অর্ধেকভাবে কিছুতে রূপ নেয় না, একটি চূড়ান্ত রূপটি চূড়ান্ত ফলাফল হিসাবে অন্য চরমের মধ্যে রূপ দেয়।
কেন এটি দরকারী হতে পারে? আপনি যে मॉर्फিং অ্যালগরিদম ব্যবহার করেন তার উপর নির্ভরশীল, চিত্রগুলির মিল এবং মরফিং অ্যালগরিদমের কিছু পরামিতিগুলির মধ্যে একটি সম্পর্ক থাকতে পারে।
গুরুতর ওভার সরলীকৃত উদাহরণে, যখন কম পরিবর্তন করা হয় তখন একটি অ্যালগরিদম দ্রুত সম্পাদন করতে পারে। আমরা তখন জানি যে এই দুটি চিত্র একে অপরের সাথে সম্পত্তি ভাগ করে নেওয়ার উচ্চতর সম্ভাবনা রয়েছে।
এই কৌশলটি ঘোরানো, বিকৃত, স্কিউড, জুমড, সমস্ত ধরণের অনুলিপি করা চিত্রগুলির জন্য ভালভাবে কাজ করতে পারে । আবার এটি আমার কাছে কেবল একটি ধারণা ছিল, যতটা আমি সচেতন (এটি যদিও আমি দৃ hard় দেখি না) এটি কোনও গবেষকৃত একাডেমিয়ার উপর ভিত্তি করে নয়, সুতরাং এটি সীমিত / কোনও ফলাফল ছাড়াই আপনার পক্ষে অনেক কাজ হতে পারে।
জিপ করা
এই প্রশ্নের ওউর উত্তরটি দুর্দান্ত, আমি এআই পড়ার ক্ষেত্রে এই ধরণের কৌশলগুলি সম্পর্কে পড়তে মনে করি। কর্পাস লিক্সকনগুলির তুলনা করতে এটি বেশ কার্যকর।
কর্পাসের সাথে তুলনা করার সময় একটি আকর্ষণীয় অপ্টিমাইজেশন হ'ল আপনি খুব সাধারণ বলে বিবেচিত শব্দগুলি মুছে ফেলতে পারেন, উদাহরণস্বরূপ 'দ্য', 'এ', 'এবং' ইত্যাদি এই শব্দগুলি আমাদের ফলাফলকে ম্লান করে দেয়, আমরা দুটি কর্পস কতটা পৃথক সে বিষয়ে কাজ করতে চাই want যাতে এগুলি প্রক্রিয়াজাতকরণের আগে মুছে ফেলা যায়। সম্ভবত চিত্রগুলিতে অনুরূপ সাধারণ সংকেত রয়েছে যা সংক্ষেপণের আগে ছিনিয়ে নেওয়া যেতে পারে? এটি সন্ধান করা মূল্যবান হতে পারে।
সংকোচনের অনুপাত উভয় উপাত্তের সমান পরিমাণ নির্ধারণের জন্য খুব দ্রুত এবং যুক্তিসঙ্গত কার্যকর উপায়। কম্প্রেশন কীভাবে কাজ করে সে সম্পর্কে পড়া আপনাকে কেন এটি এত কার্যকর হতে পারে তা একটি ভাল ধারণা দেয়। দ্রুত অ্যালগরিদম প্রকাশের জন্য এটি সম্ভবত একটি ভাল শুরুর পয়েন্ট হবে।
স্বচ্ছতা
আবার আমি নিশ্চিত নই যে নির্দিষ্ট চিত্রের ধরণগুলি, জিআইএফ পিএনজি ইত্যাদির জন্য স্বচ্ছতার ডেটা কীভাবে সংরক্ষণ করা হয় তবে এটি নিষ্কাশনযোগ্য হবে এবং আপনার ডেটার সাথে স্বচ্ছতার সাথে তুলনা করার জন্য কার্যকর সরলীকৃত কাট হিসাবে কাজ করবে।
উল্টানো সংকেত
একটি চিত্র কেবল একটি সংকেত। আপনি যদি কোনও স্পিকারের থেকে কোনও শব্দ বাজান এবং আপনি ঠিক একই ভলিউমে নিখুঁত সিঙ্কে অন্য স্পিকারের বিপরীত শব্দটি খেলেন, তারা একে অপরকে বাতিল করে দেয়।
(উত্স: themotorreport.com.au )
চিত্রগুলি উল্টে দিন এবং এটি আপনার অন্যান্য চিত্রের সাথে যুক্ত করুন। আপনি ইতিবাচক ম্যাচ বা আংশিক ম্যাচ সরবরাহ করতে পিক্সেল পর্যাপ্ত পরিমাণে সাদা (বা কালো? আমি এটাকে একটি নিরপেক্ষ ক্যানভাস হিসাবে উল্লেখ করব) যতক্ষণ না আপনি ফলস্বরূপ কোনও চিত্র খুঁজে না পাওয়া পর্যন্ত এটি / লুপের অবস্থানগুলি পুনরাবৃত্তি আকারে স্কেল করুন।
তবে, দুটি চিত্রের সমান হিসাবে বিবেচনা করুন, তাদের মধ্যে একটিতে এটিতে একটি উজ্জ্বল প্রভাব প্রয়োগ করা হয়েছে:
(সূত্র: এমসিবারুরজটকম )
এর মধ্যে একটিকে উল্টানো, তারপরে অন্যটিতে যুক্ত করার ফলে একটি নিরপেক্ষ ক্যানভাস তৈরি হবে না যা আমরা লক্ষ্য করছি। যাইহোক, উভয় আসল চিত্র থেকে পিক্সেল তুলনা করার সময়, আমরা অবশ্যই উভয় মধ্যে একটি স্পষ্ট সম্পর্ক দেখতে পারেন।
আমি এখন কয়েক বছর ধরে রঙ অধ্যয়ন করি নি, এবং বর্ণ বর্ণচিহ্নটি একটি রৈখিক স্কেলে থাকে কিনা তা সম্পর্কে আমি নিশ্চিত নই, তবে যদি আপনি উভয় ছবির মধ্যে রঙের পার্থক্যের গড় ফ্যাক্টরটি নির্ধারণ করেন তবে আপনি প্রক্রিয়া করার আগে এই মানটি ডেটা স্বাভাবিক করার জন্য ব্যবহার করতে পারেন এই কৌশল।
ট্রি ডেটা স্ট্রাকচার
প্রথমে এগুলি সমস্যার জন্য উপযুক্ত মনে হয় না তবে আমি মনে করি তারা কাজ করতে পারে।
আপনি কোনও চিত্রের কয়েকটি বৈশিষ্ট্য বের করার বিষয়ে চিন্তা করতে পারেন (উদাহরণস্বরূপ রঙিন বিন) এবং একটি হাফম্যান ট্রি বা অনুরূপ ডেটা স্ট্রাকচার তৈরি করতে পারে। আপনি মিলের জন্য দুটি গাছের তুলনা করতে সক্ষম হতে পারেন। এটি ফটোগ্রাফিক ডেটার জন্য উদাহরণস্বরূপ রঙের বৃহত বর্ণালী সহ ভাল কাজ করবে না, তবে কার্টুন বা অন্যান্য হ্রাস রঙিন চিত্রগুলি এটি কাজ করতে পারে।
এটি সম্ভবত কাজ করবে না, তবে এটি একটি ধারণা। Trie datastructure উদাহরণ হচ্ছে dictionarty জন্য, সংরক্ষণকারী শব্দকোষ এ মহান। এটি একটি উপসর্গ গাছ। কোনও ট্রাই তৈরির জন্য সম্ভবত কোনও অভিধানের সমান একটি চিত্র তৈরি করা সম্ভব (আবার আমি কেবল রঙের কথা ভাবতে পারি)। যদি আপনি 300x300 চিত্রটি 5x5 স্কোয়ারে কমিয়ে ফেলে থাকেন, তবে প্রতিটি 5x5 বর্গটিকে রঙের অনুক্রমের আকারে বিভক্ত করুন যার ফলে ফলাফল থেকে ডেটা তৈরি করতে পারেন। যদি 2x2 বর্গ থাকে:
FFFFFF|000000|FDFD44|FFFFFF
আমাদের কাছে মোটামুটি অনন্য ট্রাই কোড রয়েছে যা 24 টি স্তরের প্রসারিত করে, স্তরগুলি বাড়িয়ে / হ্রাস করে (IE উপ-বর্গক্ষেত্রের আকার হ্রাস / বৃদ্ধি) আরও সঠিক ফলাফল পেতে পারে।
ত্রি গাছের তুলনা করা যুক্তিসঙ্গতভাবে সহজ হওয়া উচিত এবং এটি কার্যকর কার্যকর ফলাফল প্রদান করতে পারে।
আরও ধারণা
আমি উপগ্রহের চিত্রের শ্রেণিবিন্যাস সম্পর্কে একটি আকর্ষণীয় কাগজ প্রজাতির হোঁচট খেয়েছি , এর রূপরেখা:
টেক্সচারের ব্যবস্থাগুলি বিবেচনা করা হয়: কোকোরিয়েন্স ম্যাট্রিকেস, ধূসর-স্তরের পার্থক্য, টেক্সচার-টোন বিশ্লেষণ, ফুরিয়ার বর্ণালী থেকে প্রাপ্ত বৈশিষ্ট্য এবং গ্যাবার ফিল্টার। কিছু ফুরিয়ার বৈশিষ্ট্য এবং কিছু গ্যাবার ফিল্টার ভাল পছন্দ হিসাবে দেখা গিয়েছিল, বিশেষত যখন একটি একক ফ্রিকোয়েন্সি ব্যান্ড শ্রেণিবদ্ধকরণের জন্য ব্যবহৃত হত।
এই পরিমাপগুলি আরও বিশদে বিশদভাবে তদন্ত করার উপযুক্ত হতে পারে, যদিও এর মধ্যে কিছু আপনার ডেটা সেটের সাথে প্রাসঙ্গিক নাও হতে পারে।
অন্যান্য বিষয় বিবেচনা করা উচিত
এই ধরণের জিনিসটিতে সম্ভবত প্রচুর কাগজপত্র রয়েছে, সুতরাং সেগুলির কয়েকটি পড়ার ক্ষেত্রে সহায়তা করা উচিত যদিও তারা খুব প্রযুক্তিগত হতে পারে। এটি কম্পিউটিংয়ের ক্ষেত্রে একটি চূড়ান্ত ক্ষেত্র, এর সাথে অনেক লোক একই রকম কাজ করার চেষ্টা করে ব্যর্থ হয়েছে fruit এটিকে সহজ রাখা এবং সেই ধারণাগুলির উপর ভিত্তি করে বেড়াতে যাওয়ার সেরা উপায় হবে। এলোমেলো ম্যাচের হারের চেয়ে আরও ভাল একটি অ্যালগরিদম তৈরি করা এবং এটির উন্নতি শুরু করা আসলেই অর্জন করা বেশ কঠিন হয়ে ওঠা উচিত বলে মনে করা উচিত difficult
প্রতিটি পদ্ধতির সম্ভবত পরীক্ষার এবং ভালভাবে টুইঙ্ক করা দরকার, আপনি যে ধরণের চিত্রের পাশাপাশি পরীক্ষা করে যাবেন সে সম্পর্কে যদি আপনার কাছে কোনও তথ্য থাকে তবে এটি কার্যকর হবে be উদাহরণস্বরূপ বিজ্ঞাপনগুলির জন্য, তাদের অনেকের মধ্যে পাঠ্য থাকবে, সুতরাং পাঠ্য স্বীকৃতিগুলি করা বিশেষত অন্যান্য সমাধানগুলির সাথে মিলিত হয়ে ম্যাচগুলি সন্ধান করার একটি সহজ এবং সম্ভবত খুব নির্ভরযোগ্য উপায়। পূর্বে উল্লিখিত হিসাবে, আপনার ডেটা সেটের সাধারণ বৈশিষ্ট্যগুলি কাজে লাগানোর চেষ্টা করুন।
একটি ওজনযুক্ত ভোট (তাদের কার্যকারিতার উপর নির্ভরশীল) থাকতে পারে এমন প্রতিটি বিকল্পের পরিমাপ এবং কৌশলগুলির সংমিশ্রণ হ'ল আপনি এমন একটি পদ্ধতি তৈরি করতে পারেন যা আরও সঠিক ফলাফল তৈরি করে।
যদি একাধিক অ্যালগোরিদম নিয়োগ করা হয়, যেমন এই উত্তরটির সূচনা হিসাবে উল্লেখ করা হয়েছে, তবে সমস্ত ধনাত্মক সন্ধান করতে পারে তবে 20% এর মিথ্যা ধনাত্মক হার রয়েছে, অন্য অ্যালগরিদমের বৈশিষ্ট্য / শক্তি / দুর্বলতাগুলি অধ্যয়ন করা আগ্রহী হবে অন্যের থেকে প্রত্যাবর্তিত মিথ্যা ইতিবাচকতা দূর করতে কার্যকর হোন
কখনই শেষ না হওয়া প্রকল্পটি শেষ করার চেষ্টা না করার জন্য সতর্ক থাকুন, শুভকামনা!