কাছাকাছি-সদৃশ চিত্র সনাক্তকরণ [বন্ধ]


93

একে অপরের সাথে মিল রেখে চিত্রের দেওয়া সেটকে সাজানোর দ্রুততম উপায় কী What's

এই মুহুর্তে আমার কাছে একটি সিস্টেম রয়েছে যা দুটি চিত্রের মধ্যে হিস্টোগ্রাম বিশ্লেষণ করে তবে এটি একটি খুব ব্যয়বহুল অপারেশন এবং এটি অত্যধিক ওভারকিল বলে মনে হচ্ছে।

সর্বোত্তমভাবে আমি এমন একটি অ্যালগরিদম সন্ধান করছি যা প্রতিটি চিত্রকে একটি স্কোর দেয় (উদাহরণস্বরূপ একটি পূর্ণসংখ্যার স্কোর, যেমন আরজিবি গড়) এবং আমি কেবল সেই স্কোর অনুসারে বাছাই করতে পারি। একে অপরের পাশের আইডেন্টিকাল স্কোর বা স্কোরগুলি সম্ভাব্য সদৃশ।

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994 

আরজিবি প্রতি গড় গড় স্তন্যপান করে, সেখানে কি তেমন কিছু পাওয়া যায়?


4
একটি মূল প্রশ্ন, আপনি কী লিখেছেন এবং নাফ যা উল্লেখ করেছেন সম্পর্কিত প্রশ্নের উত্তর সম্পর্কে ভেবে আপনি সম্ভবত "সাম্য" এর অর্থ কী আরও পরিষ্কারভাবে ব্যাখ্যা করতে চাইতে পারেন। একটি চিত্র যা অভিন্ন, তবে পাঁচ পিক্সেল অফসেট, "অনুরূপ" হতে পারে? দৃশ্যত হ্যাঁ ... তবে একটি অ্যালগরিদমের কাছে ... সম্ভবত না, আপনি যদি না ভেবে থাকেন এবং এটির জন্য অ্যাকাউন্ট না করেন ounted আপনি কি আরও বিশদ সরবরাহ করতে পারেন? ডুপ্লিকেটগুলি সঠিক হবে, বা কেবল "বন্ধ"? আপনি কি স্ক্যানগুলি দেখছেন যেখানে তারা সামান্য কোণ পরিমাপের দ্বারা পৃথক হতে পারে? তীব্রতা কেমন? এখানে প্রচুর ভেরিয়েবল রয়েছে ...
বেসকা

'সদৃশ' কীভাবে আলাদা? উদাহরণস্বরূপ, তারা কি বিভিন্ন পোজ / শিফট সহ একই অবস্থানের চিত্র হবে? আপনি ইমেজ সংখ্যা সহ ও (এনলগ (এন)) এমন কিছু চান বলে মনে করছেন। কেউ কি জানেন এটা সম্ভব কিনা? দেখে মনে হচ্ছে এটি হতে পারে ..
জাস্টিন শাইনার

@ অজানা: আপনি যদি বর্তমানের উত্তরগুলির সাথে সন্তুষ্ট না হন তবে আপনি কি আমাদের আরও কিছু দিকনির্দেশনা দিতে পারেন? আমরা আপনার প্রশ্নের উত্তর দেওয়ার জন্য যথাসাধ্য চেষ্টা করেছি, তবে কোনও প্রতিক্রিয়া ছাড়াই আমরা আরও ভাল কিছু নিয়ে আসার সম্ভাবনা নেই।
নাফ

এটি বর্তমানে কম্পিউটার সায়েন্সের অন্যতম দুর্দান্ত সমাধানযোগ্য সমস্যা। শুভকামনা বন্ধু।
জন কেটজিক

উত্তর:


70

চিত্র অনুসন্ধান এবং সাদৃশ্য ব্যবস্থা সম্পর্কে অনেক গবেষণা হয়েছে। এটি কোনও সহজ সমস্যা নয়। সাধারণভাবে, intচিত্রগুলি খুব অনুরূপ কিনা তা নির্ধারণের জন্য একটি একক যথেষ্ট নয়। আপনার কাছে উচ্চ ভ্রান্ত-ইতিবাচক হার থাকবে।

যাইহোক, যেহেতু প্রচুর গবেষণা হয়েছে, আপনি এটির কিছুটা দেখুন। উদাহরণস্বরূপ, এই কাগজটি (পিডিএফ) একটি কমপ্যাক্ট ইমেজ ফিঙ্গারপ্রিন্টিং অ্যালগরিদম দেয় যা নকল চিত্রগুলি দ্রুত এবং বেশি ডেটা সংরক্ষণ না করে সন্ধানের জন্য উপযুক্ত। মনে হচ্ছে যদি আপনি শক্ত কিছু জোর চান তবে এটি সঠিক পদ্ধতির।

আপনি যদি সহজ কিছু, তবে স্পষ্টতই আরও বেশি কিছু খুঁজছেন তবে এই প্রশ্নটিতে কয়েকটি শালীন ধারণা রয়েছে।


4
সেই কাগজটি 2004 সালের, এখনও নিশ্চিত না যে এটি এখনও সেরা উত্তর?
অ্যান্ড্রু

50

আমি কেবল একটি আরজিবি হিস্টোগ্রাম ব্যবহার করা থেকে সরে যাওয়ার কথা বিবেচনা করার পরামর্শ দেব recommend

আপনি যদি ইমেজটির 2 ডি হার তরঙ্গবিশেষ গ্রহণ করেন (এটির গড়পড়তা মাত্র অনেক বেশি এবং আপনার সহগের ওজন ব্যবহার করতে কিছু বর্গাকার মূল) এবং কেবলমাত্র বৃহত্তম কে ধরে রাখেন তবে আপনার চিত্রের একটি আরও ভাল ডাইজেস্ট পাওয়া যাবে তরঙ্গলে ভারী সহগগুলি একটি বিরল ভেক্টর হিসাবে, এটি স্বাভাবিক করুন এবং এর আকার হ্রাস করতে এটি সংরক্ষণ করুন। আপনার আরজি এবং বি পুনরুদ্ধার করা উচিত কমপক্ষে আগে থেকেই উপলব্ধিযুক্ত ওজন ব্যবহার করে বা আমি YIQ (বা YCoCg, সারণীর কোলাহল এড়াতে স্যুইচ করার পরামর্শ দিচ্ছি) যাতে আপনি ক্রমিনাম তথ্যকে হ্রাসের গুরুত্ব সহ নমুনা করতে পারেন।

মিলের পরিমাপ হিসাবে আপনি এখন এই দু'টি স্পর্স নরমালাইজড ভেক্টরগুলির ডট পণ্য ব্যবহার করতে পারেন। বৃহত্তম বিন্দু পণ্যগুলির সাথে চিত্রগুলির জোড়াগুলি কাঠামোর সাথে খুব একই রকম হতে চলেছে। এটির আকার পরিবর্তন, হিউ শিফটিং এবং ওয়াটারমার্কিং থেকে সামান্য প্রতিরোধী হওয়া এবং বাস্তবায়ন করা এবং কমপ্যাক্ট করা সত্যিই সহজ হওয়ার সুবিধা রয়েছে।

আপনি কে বাড়িয়ে বা হ্রাস করে স্টোরেজ এবং নির্ভুলতার বাণিজ্য করতে পারেন।

একক সংখ্যার স্কোর অনুসারে বাছাই করা এই ধরণের শ্রেণিবিন্যাস সমস্যার জন্য অক্ষম হতে চলেছে। আপনি যদি এটির বিষয়ে চিন্তা করেন তবে চিত্রগুলির কেবল একটি অক্ষ বরাবর 'পরিবর্তন' করতে সক্ষম হওয়া প্রয়োজন, তবে তারা তা করে না। এজন্য আপনার বৈশিষ্ট্যগুলির একটি ভেক্টর প্রয়োজন। হর ওয়েভলেট ক্ষেত্রে এটি প্রায় যেখানে চিত্রটিতে তীব্র বিরতি ঘটে। আপনি চিত্রের জোড়ের মধ্যে একটি দূরত্ব গণনা করতে পারেন, তবে যেহেতু আপনার সমস্ত কিছুই একটি দূরত্বের মেট্রিক তাই লিনিয়ার অর্ডারের কাছে 3 টি চিত্রের একটি 'ত্রিভুজ' প্রকাশ করার কোনও উপায় নেই যা সমস্ত সমান দূরবর্তী। (অর্থাত্ সবুজ, এমন একটি চিত্র যা সমস্ত লাল এবং একটি চিত্র যা সমস্ত নীল of

এর অর্থ হল যে আপনার সমস্যার যে কোনও বাস্তব সমাধানের জন্য আপনার কাছে থাকা চিত্রের সংখ্যা (ও n 2) অপারেশন প্রয়োজন। যদি পরিমাপটিকে লিনিয়ারাইজ করা সম্ভব হয় তবে আপনার যদি মাত্রা (n লগ এন), বা ও (এন) প্রয়োজন হতে পারে তবে যদি পরিমাপটি একটি রেডিক্স সাজানোর জন্য উপযুক্ত ছিল। এটি বলেছিল, আপনাকে ও (এন ^ 2) ব্যয় করার দরকার নেই যেহেতু অনুশীলনে আপনার পুরো সেটটি চালানোর দরকার নেই, আপনাকে কেবল কিছু প্রান্তিকের চেয়ে কাছে স্টাফের সন্ধান করতে হবে। সুতরাং আপনার ছড়িয়ে ছিটিয়ে থাকা ভেক্টর স্পেসকে বিভাজন করার জন্য একাধিক কৌশল প্রয়োগের মাধ্যমে আপনি 'প্রতিদ্বন্দ্বিতাগুলির চেয়ে বেশি সাদৃশ্যযুক্ত চিত্রগুলির সন্ধানের জন্য' সমস্যার জন্য খুব দ্রুত অ্যাসিপটিক্স অর্জন করতে পারেন নির্দ্বিধায় প্রতিটি চিত্রের তুলনায় প্রতিটি চিত্রের তুলনা করে, আপনাকে কী দেয় আপনার সম্ভবত দরকার ... আপনি যা চেয়েছিলেন ঠিক তা না হলে।

যে কোনও ইভেন্টে, আমি কয়েক বছর আগে এটি সংরক্ষণ করেছিলাম এমন বিভিন্ন টেক্সচারের সংখ্যা কমিয়ে আনার চেষ্টা করার সময় ব্যক্তিগতভাবে ভাল প্রভাব ফেলতে ব্যবহার করেছি, তবে এই জায়গাগুলিতে এর কার্যকারিতাটি প্রদর্শন করে প্রচুর গবেষণার শব্দও হয়েছে (এবং এই ক্ষেত্রে তুলনা করে এটি হিস্টগ্রাম শ্রেণিবিন্যাসের আরও পরিশীলিত রূপে):

http://www.cs.princeton.edu/cass/papers/spam_ceas07.pdf

সনাক্তকরণে যদি আপনার আরও সঠিকতার প্রয়োজন হয় তবে সম্পাদনাগুলি আরও দৃust়তার সাথে মোকাবিলা করার জন্য মিনহ্যাশ এবং টিএফ-আইডিএফ আলগোরিদিমগুলি হর ওয়েভলেট (বা হিস্টোগ্রাম) দিয়ে ব্যবহার করা যেতে পারে:

http://cmp.felk.cvut.cz/~chum/papers/chum_bmvc08.pdf

পরিশেষে, স্ট্যানফোর্ডের এই ধরণের পদ্ধতির আরও বহিরাগত বৈকল্পিকের উপর ভিত্তি করে একটি চিত্র অনুসন্ধান রয়েছে, চিত্রগুলির ঘোরানো বা স্কেল করা অংশগুলি অনুসন্ধানের জন্য ওয়েভলেটগুলি থেকে আরও বৈশিষ্ট্য নিষ্কাশন করার উপর ভিত্তি করে, তবে সম্ভবত এটি আপনার কাজের পরিমাণ ছাড়িয়ে যায় you আমি করতে চাই।

http://wang14.ist.psu.edu/cgi-bin/zwang/regionsearch_show.cgi


দেখে মনে হচ্ছে আপনি পরোক্ষভাবে কেডি-ট্রি বর্ণনা করছেন এবং সম্ভাব্য প্রার্থীদের জন্য জায়গা অনুসন্ধান করার মতো। এটি লক্ষ্য করার মতো হতে পারে।
বুজুম

4
হ্যাঁ, আমি যে কারণে অস্পষ্ট ধারণাটির বাইরে কৌশলগুলি নির্দিষ্ট না করেছি তা হ'ল যখন আপনার জায়গাতে তুলনামূলকভাবে কম সংখ্যক মাত্রা থাকবে তখন কেডি-ট্রিগুলি ভাল কাজ করে। এখানে আপনার সম্ভবত সম্ভবত 128 ডলার বা তার বেশি মাত্রা রয়েছে যা খুব কম জনবহুল। যেহেতু তারা খুব কমই মূল্যবোধগুলি শূন্য হবে, সুতরাং কে-স্টাইলে বিভাজনে মাত্রা ছাড়িয়ে রাউন্ড-রবিন যাওয়া আসলে প্রায় অকেজো। একই টোকেন দিয়ে আর-গাছগুলি ভেঙে যায় এবং সম্ভবত আপনার সেরা বাজি হিসাবে রয়েছে: এক্স-ট্রি। দুর্ভাগ্যক্রমে, যখন তারা অনেকগুলি মাত্রার মুখোমুখি হয় তখন তারা তাদের পারফরম্যান্সের সীমাটিরও কাছে থাকে।
এডওয়ার্ড কেএমইটিটি

"এবং কেবল বিচ্ছিন্ন ভেক্টর হিসাবে ওয়েভলেটের সবচেয়ে বড় ওজনযুক্ত সহগকে ধরে রাখুন," - প্রতি সারি ধরে রাখুন বা পুরো তরঙ্গলেটের জন্য?
ivan.ukr

"আপনার আরজি এবং বি পুনরুদ্ধার করা উচিত কমপক্ষে আগে থেকেই উপলব্ধিযোগ্য ওজন ব্যবহার করে বা আমি YIQ (বা YCoCg, সারণীর কোলাহল এড়াতে স্যুইচ করার পরামর্শ দিই) যাতে আপনি ক্রমিনাম তথ্যকে কম গুরুত্ব সহকারে নমুনা করতে পারেন।" - এবং তারপর কি? কেবল ওয়াইয়ের জন্য তরঙ্গপত্রক বা সমস্ত চ্যানেলের জন্য এটি কি? যদি সমস্ত চ্যানেলের হয়ে থাকে - একাধিক চ্যানেলের সাথে চিত্রগুলির মিল কীভাবে পরিমাপ করা যায়? প্রতিটি চ্যানেলের ডট পণ্য যুক্ত করুন এবং এটিকে মিলের পরিমাপ হিসাবে অ্যাকাউন্ট করুন বা কিছু ওজনযুক্ত যোগ হওয়া উচিত?
ivan.ukr

15

আমি এই নামে পরিচিত একটি দ্রুত নির্ভরযোগ্য অ্যালগরিদম ফাস্ট মাল্টিস্ট্রোলিউশন ইমেজ ক্যোয়ারিং । এর জন্য আমার (প্রাচীন, অবিরাম) কোডটি এখানে

ফাস্ট মাল্টিস্ট্রোলিউশন ইমেজ কোয়েরিটি যা করে তা হ'ল ওয়াইআইকিউ কালারস্পেসের ভিত্তিতে চিত্রটিকে 3 টুকরাতে বিভক্ত করা হয় (আরজিবির চেয়ে পার্থক্যের সাথে মিল রেখে ভাল)। তারপরে প্রতিটি রঙের স্থান থেকে সর্বাধিক বিশিষ্ট বৈশিষ্ট্যগুলি উপলব্ধ না হওয়া পর্যন্ত চিত্রটি মূলত একটি তরঙ্গlet অ্যালগরিদম ব্যবহার করে সংকুচিত হয়। এই পয়েন্টগুলি একটি ডেটা স্ট্রাকচারে সংরক্ষণ করা হয়। ক্যোয়ারী ইমেজগুলি একই প্রক্রিয়াটির মধ্য দিয়ে যায় এবং ক্যোয়ারী চিত্রের বিশিষ্ট বৈশিষ্ট্যগুলি সঞ্চিত ডাটাবেসের মধ্যে থাকাগুলির সাথে মেলে। যত বেশি ম্যাচ হবে ততই চিত্রগুলি একই রকম হয়।

অ্যালগরিদম প্রায়শই "স্কেচ বাই ক্যায়ার" কার্যকারিতা জন্য ব্যবহৃত হয়। আমার সফ্টওয়্যারটি কেবল ইউআরএল এর মাধ্যমে ক্যোয়ারী চিত্রগুলিতে প্রবেশের অনুমতি দিয়েছে, সুতরাং কোনও ব্যবহারকারী ইন্টারফেস ছিল না। তবে, আমি দেখতে পেলাম যে এটি চিত্রের বৃহত সংস্করণে থাম্বনেইলের সাথে মিলে যায়।

আমার সফ্টওয়্যারটির চেয়ে অনেক বেশি চিত্তাকর্ষক পুনরুদ্ধার যা আপনাকে উত্স হিসাবে ফ্লিকার চিত্রগুলি ব্যবহার করে FMIQ অ্যালগরিদম ব্যবহার করে দেখতে দেয়। খুব ঠান্ডা! স্কেচ বা উত্স চিত্র ব্যবহার করে এটি ব্যবহার করে দেখুন এবং এটি কতটা ভাল কাজ করে তা আপনি দেখতে পারেন।


এটি এখনও ঘোরানো চিত্রগুলি চিনতে পারে?
এন্ডোলিথ

আমি সন্দেহ করি যে এটির জন্য এটি খুব ভাল কাজ করবে। প্রাসঙ্গিক ম্যাচগুলি সর্বাধিকতর করতে আপনি সম্ভবত প্রতিটি ঘূর্ণনের জন্য চিত্রগুলি এনকোড করতে চান।
লুক ফ্র্যাঙ্কল

পুনরুদ্ধারের লিঙ্কটি নিচে মনে হচ্ছে - এটি কি কোথাও সংরক্ষণাগারভুক্ত?
মিমিগডল

10

একটি ছবিতে অনেকগুলি বৈশিষ্ট্য রয়েছে, সুতরাং আপনি যদি নিজেকে একরকমের মতো সংকীর্ণ না করেন, যতক্ষণ না গড় উজ্জ্বলতা, আপনি কোনও এন-ডাইমেনশনাল সমস্যার জায়গার সাথে কাজ করছেন।

যদি আমি আপনাকে বিশ্বের শহরগুলিতে একটি একক পূর্ণসংখ্যার নিয়োগের জন্য জিজ্ঞাসা করি, তবে কোনটি নিকটে রয়েছে তা আমি বলতে পারি, ফলাফলগুলি দুর্দান্ত হবে না। আপনি উদাহরণস্বরূপ, আপনার একক পূর্ণসংখ্যা হিসাবে সময় অঞ্চল বেছে নিতে এবং নির্দিষ্ট শহরগুলির সাথে ভাল ফলাফল পেতে পারেন। তবে গ্রহের বিপরীত প্রান্তে থাকা সত্ত্বেও উত্তর মেরুর নিকটে একটি শহর এবং দক্ষিণ মেরুর নিকটে অন্য একটি শহরও একই সময় অঞ্চলে থাকতে পারে। যদি আমি আপনাকে দুটি পূর্ণসংখ্যা ব্যবহার করতে দিই তবে আপনি অক্ষাংশ এবং দ্রাঘিমাংশের সাথে খুব ভাল ফলাফল পেতে পারেন। চিত্রের মিলের জন্য সমস্যাটি একই।

যা যা বলেছিল, এমন সব অ্যালগরিদম রয়েছে যা একই চিত্রগুলিকে একসাথে ক্লাস্টার করার চেষ্টা করে, যা আপনি যা চেয়েছিলেন তা কার্যকরভাবে। আপনি যখন পিকাসার সাথে সনাক্তকরণের মুখোমুখি হন তখন এটি ঘটে। আপনি কোনও মুখ শনাক্ত করার আগেই, এটি একই রকমগুলি একসাথে ক্লাস্টার করে যাতে একই রকম মুখের সেটগুলির মধ্য দিয়ে যাওয়া এবং তাদের বেশিরভাগকে একই নাম দেওয়া সহজ।

প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস নামে একটি কৌশল রয়েছে, যা আপনাকে এন-ডাইমেনশনাল ডেটা কম পরিমাণে কমিয়ে দেয়। সুতরাং এন বৈশিষ্ট্যযুক্ত একটি ছবি একটি বৈশিষ্ট্যে হ্রাস করা যেতে পারে। তবে চিত্রগুলির তুলনা করার জন্য এটি এখনও সেরা পদ্ধতির নয়।


4
এটি একটি মোট পয়েন্ট, তবে আপনি কোনও বৈশিষ্ট্যের সংখ্যার সমন্বয় উপস্থাপন করতে একটি একক পূর্ণসংখ্যার ব্যবহার করতে পারেন, উদাহরণস্বরূপ, বৈশিষ্ট্য x = 2 এবং বৈশিষ্ট্য y = 3 এবং বৈশিষ্ট্য z = 5 এবং বৈশিষ্ট্য আ = 7, ইত্যাদি তারপরে যে মূল ভিত্তিটি একটি একক পূর্ণসংখ্যার গুণক আকারে উত্থাপিত হয়েছিল সেই নির্দিষ্ট চিত্রটির জন্য বৈশিষ্ট্যের মান হবে। আবার, একটি শব্দের পয়েন্ট কারণ সংখ্যার আকার অযৌক্তিক হবে। যদিও সেই আকার আরও কমানো যেতে পারে ... আমরা কেবল কাঠামোগত ডেটা নিয়েই কথা বলছি।
আর্গিল

সত্য। তবে আসল বিষয়টি হল সংখ্যাগুলি সাজানো যাতে অনুরূপ চিত্রগুলি সংখ্যার সাথে একত্রে থাকে। উপরে আমি যা বলেছি তা সত্ত্বেও এটি সম্ভব। সংক্ষেপে, আপনি এন-ডাইমেনশনাল স্পেসে চিত্রগুলির মাধ্যমে ন্যূনতম (বা কাছাকাছি-সর্বনিম্ন) পথ সন্ধান করার জন্য ট্র্যাভেলিং বিক্রয় বিক্রয় সমস্যার সমাধান করতে পারেন (যেখানে এন চিত্রগুলির তুলনায় আপনি যে বৈশিষ্ট্যগুলি ব্যবহার করতে চান এটির সংখ্যা)। তবে তা ব্যয়বহুল।
নীল

8

এখানে একটি সি লাইব্রেরি রয়েছে ("লিফফ্যাশ" - http://phash.org/ ) যা একটি চিত্রের "উপলব্ধিযোগ্য হ্যাশ" গণনা করবে এবং হ্যাশগুলির সাথে তুলনা করে অনুরূপ চিত্রগুলি সনাক্ত করতে দেয় (যাতে আপনার প্রতিটি চিত্রের তুলনা করতে হবে না) সরাসরি অন্য প্রতিটি চিত্রের বিপরীতে) তবে দুর্ভাগ্যক্রমে এটি চেষ্টা করার সময় এটি খুব সঠিক বলে মনে হয় নি।


5

"অনুরূপ" কী তা আপনাকে সিদ্ধান্ত নিতে হবে। বিপরীতে? হিউ?

কোনও চিত্র কি একই চিত্রের সাথে উল্টো-নীচে "অনুরূপ"?

আমি বাজি ধরছি আপনি চিত্রগুলি 4x4 টুকরো টুকরো করে এবং প্রতিটি গ্রিড কোষের গড় রঙ পেয়ে অনেক "ক্লোজ কল" খুঁজে পেতে পারেন। আপনার প্রতি ছবিতে ষোলটি স্কোর রয়েছে। সাদৃশ্য বিচার করতে, আপনি কেবল চিত্রগুলির মধ্যে পার্থক্যগুলির স্কোয়ারের একটি যোগফল করবেন।

আমি মনে করি না যে কোনও একটি হ্যাশ অর্থবোধ করে, যদি না এটি হিউ বা উজ্জ্বলতা বা বৈপরীত্যের মতো একক ধারণার বিরুদ্ধে থাকে।

আপনার ধারণাটি এখানে:

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994

প্রথমত, আমি ধরে নিতে চলেছি এগুলি হ'ল দশমিক সংখ্যা যা আর * (2 ^ 16) + জি * (2 ^ 8) + বি, বা এর মতো কিছু। স্পষ্টতই এগুলি কোনও ভাল নয় কারণ লালটি খুব বেশি ভারী হয়।

এইচএসভি স্পেসে স্থানান্তর করা আরও ভাল। আপনি এইচএসভির বিটগুলি হ্যাশের মধ্যে ছড়িয়ে দিতে পারেন , বা আপনি কেবল এইচ বা এস বা ভি পৃথকভাবে স্থির করতে পারেন, বা আপনার প্রতি ছবিতে তিনটি হ্যাশ থাকতে পারে।


আরেকটা জিনিস. যদি আপনি আর, জি, এবং বি ওজন সবুজ সর্বাধিক করেন, তবে লাল, তারপরে মানুষের চাক্ষুষ সংবেদনশীলতার সাথে মিলিয়ে নীল।


5

ওয়েব পরিষেবাদির যুগে আপনি http://tineye.com চেষ্টা করতে পারেন


4
টিনিয়ের পেছনের কোডটি মনে হয় ঠিক প্রশ্নকর্তার পরে কী হয়েছে তবে আমি একটি ওয়েব-পরিষেবা হিসাবে এটি খুব দরকারী বলে মনে করি না, যেহেতু এটির দুটি চিত্র দেওয়ার এবং জিজ্ঞাসা করার কোনও (স্পষ্ট) উপায় নেই "এগুলি কি একই রকম? " - দ্বিতীয় চিত্রটি কোনও ওয়েব-পৃষ্ঠায় থাকতে হবে এবং টিনিয়ে সূচিত হবে
dbr

4
ব্যবসায়ীরা কি এপিআই সরবরাহ করছে? তাদের সাথে যোগাযোগ করা উচিত।
zproxy

একটি বাণিজ্যিক এপিআই রয়েছে যা ঠিক সেই পরিষেবাদি সরবরাহ করে
গজুস


1

আমি ধরে নিয়েছি যে অন্যান্য অনুলিপি চিত্র অনুসন্ধান সফ্টওয়্যার চিত্রগুলিতে একটি এফএফটি সম্পাদন করে, এবং বিভিন্ন ফ্রিকোয়েন্সিগুলির মানগুলি ভেক্টর হিসাবে সংরক্ষণ করে:

Image1 = (u1, u2, u3, ..., un)
Image2 = (v1, v2, v3, ..., vn)

এবং তারপরে আপনি দুটি চিত্রের ওজন ভেক্টরগুলির মধ্যে দূরত্ব গণনা করে সমতার জন্য দুটি চিত্রের তুলনা করতে পারেন :

distance = Sqrt(
     (u1-v1)^2 +
     (u2-v2)^2 +
     (u2-v3)^2 +
     ...
     (un-vn)^2);

4
বেশিরভাগ প্রাকৃতিক চিত্রগুলির মধ্যে খুব অনুরূপ ফ্রিকোয়েন্সি সামগ্রী থাকে তাই আমি সন্দেহ করি যে এটি খুব ভাল মেট্রিক হবে।
হ্যানস ওভ্রন

1

একটি সমাধান হ'ল বুদ্বুদ সাজানোর জন্য প্রয়োজনীয় প্রতিটি ছবিতে একটি আরএমএস / আরএসএস তুলনা করা। দ্বিতীয়ত, আপনি প্রতিটি চিত্রে একটি এফএফটি সম্পাদন করতে পারেন এবং প্রতিটি চিত্রের জন্য একটি একক পূর্ণসংখ্যার পুনরুদ্ধার করতে কিছু অক্ষ করতে পারেন যা আপনি অনুসারে বাছাইয়ের জন্য সূচক হিসাবে ব্যবহার করবেন। আপনি কতটা তুচ্ছ বিবেচনা উপেক্ষা করতে চান এবং আপনার কত গতিবেগ প্রয়োজন তা নির্ভর করে মূলটির পুনরায় আকার (25%, 10%) সংস্করণে যা কিছু তুলনা করা যায় তা বিবেচনা করতে পারেন। এই সমাধানগুলি আকর্ষণীয় কিনা তা আমাকে জানান, এবং আমরা আলোচনা করতে পারি বা আমি নমুনা কোড সরবরাহ করতে পারি।


এফএফটি কেবল আপনাকে রঙ সম্পর্কিত তথ্য এবং অবস্থান সম্পর্কিত কোনও তথ্য সরবরাহ করে। আকার পরিবর্তনটি ফলাফলের চিত্রের উপর প্রভাব নির্বিশেষে প্রদত্ত আকারের নীচে সমস্ত বৈশিষ্ট্য উপেক্ষা করে। একটি ধূসর চিত্র এবং একটি চেকারবোর্ড সেই পরিমাপের অধীনে অভিন্ন হতে পারে। একটি তরঙ্গমুক্ত পদ্ধতির (ডাউবিচিজ, হার ইত্যাদি) প্রতিটি ডেটা পয়েন্টে অবস্থানিক এবং রঙের তথ্যের অনুপাতকে লেনদেন করে অবস্থান এবং রঙ উভয় তথ্য সরবরাহের সুবিধা রয়েছে।
এডওয়ার্ড কেএমইটিটি

4
না, কোনও চিত্রের এফএফটি মূলের সমস্ত স্থানিক তথ্য ধারণ করে। আপনি এফএফটি থেকে আসলটি পুনর্গঠন করতে পারেন। homepages.inf.ed.ac.uk/rbf/HIPR2/fourier.htm তবে একটি হিস্টোগ্রাম, যা আপনি যা ভাবছিলেন তা হতে পারে না।
পল

1

নিকটবর্তী সদৃশ চিত্র সনাক্তকরণ সনাক্ত করার জন্য বেশিরভাগ আধুনিক পন্থা আকর্ষণীয় পয়েন্ট সনাক্তকরণ এবং বর্ণনাকারীদের যেমন পয়েন্টগুলির আশেপাশের অঞ্চলটি বর্ণনা করে use প্রায়শই SIFT ব্যবহার করা হয়। তারপরে আপনি বর্ণনাকারীদের প্রশমিত করতে এবং ক্লাস্টারগুলিকে ভিজ্যুয়াল শব্দ শব্দভাণ্ডার হিসাবে ব্যবহার করতে পারেন।

সুতরাং আমরা যদি এই চিত্রগুলির সমস্ত ভিজ্যুয়াল শব্দের সাথে দুটি চিত্রের সাধারণ ভিজ্যুয়াল শব্দের অনুপাত দেখি তবে আপনি চিত্রগুলির মধ্যে মিলের অনুমান করেন। অনেক আকর্ষণীয় নিবন্ধ আছে। এর মধ্যে একটি সদৃশ চিত্র সনাক্তকরণের নিকটবর্তী: minHash এবং tf-idf ওজন


1

উদাহরণস্বরূপ, আইএমএমআই এক্সটেনশন এবং আইএমএমআই ব্যবহার করে আপনি চিত্রগুলির মধ্যে মিলকে কীভাবে পরিমাপ করবেন তা বিভিন্নভাবে পরীক্ষা করতে পারেন: http://spl.utko.feec.vutbr.cz/en/component/content/article/46-image-processing-extension- দ্রুত-রক্ষাকারী -5

কিছু প্রান্তিক সংজ্ঞা নির্ধারণ করে এবং কিছু পদ্ধতি নির্বাচন করে আপনি মিলটি পরিমাপ করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.