আপনি সঠিক পথে আছেন
ইনভেরিয়েন্সের অর্থ হ'ল আপনি কোনও অবজেক্টকে কোনও বস্তু হিসাবে চিনতে পারবেন, এমনকি যদি তার উপস্থিতি কিছু উপায়ে পরিবর্তিত হয়। এটি সাধারণত একটি ভাল জিনিস, কারণ এটি দর্শকের / ক্যামেরার এবং অবজেক্টের আপেক্ষিক অবস্থানের মতো ভিজ্যুয়াল ইনপুটগুলির নির্দিষ্টকরণের পরিবর্তনগুলিতে সামগ্রীর পরিচয়, বিভাগ, (ইত্যাদি) সংরক্ষণ করে।
নীচের চিত্রটিতে একই মূর্তির অনেকগুলি দর্শন রয়েছে। প্রকৃত পিক্সেল মানগুলি একেবারে পৃথক হলেও আপনি (এবং সু প্রশিক্ষিত নিউরাল নেটওয়ার্কগুলি) প্রতিটি ছবিতে একই জিনিসটি উপস্থিত হতে পারে তা বুঝতে পারবেন।
নোট করুন যে এখানে অনুবাদটির দৃষ্টিভঙ্গির একটি নির্দিষ্ট অর্থ রয়েছে, জ্যামিতি থেকে ধার করা। এটি ফরাসী থেকে ইংরেজী বা ফাইল ফর্ম্যাটগুলির মধ্যে কোনও অনুবাদ হিসাবে বলা থেকে আলাদা কোনও ধরণের রূপান্তরকে বোঝায় না। পরিবর্তে, এর অর্থ হ'ল চিত্রের প্রতিটি পয়েন্ট / পিক্সেল একই পরিমাণে একই দিকে সরানো হয়েছে। পর্যায়ক্রমে, আপনি উত্সটিকে বিপরীত দিকে সমান পরিমাণে স্থানান্তরিত করা হিসাবে ভাবতে পারেন। উদাহরণস্বরূপ, আমরা প্রতিটি পিক্সেল 50 বা 100 পিক্সেলকে ডানে সরিয়ে প্রথম থেকে প্রথম সারিতে 2 য় এবং 3 য় চিত্র উত্পন্ন করতে পারি।
কেউ বোঝাতে পারেন যে কনভোলশন অপারেটর অনুবাদটির প্রতি সম্মান প্রদর্শন করে। যদি আপনি
g এর সাথে
চ কনভলভ করেন তবে আপনি কনভলড আউটপুট
f ∗ g অনুবাদ করেন কিনা, বা আপনি যদি
চ বা
জি প্রথমে অনুবাদ করেন তবে তাতে কিছু আসে যায় না । উইকিপিডিয়ায়
আরও কিছু আছে ।
ছচ। জিচছ
অনুবাদ-আক্রমণকারী অবজেক্টের স্বীকৃতি পাওয়ার জন্য একটি পদ্ধতি হ'ল অবজেক্টের একটি "টেম্পলেট" নেওয়া এবং এটি চিত্রের অবজেক্টের প্রতিটি সম্ভাব্য অবস্থানের সাথে মিলিত করা। আপনি যদি কোনও স্থানে একটি বিশাল প্রতিক্রিয়া পান তবে এটি প্রস্তাব দেয় যে টেমপ্লেটের অনুরূপ একটি বস্তু সেই স্থানে রয়েছে is এই পদ্ধতির প্রায়শই টেমপ্লেট-ম্যাচিং বলা হয় ।
ইনভেরিয়েন্স বনাম ইক্যুভিরিয়েন্স
Santanu_Pattanayak এর উত্তর ( এখানে ) তুলে ধরে অনুবাদ মধ্যে একটি পার্থক্য নেই invariance এবং অনুবাদ equivariance । অনুবাদ ইনভেরিয়েন্সের অর্থ হ'ল সিস্টেমটি তার ইনপুট কীভাবে স্থানান্তরিত হয় তা নির্বিশেষে হুবহু একই রকম প্রতিক্রিয়া তৈরি করে। উদাহরণস্বরূপ, কোনও ফেস-ডিটেক্টর শীর্ষ সারিতে থাকা তিনটি চিত্রের জন্য "ফ্যাক্স ফাউন্ড" প্রতিবেদন করতে পারে। সমতা অর্থ হ'ল সিস্টেমটি পজিশনে সমানভাবে ভালভাবে কাজ করে, তবে এর প্রতিক্রিয়াটি লক্ষ্য অবস্থানের সাথে বদল হয়। উদাহরণস্বরূপ, "মুখের ইনসেস" এর উত্তাপের মানচিত্রে চিত্রের প্রথম সারিতে প্রক্রিয়া করার সময় বাম, কেন্দ্র এবং ডানদিকে একই ধরণের বাধা থাকবে।
এটি কখনও কখনও একটি গুরুত্বপূর্ণ পার্থক্য, তবে অনেক লোক উভয় ঘটনাকেই "আক্রমণাত্মকতা" বলে অভিহিত করে, বিশেষত যেহেতু এটি একটি সমতুল্য প্রতিক্রিয়াটিকে একটি অবিস্মরণীয় রূপে রূপান্তর করা সাধারণত তুচ্ছ - সমস্ত অবস্থানের তথ্যকে অবজ্ঞা করে)।