আমি ইতিমধ্যে যা বলা হয়েছে তার সাথে যুক্ত করতে চাই যে আপনার প্রশ্নটি মেশিন লার্নিংয়ের একটি গুরুত্বপূর্ণ ধারণাকে স্পর্শ করে যা বলা হয় ট্রান্সফার শেখা । অনুশীলনে, খুব কম লোকই স্ক্র্যাচ থেকে একটি সম্পূর্ণ কনভোলিউশনাল নেটওয়ার্ককে প্রশিক্ষণ দেয় (এলোমেলো সূচনা সহ), কারণ এটি যথেষ্ট সময়সাপেক্ষ এবং পর্যাপ্ত আকারের ডেটাসেট তুলনামূলকভাবে বিরল।
আধুনিক কনভনেটগুলি ইমেজনেটে একাধিক জিপিইউ জুড়ে প্রশিক্ষণ নিতে 2-3 সপ্তাহ সময় নেয়। সুতরাং লোকেরা তাদের চূড়ান্ত কনভনেট চেকপয়েন্টগুলি অন্যের সুবিধার্থে প্রকাশ করতে দেখা যায় যা সূক্ষ্ম সুরকরণের জন্য নেটওয়ার্কগুলি ব্যবহার করতে পারে। উদাহরণস্বরূপ, ক্যাফে গ্রন্থাগারের একটি মডেল চিড়িয়াখানা রয়েছে যেখানে লোকেরা তাদের নেটওয়ার্কের ওজন ভাগ করে নেয়।
যখন আপনাকে চিত্রের স্বীকৃতি দেওয়ার জন্য কনভনেট দরকার, আপনার অ্যাপ্লিকেশন ডোমেনটি যাই হোক না কেন, আপনার বিদ্যমান নেটওয়ার্কটি বিবেচনা করা উচিত, উদাহরণস্বরূপ, ভিজিজি নেট একটি সাধারণ পছন্দ।
ট্রান্সফার শেখার সময় কিছু বিষয় মনে রাখা উচিত :
পূর্বনির্ধারিত মডেলগুলি থেকে সীমাবদ্ধতা। মনে রাখবেন যে আপনি যদি পূর্বনির্ধারিত নেটওয়ার্ক ব্যবহার করতে চান তবে আপনি আপনার নতুন ডেটাসেটের জন্য ব্যবহার করতে পারেন এমন আর্কিটেকচারের দিক থেকে আপনি কিছুটা বাঁধা থাকতে পারেন। উদাহরণস্বরূপ, আপনি পূর্বনির্ধারিত নেটওয়ার্ক থেকে নির্বিচারে কনভ স্তরগুলি বের করতে পারবেন না। যাইহোক, কিছু পরিবর্তনগুলি সরাসরি-ফরোয়ার্ড: প্যারামিটার ভাগ করে নেওয়ার কারণে, আপনি সহজেই বিভিন্ন স্থানিক আকারের চিত্রগুলিতে একটি প্রাক-প্রশিক্ষিত নেটওয়ার্ক চালাতে পারেন। কনভ / পুল স্তরগুলির ক্ষেত্রে এটি স্পষ্টভাবে প্রমাণিত হয়েছে কারণ তাদের ফরোয়ার্ড ফাংশন ইনপুট ভলিউম স্থানিক আকারের (স্বতন্ত্র "ফিট" হিসাবে দীর্ঘ) পৃথক।
শিক্ষার হার নতুন লিনিয়ার শ্রেণিবদ্ধকারীর জন্য (এলোমেলোভাবে-সূচনাযুক্ত) ওজনের তুলনায় তুলনামূলকভাবে কনভনেট ওজনের জন্য একটি ছোট শিক্ষার হার ব্যবহার করা সাধারণ যা আপনার নতুন ডেটাসেটের ক্লাস স্কোরগুলি গণনা করে। এটি কারণ আমরা প্রত্যাশা করি যে কনভনেট ওজন তুলনামূলকভাবে ভাল, তাই আমরা তাদের খুব দ্রুত এবং খুব বেশি বিকৃত করতে চাই না (বিশেষত যখন তাদের উপরের নতুন লিনিয়ার শ্রেণিবদ্ধটি এলোমেলো সূচনা থেকে প্রশিক্ষিত হচ্ছে)।
আপনি যদি এই বিষয়ে আগ্রহী হন তবে অতিরিক্ত রেফারেন্স: গভীর স্নায়বিক নেটওয়ার্কগুলিতে বৈশিষ্ট্যগুলি কতটা স্থানান্তরযোগ্য?