এর Tensorflow বাস্তবায়ন ResNet , আমি মনে করি তারা ভ্যারিয়েন্স স্কেলিং সূচনাকারী ব্যবহার করেন, আমিও জেভিয়ার এটি সূচনাকারী জনপ্রিয় এটি। আমার এ সম্পর্কে খুব বেশি অভিজ্ঞতা নেই, যা অনুশীলনে আরও ভাল?
এর Tensorflow বাস্তবায়ন ResNet , আমি মনে করি তারা ভ্যারিয়েন্স স্কেলিং সূচনাকারী ব্যবহার করেন, আমিও জেভিয়ার এটি সূচনাকারী জনপ্রিয় এটি। আমার এ সম্পর্কে খুব বেশি অভিজ্ঞতা নেই, যা অনুশীলনে আরও ভাল?
উত্তর:
জাভিয়র ইনিশিয়ালাইজেশন , মূলত জ্যাভিয়ার গ্লোরোট এবং যোশুয়া বেঙ্গিও দ্বারা "ডিপ ফিডফোরওয়ার্ড নিউরাল নেটওয়ার্ক প্রশিক্ষণের অসুবিধা বোঝার" জন্য প্রস্তাবিত হ'ল ওয়েট ইনিশিয়েশন প্রযুক্তি যা কোনও স্তরের আউটপুটগুলির বৈকল্পিককে তার ইনপুটগুলির বৈকল্পিকের সমান করতে চেষ্টা করে is । এই ধারণাটি বাস্তবে খুব কার্যকর হতে দেখা গেছে। স্বাভাবিকভাবেই, এই সূচনাটি স্তর অ্যাক্টিভেশন ফাংশনের উপর নির্ভর করে। এবং তাদের কাগজে, গ্লোরোট এবং বেনজিও লজিস্টিক সিগময়েড অ্যাক্টিভেশন ফাংশন হিসাবে বিবেচনা করেছিলেন , যা এই মুহুর্তে ডিফল্ট পছন্দ ছিল।
পরে, সিগময়েড অ্যাক্টিভেশনটি রেলু দ্বারা অতিক্রম করে, কারণ এটি বিলুপ্ত / বিস্ফোরিত গ্রেডিয়েন্টগুলির সমস্যা সমাধানের অনুমতি দেয়। ফলস্বরূপ, একটি নতুন সূচনা কৌশল উপস্থিত হয়েছিল, যা এই নতুন সক্রিয়করণ কার্যে একই ধারণা (অ্যাক্টিভেশনের বিভিন্নতার ভারসাম্য) প্রয়োগ করেছিল। এটি "ডেলিভিং ডিপ ইন রেকটিফায়ার্স: ইমেজনেট শ্রেণিবিন্যাসে মানব-স্তরের পারফরম্যান্সকে ছাড়িয়ে যাওয়ার " ক্ষেত্রে কাইমিং হির প্রস্তাব করেছিলেন এবং এখন এটি প্রায়শই তাঁকে আরম্ভ হিসাবে অভিহিত করা হয় ।
টেনস্রোফ্লোতে, তিনি ইনিশিয়ালাইজেশন variance_scaling_initializer()
কার্যকরীভাবে প্রয়োগ করা হয় (এটি আসলে আরও সাধারণ আরম্ভকারী, তবে ডিফল্টরূপে তিনি আরম্ভ করেন), আর জ্যাভিয়ার ইনিশিয়ালাইজারটি যৌক্তিকভাবে হয় xavier_initializer()
।
সংক্ষেপে, মেশিন লার্নিং অনুশীলনকারীদের প্রধান পার্থক্যটি হ'ল:
tanh()
অ্যাক্টিভেশন ফাংশনের জন্য, কোন সূচনাটি আমার ব্যবহার করা উচিত।
ভেরিয়েন্স স্কেলিং জাভিয়ারের কেবলমাত্র একটি সাধারণীকরণ: http://tflearn.org/initializations/ । তারা উভয়ই এই নীতিতে পরিচালিত হয় যে সমস্ত স্তরগুলির মধ্যে গ্রেডিয়েন্টগুলির স্কেল একই হওয়া উচিত। জাভিয়ার ব্যবহারের জন্য সম্ভবত এটি নিরাপদ কারণ এটি সময়ের পরীক্ষামূলক পরীক্ষার প্রতিরোধ করে; ভেরিয়েন্স স্কেলিংয়ের জন্য আপনার নিজের প্যারামিটারগুলি বেছে নেওয়ার চেষ্টা করা প্রশিক্ষণকে বাধা দেয় বা আপনার নেটওয়ার্ককে আদৌ উপার্জন করতে না পারে।