সাধারণ গ্রাহক গ্রেড জিপিইউগুলিতে প্রশিক্ষণযোগ্য নিউরাল নেটওয়ার্কগুলির আকার সম্পর্কে থাম্ব অনুমানের নিয়ম দেওয়া কি সম্ভব ? উদাহরণ স্বরূপ:
গতিশক্তি (শক্তিবৃদ্ধি) এর উত্থান কাগজের নিউরোন TANH অ্যাক্টিভেশন ব্যবহার করে একটি নেটওয়ার্ক প্রশিক্ষণ দেয়। তাদের প্ল্যানার ওয়াকারের জন্য 300,200,100 ইউনিট সহ একটি 3 স্তর এনএন রয়েছে । তবে তারা হার্ডওয়্যার এবং সময় রিপোর্ট করে না ...
তবে কি থাম্বের একটি নিয়ম বিকাশ করা যেতে পারে? এছাড়াও কেবল বর্তমান অভিজ্ঞতামূলক ফলাফলের উপর ভিত্তি করে, উদাহরণস্বরূপ:
সিগময়েড অ্যাক্টিভেশন ব্যবহার করে এক্স ইউনিটগুলি 1060 এ প্রতি ঘন্টা Y শিখতে পুনরাবৃত্তি চালাতে পারে।
বা খ এর পরিবর্তে অ্যাক্টিভেশন ফাংশন ব্যবহারের ফলে কর্মক্ষমতা হ্রাস পেতে পারে।
যদি কোনও শিক্ষার্থী / গবেষক / কৌতূহলী মন এই নেটওয়ার্কগুলির সাথে ঘুরে দেখার জন্য একটি জিপিইউ কিনতে চলেছে তবে কী কী পাবে তা আপনি কীভাবে সিদ্ধান্ত নেবেন? একটি 1060 স্পষ্টতই এন্ট্রি স্তরের বাজেটের বিকল্প, তবে আপনি কীভাবে মূল্যায়ন করতে পারেন যদি উচ্চ বিদ্যুতের ডেস্কটপ তৈরির পরিবর্তে কেবল ক্রেপি নেটবুক না পাওয়া এবং অন-ডিমান্ড ক্লাউড অবকাঠামোতে ব্যয় করা।
প্রশ্নের অনুপ্রেরণা: আমি মাত্র একটি 1060 এবং (চতুর, পরে প্রশ্ন জিজ্ঞাসা করার জন্য হু) কিনেছি আশ্চর্য কি আমার যদি কেবল just রাখা উচিত ছিল এবং একটি গুগল ক্লাউড অ্যাকাউন্ট তৈরি করা উচিত। এবং আমি যদি জিপিইউতে আমার মাস্টার থিসিস সিমুলেশন চালাতে পারি।