এখন প্রশ্ন হ'ল যেখানে ডাউনস্যাম্পলিংয়ের কোনও সুযোগ সুবিধা নেই সেখানে এত বড় চিত্রের মাপ কীভাবে পরিচালনা করবেন
আমি ধরে নিচ্ছি যে ডাউনস্যাম্পলিংয়ের মাধ্যমে আপনি সিএনএন-এ যাওয়ার আগে ইনপুটটি স্কেল করে দেবেন । কনভ্যুভেশনাল স্তরটি একটি বৃহত ধীরে ধীরে বাছাইয়ের মাধ্যমে কোনও নেটওয়ার্কের মধ্যে চিত্রটি ডাউনসাম্পল করতে দেয় যা পরবর্তী স্তরগুলির জন্য সংস্থানগুলি সংরক্ষণ করতে চলেছে। আসলে, এটি যা করতে হবে তা নয়, অন্যথায় আপনার মডেলটি জিপিইউতে ফিট করবে না।
1) প্রশিক্ষণের জন্য এমন বড় চিত্রগুলি পরিচালনা করার জন্য কি কোনও কৌশল রয়েছে?
সাধারণত গবেষণাগুলি একটি অনুরণনযোগ্য আকারে চিত্রগুলি স্কেল করে। তবে যদি এটি আপনার পক্ষে বিকল্প না হয় তবে আপনার সিএনএনকে সীমাবদ্ধ করতে হবে। প্রারম্ভিক স্তরগুলিতে ডাউন স্যাম্পলিংয়ের পাশাপাশি, আমি আপনাকে কনফিউশনাল স্তরটির পক্ষে এফসি স্তর (যা সাধারণত বেশিরভাগ পরামিতি নেয়) থেকে মুক্তি পাওয়ার পরামর্শ দিচ্ছি । এছাড়াও আপনাকে প্রতিটি পর্বে আপনার ডেটা প্রবাহিত করতে হবে, কারণ এটি আপনার জিপিইউয়ের সাথে খাপ খায় না।
নোট করুন যে এর কোনওটি প্রারম্ভিক স্তরগুলিতে ভারী কম্পিউটেশনাল লোড প্রতিরোধ করবে না ঠিক কারণ ইনপুটটি এত বড়: কনভোলজেশন একটি ব্যয়বহুল ক্রিয়াকলাপ এবং প্রথম স্তরগুলি প্রতিটি ফরোয়ার্ড এবং পিছিয়ে পাসে তাদের প্রচুর পরিবেশন করবে । সংক্ষেপে, প্রশিক্ষণ ধীর হবে।
2) কোন ব্যাচের আকারটি ব্যবহার করা যুক্তিসঙ্গত?
এখানে আরও একটি সমস্যা রয়েছে। একটি একক চিত্র নিতে 2400x2400x3x4
(পিক্সেল প্রতি 3 চ্যানেল এবং 4 বাইট) যা ~ 70Mb, তাই আপনি খুব সহজেই একটি ব্যাচের আকারও তুলনামূলকভাবে 10 তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে তুলনামূলকভাবে গ্রহণ করতে পারবেন। আমি মনে করি এক্ষেত্রে এটি 32-বিটের পরিবর্তে 16-বিট মান ব্যবহার করে আকার হ্রাস করবে - এইভাবে আপনি ব্যাচগুলি দ্বিগুণ করতে সক্ষম হবেন।
3) আমি নিতে পারি এমন হার্ডওয়্যার রিসোর্সগুলি গ্রহণের কোনও গ্রহণযোগ্যতা বা কোনও বৃদ্ধি বা হ্রাস আছে কি?
আপনার বাধাটি জিপিইউ মেমরি। আপনি যদি অন্য কোনও জিপিইউ সাধ্যের সাথে চালাতে পারেন তবে এটি পান এবং তাদের জুড়ে নেটওয়ার্কটি বিভক্ত করুন। জিপিইউ মেমরির তুলনায় অন্য সমস্ত কিছুই তুচ্ছ।