খুব ভাল প্রশ্ন, কারণ এই প্রশ্নের সঠিক উত্তর এখনও নেই answer এটি গবেষণার একটি সক্রিয় ক্ষেত্র।
শেষ পর্যন্ত, আপনার নেটওয়ার্কের আর্কিটেকচারটি আপনার ডেটার মাত্রিকতার সাথে সম্পর্কিত। যেহেতু নিউরাল নেটওয়ার্কগুলি সর্বজনীন আনুমানিক হয়, ততক্ষণ আপনার নেটওয়ার্কটি যথেষ্ট বড়, এটি আপনার ডেটা ফিট করার ক্ষমতা রাখে।
কোন আর্কিটেকচারটি সর্বোত্তমভাবে কাজ করে তা সত্যভাবে জানার একমাত্র উপায় হ'ল তাদের সকলের চেষ্টা করা এবং তারপরে সেরাটি বেছে নেওয়া। তবে অবশ্যই, নিউরাল নেটওয়ার্কগুলির সাথে, এটি বেশ কঠিন কারণ প্রতিটি মডেলকে প্রশিক্ষণ নিতে বেশ কিছুটা সময় নেয়। কিছু লোক যা করেন তা হ'ল প্রথমে এমন একটি মডেলকে প্রশিক্ষণ দেওয়া হয় যা উদ্দেশ্যে "খুব বড়" হয় এবং তারপরে নেটওয়ার্কে খুব বেশি অবদান রাখে না এমন ওজনগুলি সরিয়ে এটি ছাঁটাই করে।
আমার নেটওয়ার্ক "খুব বড়" হলে কী হবে
আপনার নেটওয়ার্কটি যদি খুব বড় হয় তবে এটি হয় অতিরিক্ত উপায়ে বা রূপান্তরিত করতে লড়াই করতে পারে। স্বজ্ঞাতভাবে, যা ঘটে তা হ'ল আপনার নেটওয়ার্কটি আপনার ডেটাগুলি যতটা বোঝানো উচিত তার চেয়ে আরও জটিল উপায়ে ব্যাখ্যা করার চেষ্টা করছে। এটি এমন প্রশ্নের উত্তর দেওয়ার চেষ্টা করার মতো যা একটি 10-পৃষ্ঠার প্রবন্ধের সাথে একটি বাক্যে উত্তর দেওয়া যেতে পারে। এত দীর্ঘ উত্তর গঠন করা শক্ত হতে পারে এবং এতে অনেকগুলি অপ্রয়োজনীয় তথ্য থাকতে পারে (( এই প্রশ্নটি দেখুন )
আমার নেটওয়ার্ক "খুব ছোট" হলে কী হবে
অন্যদিকে, আপনার নেটওয়ার্কটি যদি খুব ছোট হয় তবে এটি আপনার ডেটাটিকে সাফল্যযুক্ত করবে। এটি যখন আপনার একটি 10-পৃষ্ঠার প্রবন্ধ রচনা করা উচিত ছিল তখন একটি বাক্য দিয়ে উত্তর দেওয়ার মতো হবে। আপনার উত্তর হিসাবে ভাল হতে পারে, আপনি কিছু প্রাসঙ্গিক তথ্য মিস করবেন।
নেটওয়ার্কের আকার নির্ধারণ করা
আপনি যদি আপনার ডেটার মাত্রিকতা জানেন তবে আপনার নেটওয়ার্কটি যথেষ্ট বড় কিনা তা আপনি বলতে পারেন। আপনার ডেটার মাত্রিকতা অনুমান করতে, আপনি এর র্যাঙ্কটি গণনা করার চেষ্টা করতে পারেন। লোকেরা কীভাবে নেটওয়ার্কের আকার অনুমান করার চেষ্টা করছে এটি একটি মূল ধারণা।
তবে এটি এতটা সহজ নয়। প্রকৃতপক্ষে, যদি আপনার নেটওয়ার্কটি -৪-মাত্রিক হওয়া প্রয়োজন, আপনি কি 64৪ টি আকারের একক গোপন স্তর বা ৮ টি আকারের দুটি স্তর তৈরি করেন? এখানে, আমি আপনাকে কিছুটা অন্তর্দৃষ্টি দিতে যাচ্ছি উভয় ক্ষেত্রে কী ঘটবে।
আরও গভীরে যাচ্ছি
আরও গভীরে যাওয়া মানে আরও লুকানো স্তর যুক্ত করা। এটি যা করে তা হ'ল এটি নেটওয়ার্ককে আরও জটিল বৈশিষ্ট্যগুলি গণনা করার অনুমতি দেয়। কনভলিউশনাল নিউরাল নেটওয়ার্কগুলিতে, উদাহরণস্বরূপ, এটি প্রায়শই দেখানো হয়েছে যে প্রথম কয়েকটি স্তরগুলি "নিম্ন-স্তরের" বৈশিষ্ট্যগুলি যেমন প্রান্তগুলি উপস্থাপন করে এবং শেষ স্তরগুলি "উচ্চ-স্তরের" বৈশিষ্ট্যগুলি যেমন মুখ, শরীরের অঙ্গ ইত্যাদি উপস্থাপন করে represent
আপনার ডেটাটি যদি খুব কাঠামোগত (কোনও চিত্রের মতো) হয় এবং আপনার কাছ থেকে দরকারী তথ্য আহরণের আগে কিছুটা প্রক্রিয়া করা প্রয়োজন তবে আপনাকে গভীরভাবে যেতে হবে।
আরও বিস্তৃত হচ্ছে
আরও গভীরে যাওয়ার অর্থ আরও জটিল বৈশিষ্ট্য তৈরি করা এবং "বৃহত্তর" যাওয়ার অর্থ এই বৈশিষ্ট্যগুলির আরও বেশি তৈরি করা। এটি হতে পারে যে আপনার সমস্যাটি খুব সাধারণ বৈশিষ্ট্য দ্বারা ব্যাখ্যা করা যেতে পারে তবে সেগুলির মধ্যে অনেকগুলি থাকা দরকার। সাধারণত, জটিল বৈশিষ্ট্যগুলি সাধারণের চেয়ে বেশি তথ্য বহন করে এমন সাধারণ কারণে স্তরগুলি নেটওয়ার্কের শেষের দিকে আরও সংকীর্ণ হয়ে উঠছে এবং অতএব আপনার এতগুলি প্রয়োজন নেই।