ভিসি ডাইমেনশন গভীর শিক্ষা সম্পর্কে আমাদের কী বলে?


15

বেসিক মেশিন লার্নিংয়ে আমাদের নিম্নলিখিত "থাম্বের নিয়ম" শেখানো হয়:

ক) আপনার হাইপোথিসিস সেটের ভিসি ডাইমেনশনের আকারের তুলনায় আপনার ডেটার আকার কমপক্ষে 10 গুণ হওয়া উচিত।

খ) এন সংযোগ সহ একটি নিউরাল নেটওয়ার্কের প্রায় এন এর ভিসি মাত্রা থাকে has

সুতরাং যখন একটি গভীর শিক্ষার স্নায়বিক নেটওয়ার্ক বলেছে, কয়েক মিলিয়ন ইউনিট, এর অর্থ আমাদের কি হওয়া উচিত, বলুন, কোটি কোটি ডেটা পয়েন্ট? আপনি কি দয়া করে এ সম্পর্কে কিছু আলোকপাত করতে পারেন?


একটি গভীর নিউরাল নেটওয়ার্কের লক্ষ লক্ষ ইউনিট থাকবে না যেমন আপনি বলেছেন। তবে এর লক্ষ লক্ষ সংযোগ থাকবে। আমি ধরে নেব যে আপনার দ্বিতীয় থাম্বের নিয়মটি এই নেটওয়ার্কগুলির জন্য ধারণ করে না, মূলত তাদের নিয়মিত প্রকৃতির কারণে (যেমন সিএনএন ড্রপআউট সহ)।
পীর

আমি মনে করি কীটি হ'ল ভিসি আবদ্ধ অসীম নয়। যদি এটি সীমাবদ্ধ হয়, তবে পিএসি তত্ত্বটি আমাদের জানায় যে শেখা সম্ভব। কতটা ডেটা, তা আর একটি প্রশ্ন।
ভ্লাদিস্লাভস ডভগ্লেলেকস

উত্তর:


4

আপনি যে থাম্বের কথা বলবেন সেই নিয়মটি নিউরাল নেটওয়ার্কে প্রয়োগ করা যাবে না।

একটি নিউরাল নেটওয়ার্কের কিছু বুনিয়াদি প্যারামিটার থাকে, যেমন এর ওজন এবং বায়াসেস। নেটওয়ার্কের স্তরগুলির মধ্যে সংযোগের সংখ্যার উপর ওজন সংখ্যা নির্ভর করে এবং পক্ষপাতের সংখ্যা নিউরনের সংখ্যার উপর নির্ভরশীল।

প্রয়োজনীয় ডেটা আকারের উপর নির্ভর করে -

  1. ব্যবহৃত ধরণের নিউরাল নেটওয়ার্ক
  2. নেট ব্যবহৃত নিয়মিতকরণ কৌশল
  3. নেট প্রশিক্ষণে ব্যবহৃত শিক্ষার হার।

এটি বলা হচ্ছে, আদর্শের ত্রুটিটি প্রশিক্ষণের ত্রুটির কাছাকাছি রয়েছে কিনা তা পরীক্ষা করে দেখার মডেলটি অত্যধিক ফিট কিনা তা আরও সঠিক ও নিশ্চিত উপায়। যদি হ্যাঁ, তবে মডেলটি ভাল কাজ করছে। যদি না হয়, তবে মডেলটি সম্ভবত খুব বেশি মানানসই এবং এর অর্থ হল আপনার মডেলটির আকার হ্রাস করতে হবে বা নিয়মিতকরণের কৌশলগুলি প্রবর্তন করতে হবে।


আপনি যখন মজা করবেন তখন আপনি বলছেন যে মডেলটি অত্যধিক ফিট কিনা তা বোঝার সেরা উপায়টি যাচাইয়ের ত্রুটিটি প্রশিক্ষণের ত্রুটির কাছে রয়েছে কিনা তা পরীক্ষা করা।
nbro

6
@ এনব্রো, যদি বৈধতা ত্রুটি পরীক্ষা করার জন্য আপনার যদি সঠিক হোল্ড-আউট সেট থাকে তবে এটি সাধারণত-খুব looseিলে .ালা ভিসি সীমান্ত পেরিয়ে যাওয়ার চেয়ে আপনার নির্দিষ্ট প্রশিক্ষিত নেটওয়ার্কের জন্য ওভারফিটের তুলনায় অনেক বেশি নির্ভরযোগ্য একটি পরিমাপ।
ডুগল

@ ডুগাল আপনি নিজের উত্তরে যা বলেছেন তা কেবল আপনি পুনরাবৃত্তি করছেন।
nbro

3
আমার উত্তর @ এনব্রো নয় তবে একটি বৈধতা সেট দেওয়া, আপনি Hoeffding বা অনুরূপ সঙ্গে সত্য সাধারণীকরণ ত্রুটির উপর আবদ্ধ একটি তুচ্ছ উচ্চ সম্ভাবনা পেতে পারেন, ভিসি সীমানা দিয়ে যাওয়ার সময় আপনার কাছে থাকা নির্দিষ্ট ডেটাসেট এবং নেটওয়ার্কের সাথে সুনির্দিষ্ট নয় এমন অনেকগুলি আলগা উপরের সীমানা জড়িত থাকে loose হাত.
ডগল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.