সংখ্যার স্থিতিশীলতা এবং ওভারফিটিং কিছু অর্থে সম্পর্কিত তবে বিভিন্ন ইস্যুতে।
ক্লাসিক ওএলএস সমস্যা:
ক্লাসিক সর্বনিম্ন স্কোয়ার সমস্যা বিবেচনা করুন:
minimize(over b)(y−Xb)T(y−Xb)
সমাধানটি ক্লাসিক । একটি ধারণাটি হ'ল বিপুল সংখ্যক আইন দ্বারা:b^=(X′X)−1(X′y)
limn→∞1nX′X→E[xx′]limn→∞1nX′y→E[xy]
সুতরাং ওএলএস অনুমান th এছাড়াও । (লিনিয়ার বীজগণিতের শর্তাবলী এ, র্যান্ডম ভেরিয়েবল এর লিনিয়ার স্প্যানের উপর র্যান্ডম ভেরিয়েবল এর রৈখিক প্রক্ষেপণ ))b^E[xx′]−1E[xy]yx1,x2,…,xk
সমস্যা?
যান্ত্রিকভাবে, কী ভুল হতে পারে? সম্ভাব্য সমস্যাগুলি কী কী?
- ছোট নমুনাগুলির জন্য, আমাদের sample এবং নমুনা অনুমানগুলি দরিদ্র beE[xx′]E[xy]
- যদি এর কলামগুলি কলিনারি হয় (হয় সহজাত কলিনারিটি বা ছোট নমুনার আকারের কারণে), সমস্যার সমাধানটির ধারাবাহিকতা থাকবে! সমাধানটি অনন্য হতে পারে না।
X
- এটি ঘটে যদি র্যাঙ্কের ঘাটতি থাকে।E[xx′]
- এটি যদি ঘটে থাকে তবে সমস্যার সংখ্যার তুলনায় ক্ষুদ্র নমুনার আকারের কারণে যদি র্যাঙ্কের ঘাটতি রয়েছে।X′X
সমস্যা (1) অনুমান হিসাবে fit over over হিসাবে ওভারফিট করতে পারে যে অন্তর্নিহিত জনগোষ্ঠীর মধ্যে নেই এমন নমুনার মধ্যে নিদর্শনগুলি প্রতিবিম্বিত করা শুরু করে। অনুমানটি এবং patterns তে নিদর্শনগুলি প্রতিফলিত করতে পারে যা আসলে এবংb^1nX′X1nX′yE[xx′]E[xy]
সমস্যা (২) এর অর্থ কোনও সমাধান অনন্য নয়। কল্পনা করুন আমরা পৃথক জুতোর দাম অনুমান করার চেষ্টা করছি তবে জুতাগুলির জোড়া সর্বদা একসাথে বিক্রি হয়। এটি একটি অসুস্থ সমস্যা, তবে ধরা যাক আমরা যাইহোক এটি করছি। আমরা বিশ্বাস করতে পারি যে বাম জুতার দামের সাথে ডান জুতোর দাম $ 50 সমান , তবে আমরা কীভাবে আলাদা আলাদা মূল্য নিয়ে আসতে পারি? জুতার দাম বামে কী সেট করা এবং ডান জুতার দাম ঠিক আছে? কীভাবে আমরা সমস্ত সম্ভাবনা থেকে বেছে নিতে পারি?pl=45pr=5
জরিমানা উপস্থাপন করা হচ্ছে :L2
এখন বিবেচনা করুন:
minimize(over b)(y−Xb)T(y−Xb)+λ∥b∥2
এটি আমাদের উভয় প্রকারের সমস্যায় সহায়তা করতে পারে। শাস্তি আমাদের অনুমান পাহাড় জমে শূন্য দিকে। যে সহগ মান উপর বন্টন চারপাশে কেন্দ্রীভূত হয় কার্যকরভাবে একটি Bayesian পূর্বে যেমন এই ফাংশন । এটি ওভারফিটিংয়ে সহায়তা করে। আমাদের অনুমানটি ডেটা এবং আমাদের প্রাথমিক বিশ্বাস উভয়কেই প্রতিফলিত করবে যে zero শূন্যের কাছাকাছি।L2b0b
L2 সমস্যাগুলির একটি অনন্য সমাধান নিয়মিতকরণও সর্বদা আমাদের। আমরা বাম এবং ডান জুতা মূল্যের জানেন তাহলে সমষ্টি হয় , সমাধান যে ছোট আদর্শ পছন্দ করে নিন করা হয় ।$50L2pl=pr=25
এই যাদু কি? না। নিয়মিতকরণ ডেটা যুক্ত করার মতো নয় যা আসলে আমাদের প্রশ্নের উত্তর দেওয়ার অনুমতি দেয়। কিছুটা ক্ষেত্রে নিয়মিতকরণ এই দৃষ্টিভঙ্গি গ্রহণ করে যে আপনার যদি ডেটার অভাব হয় তবে টির কাছাকাছি অনুমানগুলি চয়ন করুন ।L20