ঘনঘনবাদী দর্শন 👀
এক অর্থে, আমরা উভয় নিয়মিতকরণকে "ওজন সঙ্কুচিত" হিসাবে ভাবতে পারি ; এল 2 ওজনগুলির ইউক্লিডিয়ান আদর্শকে হ্রাস করে, যখন এল 1 ম্যানহাটনের আদর্শকে হ্রাস করে। এই চিন্তাভাবনার লাইন অনুসরণ করে, আমরা যুক্তি করতে পারি যে এল 1 এবং এল 2 এর সরঞ্জামগুলি যথাক্রমে গোলাকার এবং হীরা আকারের, সুতরাং বিশপের প্যাটার্ন রিকগনিশন এবং মেশিন লার্নিংয়ে চিত্রিত হিসাবে, এল 1 স্পারস দ্রবণগুলির দিকে পরিচালিত হওয়ার সম্ভাবনা বেশি :
বায়েশিয়ান ভিউ 👀
তবে, প্রবীণরা কীভাবে লিনিয়ার মডেলের সাথে সম্পর্কিত তা বোঝার জন্য আমাদের সাধারণ রৈখিক প্রতিরোধের বায়েশিয়ান ব্যাখ্যাটি বুঝতে হবে । ক্যাথরিন বেইলির ব্লগপোস্ট এটির জন্য দুর্দান্ত পড়া। সংক্ষেপে, আমরা আমাদের রৈখিক মডেলটিতে সাধারণত বিতরণকৃত আইড ত্রুটিগুলি ধরে নিই
Y = θ⊤এক্স + ϵ
এনYআমি, i = 1 , 2 , … , এনεট। এন( 0 , σ))
Yp ( y | X , θ ; ϵ ) = এন( θ)⊤এক্স , σ)
যেমনটি দেখা যাচ্ছে ... সর্বাধিক সম্ভাবনা অনুমানকারী ত্রুটির জন্য স্বাভাবিকতা অনুমানের অধীনে পূর্বাভাস এবং আসল আউটপুট মানগুলির মধ্যে স্কোয়ার ত্রুটি হ্রাস করার অনুরূপ।
θ^MLE= তর্কসর্বোচ্চθলগপি( y)| θ)= তর্কসর্বনিম্নθΣi = 1এন( y)আমি- θ⊤এক্সআমি)2
প্রাইয়ারদের ওজনে রেখে নিয়মিতকরণ
যদি আমরা লিনিয়ার রিগ্রেশন ওজনের আগে কোনও অ-ইউনিফর্ম রাখি, তবে সেক্ষেত্রে সর্বাধিক পোস্টেরিয়েরি সম্ভাবনা (এমএপি) অনুমান করা যায়:
θ^মানচিত্র= তর্কসর্বোচ্চθলগপি( y)| θ)+লগপি( θ )
হিসাবে উদ্ভূত ব্রায়ান কেং এর ব্লগপোস্টটিকে , যদি একটি Laplace বন্টন এটা সমতুল্য হল L1 নিয়মিতকরণ অন করার জন্য ।পি( θ )θ
একইভাবে, যদি গাউসীয় বিতরণ হয় তবে এটি এল 2 নিয়মিতকরণের সমান ।পি( θ )θ
এখন কেন আমাদের ওজনের আগে ল্যাপ্লেস রাখার ফলে ঝাঁকুনির প্রবণতা আরও বেড়ে যায় সে সম্পর্কে আমাদের আরেকটি মতামত রয়েছে : যেহেতু ল্যাপ্লেস বিতরণ শূন্যের চারপাশে আরও বেশি কেন্দ্রীভূত , তাই আমাদের ওজন শূন্য হওয়ার সম্ভাবনা বেশি।