প্রশ্নটি
গ্রেডিয়েন্ট বুস্টিংয়ের সাথে বাইনারি শ্রেণিবদ্ধকরণ করার সময় ব্যবধানের মধ্যে কীভাবে ভবিষ্যদ্বাণী করা হয় তা বুঝতে আমি সংগ্রাম করছি ।
ধরা যাক আমরা একটি বাইনারি শ্রেণিবদ্ধকরণ সমস্যা নিয়ে কাজ করছি এবং আমাদের উদ্দেশ্যগত ফাংশনটি হ'ল লগ ক্ষতি, , যেখানে টার্গেট ভেরিয়েবল এবং আমাদের বর্তমান মডেল।
পরবর্তী দুর্বল শিক্ষার্থীদের প্রশিক্ষণ দেওয়ার সময় যখন আমাদের নতুন মডেলটি , তখন রাখার অনুমিত পদ্ধতিটি কী ? বা, হতে পারে আরও প্রাসঙ্গিক প্রশ্ন, এমন কোনও ব্যবস্থা আছে কি?
আমি কী করছি সে সম্পর্কে আরও তথ্য
আমি রিগ্রেশন ট্রি ব্যবহার করে গ্রেডিয়েন্ট বুস্টিং বাস্তবায়নের চেষ্টা করছি। এটি এড়াতে আমি যা করি তা হ'ল [0, c _ {\ পাঠ্য {সর্বাধিক}}] এর গুণক সি \ এর দ্বারা বহুগুণ , যেমন H + c _ {\ পাঠ্য {সর্বোচ্চ}} h শূন্য বা তার উপরে না যায় এক, এবং আমি এই পরিসীমাটিতে সিটি নির্বাচন করি যা ক্ষতির কার্যকারিতা হ্রাস করে। সি ∈ [ 0 , সি সর্বোচ্চ ] এইচ + সি সর্বোচ্চ এইচ সি
এটি নিম্নলিখিত সমস্যাটি নিয়ে আসে: কিছু রাউন্ডের পরে আমার একটি পয়েন্ট রয়েছে যা পুরোপুরি শ্রেণিবদ্ধ করা হয়েছে এবং গ্রেডিয়েন্টের দিকে শ্রেণিবদ্ধকারীকে ধাক্কা দেওয়ার জন্য উপলব্ধ সেরা বিভাজনটি এই বিন্দুটিকে উপরের দিকে চাপতে চায়, যা নিশ্চিত আমি নিশ্চিত করি যে এটি ঘটবে না সেট করা হচ্ছে । সুতরাং পরবর্তী সমস্ত পুনরাবৃত্তি একই বিভাজন এবং একই নির্বাচন করবে ।সি = 0
আমি সাধারণ নিয়মিতকরণ অনুশীলন চেষ্টা করেছি
- Multip দ্বারা গুণগতমানের হার হ্রাস করা । এটি কেবল সমস্যাটি বিলম্ব করে।μ = 0.01
- বৈশিষ্ট্য স্থান সাবমলিং, কিন্তু কিছু পয়েন্ট শ্রেণিবদ্ধ করা খুব সহজ, তারা প্রায় প্রতিটি বাক্সে টিক দেয় "এটি কি ইতিবাচক?" ফর্ম এবং প্রায় প্রতিটি "ভাল বিভাজন" এই আচরণটি দেখায়।
আমি মনে করি এটা প্যারামিটার একটা সমস্যা হয় না, এবং একটি আরো সেখানে উচিত শব্দ এই সমাধানের জন্য উপায়। আমার বাস্তবায়ন ভেঙে যাওয়ার সম্ভাবনাটি আমি ছাড়ছি না, তবে এই সমস্যাটি সমাধান করার মতো কিছুই আমি পাইনি।
যৌক্তিক ক্ষতির প্রেক্ষাপটে আমরা যা চালনা করছি, তার সম্ভাবনা হওয়া উচিত, তাই আমরা কীভাবে এড়াতে পারি?
আমার অনুভূতি মডেল আমরা নির্মাণ করা হয়, করা হবে , একটি সিগমা ফাংশনে যেমন যে এটি বেষ্টিত , এবং আমি অনুমান যে কাজ, কিন্তু আমি জানতে চাই যদি অন্যান্য সমাধানের চান। যেহেতু শ্রেণিবদ্ধকরণের কার্যগুলিতে গ্রেডিয়েন্ট বুস্টিং সফলভাবে ব্যবহৃত হয়, তাই একটি "সঠিক" (অর্থাত্ ন্যায়সঙ্গততা সহ) সমাধান থাকা উচিত।[ 0 , 1 ]