"ইনফারেন্সিং প্রত্যাখ্যান করুন" কী এবং কোনও মডেলের যথার্থতা বাড়াতে কীভাবে এটি ব্যবহার করা যেতে পারে?


10

কেউ কি বিস্তারিতভাবে ব্যাখ্যা করতে পারেন:

  1. ইনফারেন্সিং মানে কি প্রত্যাখ্যান?
  2. এটি কীভাবে আমার মডেলের যথার্থতা বাড়াতে ব্যবহার করা যেতে পারে?

আমার কাছে ক্রেডিট কার্ড অ্যাপ্লিকেশনটিতে ইনফারেন্সিং প্রত্যাখ্যান করার ধারণা রয়েছে তবে এটি আমার মডেলের যথার্থতা বাড়াতে এটি ব্যবহার করার চিন্তার সাথে লড়াই করছে।

উত্তর:


23

ক্রেডিট মডেল বিল্ডিংয়ে, প্রত্যাখ্যানকে অনিচ্ছুক করা হ'ল আবেদন প্রক্রিয়াটিতে প্রত্যাখ্যাত হওয়া ক্রেডিট অ্যাকাউন্টগুলির কার্যকারিতা অনুমান করার প্রক্রিয়া।

অ্যাপ্লিকেশন ক্রেডিট ঝুঁকি মডেল তৈরি করার সময়, আমরা এমন একটি মডেল তৈরি করতে চাই যা " দ্বার দ্বারে " প্রয়োগযোগ্যতা থাকে, অর্থাত্, আমরা অ্যাপ্লিকেশনটির সমস্ত ডেটা ক্রেডিট ঝুঁকি মডেলটিতে ইনপুট করি এবং মডেলটি ঝুঁকি রেটিং বা সম্ভাবনার আউটপুট দেয় ডিফল্ট। অতীতের ডেটা থেকে মডেল তৈরি করতে রিগ্রেশন ব্যবহার করার সময় সমস্যাটি হ'ল আমরা কেবল অতীত গ্রহণযোগ্য অ্যাপ্লিকেশনগুলির জন্য অ্যাকাউন্টের কার্যকারিতা জানি। যাইহোক, আমরা প্রত্যাখ্যানগুলির কার্যকারিতা জানি না, কারণ প্রয়োগের পরে আমরা সেগুলি দরজার বাইরে প্রেরণ করেছি। এটি আমাদের মডেলটিতে বাছাই পক্ষপাতিত্বের কারণ হতে পারে, কারণ আমরা যদি কেবল আমাদের মডেলটিতে অতীতকে "গ্রহণযোগ্য" ব্যবহার করি তবে মডেলটি "দ্বার দ্বারে" জনসংখ্যার পক্ষে ভাল অভিনয় করতে পারে না।

ইনফারেন্সিং প্রত্যাখ্যান করার অনেকগুলি উপায় রয়েছে, সেগুলি সমস্ত বিতর্কিত। আমি এখানে দুটি সাধারণ বিষয় উল্লেখ করব।

  • "অতীত প্রত্যাখ্যানকে খারাপ হিসাবে সংজ্ঞায়িত করুন"
  • বিতরণ

"অতীতকে প্রত্যাখাত হিসাবে খারাপ হিসাবে সংজ্ঞায়িত করুন" কেবল প্রত্যাখ্যানিত অ্যাপ্লিকেশন ডেটার সমস্তই গ্রহণ করছে এবং মডেলটি তৈরি করার সময় এটিকে ত্যাগ করার পরিবর্তে এগুলি সমস্তকে খারাপ হিসাবে নির্ধারণ করুন। এই পদ্ধতিটি অতীতকে নীতি গ্রহণ / প্রত্যাখ্যানের দিকে ভারীভাবে পক্ষপাতিত্ব করে।

"পার্সেলিং" একটু বেশি পরিশীলিত। নিহিত

  1. অতীত "গ্রহণ করে" দিয়ে রিগ্রেশন মডেলটি তৈরি করুন
  2. অতীত প্রত্যাখ্যানকারীদের কাছে ঝুঁকি রেটিং দেওয়ার জন্য মডেলটিকে প্রয়োগ করুন
  3. প্রতিটি ঝুঁকি রেটিংয়ের জন্য পূর্বনির্ধারিত প্রত্যাশিত সম্ভাবনা ব্যবহার করে প্রত্যাখ্যাত অ্যাপ্লিকেশনগুলি ভাল বা খারাপ হওয়ার জন্য বরাদ্দ করুন। উদাহরণস্বরূপ, যদি ঝুঁকি রেটিংয়ের 10% ডিফল্ট হওয়ার সম্ভাবনা থাকে এবং 100 টি প্রত্যাখ্যানিত অ্যাপ্লিকেশন রয়েছে যা এই ঝুঁকি রেটিংয়ের মধ্যে পড়ে তবে প্রত্যাখ্যানকারীদের 10টিকে "খারাপ" এবং 90 টি প্রত্যাখ্যানকে "ভাল" হিসাবে নিয়োগ করুন।
  4. স্বীকৃত অ্যাপ্লিকেশন এবং এখন প্রত্যাখ্যাত অ্যাপ্লিকেশনগুলির অনুমিত কর্মক্ষমতা ব্যবহার করে রিগ্রেশন মডেলটি পুনর্নির্মাণ করুন

পদক্ষেপ 3 এ অ্যাসাইনমেন্টটি করার বিভিন্ন উপায় রয়েছে এবং এই প্রক্রিয়াটি পুনরাবৃত্তভাবে প্রয়োগ করা যেতে পারে।

যেমনটি আগেই বলা হয়েছে, প্রত্যাখ্যান করা ইনফারেন্সিংয়ের ব্যবহার বিতর্কিত এবং এটি কীভাবে মডেলগুলির যথার্থতা বাড়াতে ব্যবহার করা যেতে পারে সে সম্পর্কে একটি সহজ উত্তর দেওয়া কঠিন। আমি এই বিষয়ে কিছু অন্যকে উদ্ধৃত করব।

জোনাথন ক্রুক এবং জন বনাসিক, প্রত্যাখাতাকে প্রত্যাখ্যান করে কি অ্যাপ্লিকেশন স্কোরিং মডেলগুলির কার্য সম্পাদনকে সত্যিই উন্নত করে?

প্রথমত, এমনকি যেখানে আবেদনকারীদের একটি বৃহত অনুপাত প্রত্যাখ্যান করা হয়, কেবলমাত্র গ্রহণযোগ্যদের ক্ষেত্রে পরামিতিগুলির মডেলটির উন্নতির সুযোগ বিনয়ী বলে মনে হয়। যেখানে প্রত্যাখ্যানের হার এত বড় নয়, সেখানে সেই সুযোগটি খুব ছোট বলে মনে হচ্ছে।

ডেভিড হ্যান্ড, "ক্রেডিট অপারেশনে সরাসরি অনুদান", 2001 এর হ্যান্ডবুক অফ ক্রেডিট স্কোরিং-এ প্রদর্শিত হয়

বেশ কয়েকটি পদ্ধতি প্রস্তাবিত এবং ব্যবহার করা হয়েছে এবং এর মধ্যে কয়েকটি পরিষ্কারভাবে দরিদ্র এবং কখনও সুপারিশ করা উচিত নয়, অতিরিক্ত তথ্য না পাওয়া গেলে সর্বজনীন প্রয়োগের কোনও অনন্য সর্বোত্তম পদ্ধতি নেই। এটি হ'ল সর্বোত্তম সমাধান হ'ল যেসব আবেদনকারী প্রত্যাখ্যানযোগ্য অঞ্চলে পড়ে তাদের সম্পর্কে আরও তথ্য (সম্ভবত কিছু সম্ভাব্য প্রত্যাখাতাকে loansণ দিয়ে) obtain


1
বিস্তৃত ওভারভিউর জন্য +1। ইনফারেন্সিং প্রত্যাখ্যান কী তা এখন আমি জানি :)
এমপিটিকাস

1
ধন্যবাদ। কিন্তু আপনি কিভাবে পদক্ষেপ 3 বরাদ্দ করবেন? আমি 1 বা 0 ব্যবহারের ইনস্ট্যাডটি পড়েছি আপনি প্রতিটি লাইনের সম্ভাব্যতা ব্যবহার করতে পারেন। সুতরাং আপনার একই ব্যক্তি 10% এবং 90% সহ পাবেন। নতুন লজিস্টিক মডেল তৈরির মাধ্যমে এটি কীভাবে কাজ করতে পারে?
গ্যাবিএলপি

1

পূর্ববর্তী মন্তব্যে @ গ্যাবিএলপি। আমার অভিজ্ঞতার ভিত্তিতে আপনি এই জাতীয় ক্লায়েন্টকে দুটি ভাগে বিভক্ত করতে পারেন এবং সম্ভাব্যতা অনুসারে উভয় বিভক্তির জন্য ওজন নির্ধারণ করতে পারেন। উদাহরণস্বরূপ যদি কোনও প্রত্যাখ্যাত ক্লায়েন্টের 10% পিডি থাকে আপনি এই দুটি থেকে দুটি ক্লায়েন্ট তৈরি করতে পারেন। প্রথমে টার্গেট ভেরিয়েবল 1 এবং ওজন 0.1 এবং দ্বিতীয়টি টার্গেট ভেরিয়েবল 0 এবং ওজন 0.9 রয়েছে having

ক্লায়েন্টদের পুরো গৃহীত নমুনার ওজন == 1 থাকবে।

যদিও এটি লজিস্টিক রিগ্রেশন নিয়ে কাজ করে, এটি গাছ ভিত্তিক মডেলগুলির সাথে কাজ করে না।


আপনার বক্তব্যটির জন্য কি কোনও উত্স আছে?
টি। বেইজ

যদি প্রশ্নটি গাছ ভিত্তিক মডেলগুলিতে কাজ না করে তবে আমার উত্তরটি হ'ল - ব্যক্তিগত অভিজ্ঞতা। আমি এই পদ্ধতির বাস্তবায়নের চেষ্টা করেছি কিন্তু সফল হই নি।
মিক্সএল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.