সম্ভাব্যতা মডেলগুলি ক্যালিব্রেট করার সময় কীভাবে অনুকূল বিন প্রস্থ চয়ন করবেন?


12

পটভূমি: এখানে মডেলগুলি কীভাবে ক্যালিবিট করা যায় সে সম্পর্কে কিছু দুর্দান্ত প্রশ্ন / উত্তর রয়েছে যা কোনও ফলাফলের সম্ভাবনার পূর্বাভাস দেয়। উদাহরণ স্বরূপ

  1. বেরিয়ার স্কোর এবং এর ক্ষয়টি রেজোলিউশন, অনিশ্চয়তা এবং নির্ভরযোগ্যতার মধ্যে
  2. ক্রমাঙ্কন প্লট এবং আইসোটোনিক রিগ্রেশন

এই পদ্ধতিগুলির প্রায়শই পূর্বাভাসযুক্ত সম্ভাবনার উপর একটি বিনিং পদ্ধতি ব্যবহার করা প্রয়োজন, যাতে ফলাফলের আচরণ (0, 1) গড় ফলাফল গ্রহণ করে বিনের উপর দিয়ে মসৃণ হয়।

সমস্যা: তবে, আমি এমন কোনও কিছুই খুঁজে পাচ্ছি না যা আমাকে বিন প্রস্থ কীভাবে চয়ন করতে হবে তার নির্দেশ দেয়।

প্রশ্ন: আমি কীভাবে অনুকূল বিন প্রস্থ বেছে নিতে পারি?

চেষ্টা: ব্যবহৃত দুটি সাধারণ বিন প্রস্থ মনে হচ্ছে:

  1. সমান প্রস্থের বিন্নিং, উদাহরণস্বরূপ প্রতিটি বিরতিতে 10% আবরণে 10 টি বিন [0, 1]।
  2. টুকির বিনিং পদ্ধতিটি এখানে আলোচনা করা হয়েছে

তবে বিনের এই পছন্দগুলি কি সবচেয়ে অনুকূল হয় যদি কোনও ব্যক্তি সবচেয়ে বেশি বিভ্রান্তিবদ্ধ যে পূর্বাভাসিত সম্ভাবনার মধ্যে অন্তরগুলি খুঁজে পেতে আগ্রহী হন?


1
যদি "1" ফলাফল বিরল হয় তবে সমান সংখ্যার নমুনার পরিবর্তে "1" এর সমান সংখ্যার সাথে বিনগুলিতে বিভাজন বিবেচনা করা উপযুক্ত worth এটি ক্রমাঙ্কনের পরে মডেলের বৈষম্য (এউসি) বজায় রাখতে সহায়তা করতে পারে
ইহাদাননি

উত্তর:


4

কোনও পরিসংখ্যানগত পদ্ধতি যা বিনিং ব্যবহার করে তা শেষ পর্যন্ত অপ্রচলিত হিসাবে বিবেচিত হয়। ১৯৯০ এর দশকের মাঝামাঝি থেকে ক্রমাগত ক্রমাঙ্কন বক্ররেখা অনুমান করা সাধারণ বিষয়। সাধারণভাবে ব্যবহৃত পদ্ধতিগুলি হ'ল লোয়েস (আউটলেট সনাক্তকরণ বন্ধ করে), লিনিয়ার লজিস্টিক ক্রমাঙ্কন এবং স্প্লাইন লজিস্টিক ক্রমাঙ্কন। আমি আমার রেগ্রেশন মডেলিং স্ট্র্যাটেজিজ বই এবং কোর্স নোটগুলিতে এ সম্পর্কে বিস্তারিতভাবে যাচ্ছি । Http://www.fharrell.com/p/blog-page.html দেখুন । আর rmsপ্যাকেজটি স্বতন্ত্র বহিরাগত নমুনা ব্যবহার করে বা আসল মডেল বিকাশের নমুনায় বুটস্ট্র্যাপ ব্যবহার করে মসৃণ ননপ্যারমেট্রিক ক্যালিব্রেশন কার্ভগুলি সহজ করে তোলে।


0

আমার অভিজ্ঞতায় সম্ভাব্যতা বন্টনকে কল্পনা করার জন্য বিনিং ভাল, তবে এটি সাধারণত একটি খারাপ ধারণা, যদি কেউ স্ট্যাটিস্টিকাল টেস্ট এবং / অথবা প্যারামিটার অনুমানের জন্য ব্যবহার করতে চান। প্রাথমিকভাবে কারণ এক সাথে সাথে বিন প্রস্থের দ্বারা নির্ভুলতা সীমাবদ্ধ করে। আর একটি সাধারণ সমস্যা হ'ল যখন ভেরিয়েবলটি আবদ্ধ না হয়, অর্থাত্ লো এবং হাই কাট অফগুলি প্রবর্তন করতে হয়।

কোলমোগোরভ-স্মারনভ স্পিরিটে ক্রমবর্ধমান বিতরণ নিয়ে কাজ করা এই অনেক সমস্যাকেই উদ্ঘাটিত করে। এক্ষেত্রে অনেকগুলি ভাল পরিসংখ্যান পদ্ধতিও উপলভ্য। (উদাহরণস্বরূপ, https://en.wikedia.org/wiki/Kolmogorov%E2%80%93 স্মারনভ_তম )

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.