নেতিবাচক দ্বিপদী রিগ্রেশন প্রশ্ন - এটি একটি দরিদ্র মডেল?


31

আমি গণনা ডেটার জন্য রিগ্রেশন মডেলগুলিতে বিক্রয়কারী এবং শমুয়েলির একটি খুব আকর্ষণীয় নিবন্ধ পড়ছি am শুরুর দিকে (পৃষ্ঠা 944) তারা ম্যাককুল্লাওহ এবং নেল্ডারকে (1989) উদ্ধৃত করে বলেছে যে নেতিবাচক দ্বিপদী রিগ্রেশন অপ্রচলিত এবং সমস্যাযুক্ত ক্যানোনিকাল লিঙ্ক রয়েছে। আমি উল্লিখিত প্যাসেজটি পেয়েছি এবং এটিতে বলা হয়েছে (এম এবং এন এর 374 পৃষ্ঠা)

"অ্যাপ্লিকেশনগুলিতে নেতিবাচক দ্বিপদী বিতরণের খুব অল্প ব্যবহার হয়েছে বলে মনে হয়; বিশেষত, ক্যানোনিকাল লিঙ্কটির ব্যবহার সমস্যাযুক্ত কারণ এটি রৈখিক ভবিষ্যদ্বাণীকে ভেরিয়েন্স ফাংশনের একটি প্যারামিটারের ফাংশন হিসাবে পরিণত করে"।

পূর্ববর্তী পৃষ্ঠায় তারা সেই লিঙ্কটি ফাংশন দেয়

η=লগ(α1+ +α)=লগ(μμ+ +)

এবং ভেরিয়েন্স ফাংশন

ভী=μ+ +μ2

বিতরণ হিসাবে দেওয়া হয়

পিR(ওয়াই=Y;α,)=(Y+ +-1)!Y!(-1)!αY(1+ +α)Y=

আমি এনবি রিগ্রেশনটি বেশ বিস্তৃতভাবে ব্যবহার করতে পেলাম (এবং বেশ কয়েকটি বইয়ে প্রস্তাবিত)। এই সমস্ত ব্যবহার এবং সুপারিশ ভুল হয়?

এই সমস্যাযুক্ত লিঙ্কের পরিণতিগুলি কী কী?


3
সম্ভবত কমপক্ষে কিছুটা করতে হবে ১৯৮৯ সালকে দায়ী করা উক্তিটির জন্য। আমি বাজি রাখতে আগ্রহী যে এনবির বেশিরভাগ ব্যবহার এখন সাম্প্রতিক। আপনি সাধারণত দ্বিপদী সম্ভাবনার (যেমন লজিস্টিক রিগ্রেশন) ক্ষেত্রে অতিরিক্ত বিচ্ছুরণের সমস্যাগুলি মোকাবেলা করার সময় সাধারণত এনবি মডেলটি খুব কার্যকর।

5
ভীαμ2ভী=μ+ +αμ2

3
আমি এই মন্তব্যগুলি লবণের এক দানা দিয়ে নেব। রে এমএন: জিএলএম কী তা সম্পর্কে তাদের কঠোর সংজ্ঞা ছিল (ভাল কারণে আমি মনে করি)। অজানা আকারের প্যারামিটার সহ নেগবিন মডেলগুলি ম্যাককুলাgh, নেল্ডার, প্রেগিবন এবং আরও অনেকগুলি দ্বারা GLM এর খুব কড়া সংজ্ঞা মেনে চলেন না। প্রযুক্তিগতভাবে এটি প্রায় সমস্ত ব্যবহারের ক্ষেত্রে একটি জিএলএম নয়। কিছুটা আলাদা মডেল শ্রেণি হিসাবে ব্যাখ্যা করা এবং সর্বাধিক সম্ভাবনার মাধ্যমে অনুমান করা, আর কোনও সমস্যা নেই। রি এস অ্যান্ড এসকে সিওএম পোইসনকে অনুপ্রাণিত করার জন্য একটি মামলার প্রয়োজন ছিল, সুতরাং এম অ্যান্ড এন এর উদ্ধৃতি কার্যকর হয়েছিল।
মোমো

4
আমি দেখতে পাচ্ছি না কেন ক্যানোনিকাল লিঙ্কের কথিত খারাপ সম্পত্তিগুলি নাগবিন মডেলটিকে সামগ্রিকভাবে অনাকাঙ্ক্ষিত করে তোলে। আপনি গাণিতিক তত্ত্বের উল্লেখ না করে ডেটা এবং আপনি যে সমস্যার সমাধান করতে চাইছেন তার ভিত্তিতে আপনার লিঙ্ক ফাংশনটি চয়ন করেন। আসলে আমি সন্দেহ করি যে কেউ প্রামাণ্য লিঙ্কটি ব্যবহার করছে। এটি গামা জিএলএমগুলির অনুরূপ গল্প; ক্যানোনিকাল লিঙ্কটি বিপরীতমুখী, তবে আমি বাজি ধরব যে ব্যাখ্যার স্বাচ্ছন্দ্যের কারণে এবং প্রচুর পরিস্থিতিতে প্রাকৃতিক প্রয়োগের কারণে অনেক বেশি লোক লগ লিঙ্ক ব্যবহার করে।
হংক ওওয়ে

4
{ওয়াই|এক্স}=এক্সপি(এক্সβ)β

উত্তর:


10

আমি বিভিন্ন দৃষ্টিকোণ থেকে দাবিগুলি বিতর্ক করি:

i) ক্যানোনিকাল লিঙ্কটি যদিও 'সমস্যাযুক্ত' হতে পারে তবে তত্ক্ষণাত স্পষ্ট নয় যে কেউ সেই লিঙ্কটিতে আগ্রহী হবেন - যদিও উদাহরণস্বরূপ, পোইসনে লগ-লিংকটি প্রায়শই সুবিধাজনক এবং প্রাকৃতিক উভয়ই থাকে এবং তাই লোকেরা প্রায়শই থাকে এতে আগ্রহী। তবুও, পয়সনের ক্ষেত্রে লোকেরা অন্যান্য লিঙ্ক ফাংশনগুলিকে দেখে।

সুতরাং আমাদের ক্যানোনিকাল লিঙ্কে আমাদের বিবেচনা সীমাবদ্ধ করার দরকার নেই।

একটি 'সমস্যাযুক্ত লিঙ্ক' নিজেই নেতিবাচক দ্বিপদী রিগ্রেশনের বিরুদ্ধে বিশেষত বলার যুক্তি নয়।

উদাহরণস্বরূপ, কিছু নেতিবাচক দ্বিপদী অ্যাপ্লিকেশনগুলিতে লগ-লিঙ্কটি বেশ যুক্তিসঙ্গত পছন্দ বলে মনে হয়, উদাহরণস্বরূপ, ক্ষেত্রে শর্তসাপেক্ষে পয়সন হতে পারে তবে পয়সোন হারের মধ্যে বৈচিত্র্য রয়েছে - লগ লিঙ্কটি প্রায় হিসাবে ব্যাখ্যাযোগ্য হতে পারে যেমনটা পোয়েসনের ক্ষেত্রে রয়েছে।

তুলনা করে আমি গামা জিএলএমগুলি প্রায়শই যুক্তিসঙ্গতভাবে ব্যবহার করি, তবে আমি স্মরণ করি না (পাঠ্যপুস্তকের উদাহরণগুলি বাদ দিয়ে) কখনও কখনও এর প্রচলিত লিঙ্কটি ব্যবহার করে থাকে - আমি লগ-লিংকটি প্রায় সবসময়ই ব্যবহার করি, কারণ এটি বিভিন্ন ধরণের সমস্যার জন্য ব্যবহার করার জন্য আরও প্রাকৃতিক লিঙ্ক since আমি সাথে কাজ করার ঝোঁক।

ii) "অ্যাপ্লিকেশনগুলিতে" "খুব কম তৈরি হয়েছে বলে মনে হচ্ছে" 1989 সালে প্রায় সত্য হতে পারে, তবে আমি মনে করি না এটি এখন দাঁড়িয়ে আছে। [এমনকি যদি এটি এখন দাঁড়িয়েও থাকে তবে এটি যুক্তি নয় যে এটি একটি দুর্বল মডেল, কেবল এটি ব্যাপকভাবে ব্যবহৃত হয়নি - যা সমস্ত কারণেই ঘটতে পারে]]

নেতিবাচক দ্বিপদী রিগ্রেশন আরও ব্যাপকভাবে ব্যবহৃত হওয়ায় এটি আরও ব্যাপকভাবে ব্যবহৃত হয়েছে এবং আমি দেখি এটি এখন অ্যাপ্লিকেশনগুলিতে আরও ব্যাপকভাবে ব্যবহৃত হচ্ছে used আর এর ক্ষেত্রে, উদাহরণস্বরূপ, আমি MASSএটি সমর্থন করে এমন ফাংশনগুলি ব্যবহার করি (এবং সংশ্লিষ্ট বই, ভেনিবলস এবং রিপলির, এস সহ আধুনিক প্রয়োগিত পরিসংখ্যান , কিছু আকর্ষণীয় অ্যাপ্লিকেশনগুলিতে নেতিবাচক দ্বিপদী রিগ্রেশন ব্যবহার করে) - এবং আমি কিছু কার্যকারিতা ব্যবহার করেছি আমি আর এ ব্যবহার করার আগেও কয়েকটি অন্যান্য প্যাকেজে

আমি এটি নেতিবাচক দ্বিপদী রিগ্রেশন আরও আগে ব্যবহার করতে পারতাম, যদি এটি আমার কাছে সহজলভ্য হয়; আমি প্রত্যাশা করি অনেকের ক্ষেত্রেও এটি সত্য - তাই যুক্তিটি যে এটি খুব কম ব্যবহৃত হয়েছিল বলে মনে হয় এটি আরও একটি সুযোগ বলে মনে হয়।

নেতিবাচক দ্বিপদী রিগ্রেশন এড়ানো সম্ভব হলেও (অতিমাত্রায় পোইসন মডেল ব্যবহার করে বলুন), বা এমন অনেকগুলি পরিস্থিতি যেখানে আপনি যা করেন তা আসলেই তেমন গুরুত্ব দেয় না , এমন বিভিন্ন কারণ রয়েছে যা পুরোপুরি সন্তোষজনক নয়।

উদাহরণস্বরূপ, যখন আমার আগ্রহ সহগের অনুমানের তুলনায় পূর্বাভাস অন্তরগুলির দিকে বেশি থাকে, তখন সহগের পরিবর্তন হয় না তা negativeণাত্মক দ্বিপদী এড়ানোর উপযুক্ত কারণ নাও হতে পারে।

অবশ্যই আরও কিছু পছন্দ আছে যা বিচ্ছুরণের মডেল করে (যেমন কনও-ম্যাক্সওয়েল-পোইসন যা আপনি উল্লিখিত কাগজের বিষয়); যদিও সেগুলি অবশ্যই অপশনগুলি রয়েছে, কখনও কখনও এমন পরিস্থিতি আসে যেখানে আমি বেশ খুশি যে negativeণাত্মক দ্বিপদী আমার সমস্যার মডেল হিসাবে যুক্তিসঙ্গতভাবে ভাল 'ফিট'।

এই সমস্ত ব্যবহার এবং সুপারিশ ভুল হয়?

আমি সত্যিই তাই মনে করি না! যদি তারা থাকত তবে এটি এতক্ষণে যুক্তিযুক্তভাবে পরিষ্কার হওয়া উচিত ছিল। প্রকৃতপক্ষে, যদি ম্যাককুল্লাগ এবং নেল্ডার একইভাবে অনুভব করতে থাকে তবে তাদের কাছে সুযোগের অভাব ছিল না বা ফোরামগুলির কোনও অভাব ছিল না যাতে বাকী বিষয়গুলি স্পষ্ট করতে পারে। নেলদার মারা গেছেন (২০১০), তবে ম্যাককুলাঘ সম্ভবত এখনও রয়েছেন

যদি ম্যাককুল্লাগ এবং নেল্ডারের এই সংক্ষিপ্ত প্যাসেজটি তাদের কাছে থাকে তবে আমি বলব এটি একটি বেশ দুর্বল যুক্তি।

এই সমস্যাযুক্ত লিঙ্কের পরিণতিগুলি কী কী?

আমি মনে করি যে সমস্যাটি মূলত একটি সম্পর্কযুক্ত ফাংশন এবং লিঙ্ক ফাংশন সম্পর্কিত নয় বরং সম্পর্কিত হয়েছে (যেমন জনপ্রিয় হিসাবে অন্যান্য সমস্ত প্রধান জিএলএম পরিবারগুলির ক্ষেত্রে এটি একই রকম), যা লিনিয়ার ভবিষ্যদ্বাণীকের স্কেলটিতে ব্যাখ্যা করে কম সোজা (এটি কেবলমাত্র একমাত্র সমস্যা তা বলার অপেক্ষা রাখে না; আমি মনে করি এটি একজন অনুশীলনের পক্ষে এটিই মূল সমস্যা)। এটি খুব একটা চুক্তি নয়।


পি

এই কেউ কিছু: Conway-ম্যাক্সওয়েল-পইসন মডেল, যা করা হয় (বিক্রেতাদের এবং Shmueli কাগজ বিষয়) দূরে নিতে হয় এছাড়াও হয়ে আরো ব্যাপকভাবে ব্যবহৃত - আমি অবশ্যই বনাম এর COM একটি নেতিবাচক দ্বিপদ অংশ নিতে চাই না -পুইসন শুটিং ম্যাচ।

আমি একে একে একে বা অন্য হিসাবে দেখছি না, এখনকার চেয়ে বেশি (এখন আরও বিস্তৃতভাবে বলছি) আমি পরিসংখ্যানগত সমস্যা সম্পর্কে খাঁটি বায়েশিয়ান বা খাঁটি ঘনঘনবাদী অবস্থান গ্রহণ করি। আমি যে বিশেষ পরিস্থিতিতে আছি তা আমাকে সেরা পছন্দ হিসাবে ব্যবহার করবে এবং প্রতিটি পছন্দের সুবিধাগুলি এবং অসুবিধা রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.