নেতিবাচক দ্বিপদী রিগ্রেশন অনুমানগুলি কি কি?


30

আমি একটি বৃহত ডেটা সেট নিয়ে কাজ করছি (গোপনীয়, তাই আমি খুব বেশি ভাগ করতে পারি না), এবং এই সিদ্ধান্তে পৌঁছেছি যে একটি নেতিবাচক দ্বিপদী প্রতিরোধের প্রয়োজন হবে। আমি এর আগে কখনও গ্ল্যাম রিগ্রেশন করিনি, এবং অনুমানগুলি কী তা সম্পর্কে আমি কোনও পরিষ্কার তথ্য পাই না। তারা কি এমএলআর এর জন্য একই?

আমি কি একইভাবে ভেরিয়েবলগুলি রূপান্তর করতে পারি (আমি ইতিমধ্যে নির্ভরশীল ভেরিয়েবলকে রূপান্তর করা একটি খারাপ কল কারণ এটি একটি প্রাকৃতিক সংখ্যা হওয়া দরকার)? আমি ইতিমধ্যে স্থির করে রেখেছি যে নেতিবাচক দ্বিপদী বিতরণটি আমার তথ্যগুলিতে ওভার-ছড়িয়ে পড়তে সহায়তা করবে (বৈকল্পিকতা প্রায় 2000 এর অর্থ, গড় 48)।

সাহায্যের জন্য ধন্যবাদ!!

উত্তর:


42

আমি একটি বড় ডেটা সেট নিয়ে কাজ করছি (গোপনীয়, তাই আমি খুব বেশি ভাগ করতে পারি না),

ভেরিয়েবলের নাম বা আসল মানগুলির ব্যতীত আসল তথ্যগুলির কিছু সাধারণ বৈশিষ্ট্য রয়েছে এমন একটি ছোট ডেটা সেট তৈরি করা সম্ভব হতে পারে।

এবং এই সিদ্ধান্তে নেমে এসেছিল একটি নেতিবাচক দ্বিপদী রিগ্রেশন প্রয়োজনীয় হবে। আমি এর আগে কখনও গ্ল্যাম রিগ্রেশন করিনি, এবং অনুমানগুলি কী তা সম্পর্কে আমি কোনও পরিষ্কার তথ্য পাই না। তারা কি এমএলআর এর জন্য একই?

স্পষ্টতই না! আপনি ইতিমধ্যে জানেন যে আপনি প্রতিক্রিয়াটি শর্তাধীন নেতিবাচক দ্বিপদী, শর্তসাপেক্ষে স্বাভাবিক নয় um ( কিছু অনুমান ভাগ করা হয়। যেমন স্বাধীনতা।)

আমাকে প্রথমে জিএলএম সম্পর্কে আরও কথা বলি।

জিএলএমগুলি একাধিক রিগ্রেশন অন্তর্ভুক্ত করে তবে বিভিন্ন উপায়ে সাধারণীকরণ করে:

1) প্রতিক্রিয়ার শর্তসাপেক্ষ বিতরণ (নির্ভরশীল পরিবর্তনশীল) হ'ল ঘনিষ্ঠ পরিবার থেকে , যার মধ্যে পয়েসন, দ্বিপদী, গামা, সাধারণ এবং অন্যান্য অনেকগুলি বিতরণ অন্তর্ভুক্ত।

2) গড় প্রতিক্রিয়া লিঙ্ক ফাংশনের মাধ্যমে ভবিষ্যদ্বাণীকারীদের (স্বাধীন ভেরিয়েবল) সম্পর্কিত । বিতরণগুলির প্রতিটি পরিবারের একটি সম্পর্কিত ক্যানোনিকাল লিঙ্ক ফাংশন রয়েছে - উদাহরণস্বরূপ পয়সনের ক্ষেত্রে, নীতিগত লিঙ্কটি হ'ল লগ । ক্যানোনিকাল লিঙ্কগুলি প্রায় সর্বদা ডিফল্ট থাকে তবে বেশিরভাগ সফ্টওয়্যারটিতে আপনার প্রতিটি বিতরণ পছন্দের মধ্যে সাধারণত বেশ কয়েকটি পছন্দ থাকে। দ্বিপদীটির জন্য ক্যানোনিকাল লিঙ্কটি হ'ল লজিট (লিনিয়ার প্রেডিক্টর মডেলিং , সাফল্যের লগ-প্রতিক্রিয়া, বা একটি "1") এবং গামার পক্ষে ক্যানোনিকাল লিঙ্কটি বিপরীত - তবে উভয় ক্ষেত্রেই অন্যান্য লিঙ্ক ফাংশনগুলি প্রায়শই ব্যবহৃত হয়।log(p1p)

তাই আপনি যদি আপনার প্রতিক্রিয়া ছিল এবং আপনার ভবিষ্যতবক্তা ছিল এবং লগ লিঙ্ক সহ একটি পইসন রিগ্রেশন কেমন গড় আপনার বর্ণনার জন্য থাকতে পারে সঙ্গে, সঙ্গে সম্পর্কযুক্ত এর:YX1X2YX

E(Yi)=μi

logμi=ηi ( বলা হয় 'লিনিয়ার ', এবং এখানে লিঙ্ক ফাংশনটি , প্রতীক প্রায়শই লিঙ্ক ফাংশন উপস্থাপন করতে ব্যবহৃত হয়)ηlogg

ηi=β0+β1x1i+β2x2i

3) প্রতিক্রিয়াটির ভেরিয়েন্স ধ্রুবক নয়, তবে একটি ভেরিয়েন্স-ফাংশনের মাধ্যমে পরিচালিত হয় (গড়ের কোনও ফাংশন, সম্ভবত কোনও স্কেলিং প্যারামিটারের বার)। উদাহরণস্বরূপ, পোইসনের বৈকল্পিক গড়ের সমান, যখন গামার পক্ষে এটি গড়ের বর্গক্ষেত্রের সমানুপাতিক । (কোয়াড-ডিস্ট্রিবিউশনগুলি অনুমান করা বিতরণ থেকে ভেরিয়েন্স ফাংশনকে কিছুটা ডেকে নেওয়ার অনুমতি দেয়)

-

সুতরাং এমপিআর থেকে আপনি যা মনে করছেন তার সাথে কোন অনুমানগুলি সাদৃশ্যপূর্ণ?

  • স্বাধীনতা এখনও আছে।

  • হোমসকেডাস্টিকটি আর ধরে নেওয়া হয় না; বৈকল্পিক স্পষ্টভাবে গড়ের একটি কাজ এবং তাই সাধারণভাবে ভবিষ্যদ্বাণীকারীদের সাথে পরিবর্তিত হয় (সুতরাং যখন মডেলটি সাধারণত হেটেরোস্কেস্টাস্টিক হয়, তবে হেটেরোস্কেস্টাস্টিটি একটি নির্দিষ্ট রূপ নেয়)।

  • লিনিয়ারिटी: মডেলটি এখনও প্যারামিটারগুলিতে রৈখিক (যেমন লিনিয়ার প্রেডিক্টরটি ), তবে প্রত্যাশিত প্রতিক্রিয়া তাদের সাথে রৈখিকভাবে সম্পর্কিত নয় (যদি আপনি পরিচয় লিঙ্ক ফাংশনটি ব্যবহার না করেন)!Xβ

  • প্রতিক্রিয়া বিতরণ যথেষ্ট সাধারণভাবে

আউটপুটটির ব্যাখ্যাটি অনেক দিক থেকে একই রকম; আপনি এখনও তাদের আদর্শ ত্রুটির দ্বারা বিভক্ত অনুমানযুক্ত সহগগুলি উদাহরণ হিসাবে দেখতে পারেন এবং তাদের একইরূপে ব্যাখ্যা করুন (তারা অ্যাসেম্পোটোটিকালি স্বাভাবিক - একটি ওয়াল্ড জেড-টেস্ট - তবে লোকেরা এখনও তাদেরকে টি-রেশিয়ো বলে মনে হয়, এমনকি যখন কোনও তত্ত্ব তৈরি করে না তাদের সাধারণভাবে -distributed)।t

নেস্টেড মডেলগুলির মধ্যে তুলনা (সেটআপগুলির মতো 'আনোভা-টেবিলের মাধ্যমে) কিছুটা আলাদা তবে অনুরূপ (অ্যাসিপটোটিক চি-স্কোয়ার পরীক্ষায় জড়িত)। আপনি যদি এআইসি এবং বিআইসির সাথে স্বাচ্ছন্দ্য বোধ করেন তবে এগুলি গণনা করা যেতে পারে।

অনুরূপ ধরণের ডায়াগনস্টিক ডিসপ্লেগুলি সাধারণত ব্যবহৃত হয় তবে এটি ব্যাখ্যা করা আরও কঠিন।

যদি আপনি পার্থক্যগুলি মাথায় রাখেন তবে আপনার বেশিরভাগ লিনিয়ার রেজিস্ট্রেশন অন্তর্নির্দেশটি বহন করবে।

এখানে এমন কোনও গ্ল্যামের সাথে আপনি যা করতে পারেন যা উদাহরণস্বরূপ আপনি লিনিয়ার রিগ্রেশন দিয়ে করতে পারবেন না (সাধারণভাবে, বেশিরভাগ লোকেরা এর জন্য ননলাইনার রিগ্রেশন ব্যবহার করবে তবে জিএলএম এর পক্ষে সহজ এবং ভাল) এটি সাধারণ ক্ষেত্রে স্বাভাবিক ফাংশন হিসাবে মডেল করা :Yx

E(Y)=exp(η)=exp(Xβ)=exp(β0+β1x) (এটি, একটি লগ-লিঙ্ক)

Var(Y)=σ2

এটি হ'ল, সর্বনিম্ন-বর্গক্ষেত্র এবং মধ্যে ক্ষতিকারক সম্পর্কের সাথে খাপ খায় ।এক্সYx

আমি কি একইভাবে ভেরিয়েবলগুলি রূপান্তর করতে পারি (আমি ইতিমধ্যে নির্ভরশীল ভেরিয়েবলকে রূপান্তর করা একটি খারাপ কল কারণ এটি একটি প্রাকৃতিক সংখ্যা হওয়া দরকার)?

আপনি (সাধারণত) প্রতিক্রিয়া (ডিভি) রূপান্তর করতে চান না। লিনিয়ার প্রেডিক্টরের লিনিয়ারিটি অর্জনের জন্য আপনি কখনও কখনও ভবিষ্যদ্বাণীকারীদের (আইভি) রূপান্তর করতে চাইতে পারেন।

আমি ইতিমধ্যে স্থির করে রেখেছি যে নেতিবাচক দ্বিপদী বিতরণটি আমার তথ্যগুলিতে ওভার-ছড়িয়ে পড়তে সহায়তা করবে (বৈকল্পিকতা প্রায় 2000 এর অর্থ, গড় 48)।

হ্যাঁ, এটি অতিরিক্ত পরিমাণে মোকাবেলা করতে পারে। কিন্তু সাবধান, গুলান না শর্তাধীন সঙ্গে বিচ্ছুরণ নিঃশর্ত বিচ্ছুরণ।

আরেকটি সাধারণ পদ্ধতির - যদি আমার মন আরও খানিকটা কুঁচকানো এবং কিছুটা কম সন্তুষ্ট হয় - তা হল কোয়েসি-পোইসন রিগ্রেশন (অতিমাত্রায় পোয়েসন রিগ্রেশন)।

নেতিবাচক দ্বিপদী সহ, এটির ঘনিষ্ঠ পরিবারে যদি আপনি এর নির্দিষ্ট পরামিতিগুলির একটি নির্দিষ্ট করে থাকেন (এটি সাধারণত জিএলএমএসের জন্য সাধারণত যেভাবে পুনরায় পরিমিত হয়)। কিছু প্যাকেজ এটি উপযুক্ত হবে যদি আপনি প্যারামিটারটি নির্দিষ্ট করেন তবে অন্যরা এই প্যারামিটারের এমএল অনুমানটি (প্রোফাইল সম্ভাবনার মাধ্যমে বলুন) কোনও জিএলএম রুটিনের চারপাশে लपेटবে, প্রক্রিয়াটি স্বয়ংক্রিয় করে তুলবে। কিছু আপনাকে বিতরণের একটি ছোট সেট পর্যন্ত সীমাবদ্ধ করবে; আপনি কোন সফ্টওয়্যার ব্যবহার করতে পারেন তা বলবেন না তাই সেখানে আরও অনেক কিছু বলা শক্ত।

আমি মনে করি সাধারণত লগ-লিঙ্কটি নেতিবাচক দ্বিপদী রিগ্রেশন সহ ব্যবহৃত হয়।

প্রচুর প্রাথমিক স্তরের দলিল রয়েছে (গুগলের মাধ্যমে সহজেই পাওয়া যায়) যা কিছু বেসিক পোইসন জিএলএম এবং তারপরে ডেটা নেতিবাচক দ্বিপদী জিএলএম বিশ্লেষণের মধ্য দিয়ে যায় তবে আপনি জিএলএমগুলির উপর একটি বইটি দেখতে পছন্দ করতে পারেন এবং সম্ভবত প্রথমে কিছুটা পোয়েসন রিগ্রেশন করতে পারেন শুধু যে অভ্যস্ত করতে।


1
+1 আমি COOLSerdash এর সাথে একমত। এখানে অনেক ভাল তথ্য! প্রস্তাবিত গুগল অনুসন্ধানের পাশাপাশি আমি গুজরাটি দ্বারা উদাহরণ অনুসারে একনোমেট্রিকস নামে একটি পাঠ্যপুস্তকের সুপারিশ করব। অধ্যায় 12 পয়সন রিগ্রেশন মডেল এবং নেতিবাচক-বিনোমিয়াল রিগ্রেশন মডেলকে কভার করে। বইয়ের শিরোনামের পরামর্শ অনুসারে, উদাহরণ রয়েছে। বইটিতে ব্যবহৃত ডেটা বইয়ের সহযোগী ওয়েবসাইট থেকে পাওয়া যায় এবং তাই অধ্যায় 12 এর সংক্ষিপ্তসার । আমি প্রস্তাব দিচ্ছি যে ওপি এটি পরীক্ষা করে দেখুন।
গ্রিম ওয়ালশ

আমি পার্টিতে দেরি করেছি ... তবে এই উত্তরটি আমাকে লাইব্রেরির পুরো স্ট্যাক বইয়ের চেয়ে সাধারণীনের রৈখিক মডেলগুলি আরও ভালভাবে বুঝতে সহায়তা করেছে।
হাফ

0

আমি বিশেষভাবে নেতিবাচক দ্বিপদী বিতরণ (তালিকা অনুমান সহ) এবং জিএলএম / জিএলএমএমগুলি সহ তথ্য বিশ্লেষণে সহায়ক বলে মনে করেছি যে কয়েকটি উল্লেখগুলি:

বেটস, ডিএম, বি। ম্যাকলার, বি। বোলকার এবং এস ওয়াকার 2015. lme4 ব্যবহার করে রৈখিক মিশ্র-প্রভাবগুলির মডেলগুলি ফিট করা। জে স্ট্যাটাস সফ্টওয়্যার 67: 1-48।

বলকার, বিএম, এমই ব্রুকস, সিজে ক্লার্ক, এসডাব্লু জিঞ্জ, জেআর পুলসন, এমএইচ এইচ স্টিভেনস এবং জে হোয়াইট। সাধারণীকরণিত রৈখিক মিশ্র মডেল: বাস্তুশাস্ত্র এবং বিবর্তনের জন্য একটি ব্যবহারিক গাইড। বাস্তুশাস্ত্র এবং বিবর্তন প্রবণতা 127-135।

জেলিলেস এ। সি। ক্লেইবার সি এবং এস জ্যাকম্যান ২০০৮. আরজে স্ট্যাটে গণনা সম্পর্কিত তথ্যের জন্য রিগ্রেশন মডেল। সফটওয়্যার. 27: 1-25

জুউর এএফ, এএন আইএন, এন। ওয়াকার, এএ সাভেলিভ এবং জিএম স্মিথ। ২০০৯. মার্কিন যুক্তরাষ্ট্রে, এনওয়াই, স্পিঞ্জার, এর সাথে বাস্তুতন্ত্রের মিশ্র প্রভাবগুলির মডেল এবং এক্সটেনশনগুলি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.