জিএলএমের পরিবার প্রতিক্রিয়া পরিবর্তনশীল বা অবশিষ্টাংশ বিতরণের প্রতিনিধিত্ব করে?


13

আমি এই সম্পর্কে একাধিক ল্যাব সদস্যের সাথে আলোচনা করেছি, এবং আমরা বেশ কয়েকটি উত্সে গিয়েছি তবে এখনও উত্তরটির যথেষ্ট উত্তর নেই:

আমরা যখন বলতে GLM একটি পরিবার আছে পইসন এর কথা বলা যাক আমরা অবশিষ্টাংশ বিতরণের বা প্রতিক্রিয়া পরিবর্তনশীল কথা বলছ?

বিতর্ক পয়েন্ট

  1. পড়া এই নিবন্ধটি এটা বলে যে, GLM এর অনুমানের পর্যবেক্ষণ পরিসংখ্যানগত স্বাধীনতা, হয় লিঙ্ক এবং ভ্যারিয়েন্স ফাংশনের সঠিক স্পেসিফিকেশন (যা তোলে আমাকে অবশিষ্টাংশ না প্রতিক্রিয়া পরিবর্তনশীল সম্পর্কে চিন্তা), প্রতিক্রিয়া পরিবর্তনশীল পরিমাপের সঠিক স্কেল এবং একক পয়েন্টের অযৌক্তিক প্রভাবের অভাব

  2. এই প্রশ্নের দুটিতে দুটি পয়েন্টের সাথে দুটি উত্তর রয়েছে, একটি যা প্রথমে অবশিষ্টাংশ সম্পর্কে আলোচনা করে এবং দ্বিতীয়টি প্রতিক্রিয়া পরিবর্তনশীল সম্পর্কে, যা এটি?

  3. এই ব্লগপোস্টে , অনুমানের কথা বলার সময়, তারা বলে দেয় " অবশিষ্টাংশের বন্টন অন্য যেমন, দ্বিপদী হতে পারে "

  4. এই অধ্যায়ের শুরুতে তারা বলেছিলেন যে ত্রুটিগুলির কাঠামো পোইসন হতে হবে, তবে অবশিষ্টাংশগুলির অবশ্যই ইতিবাচক এবং নেতিবাচক মান থাকবে, কীভাবে পয়সন হতে পারে?

  5. এই প্রশ্নটি, যা প্রায়শই এটির সদৃশ তৈরির মতো প্রশ্নগুলিতে উদ্ধৃত হয় তার কোনও গ্রহণযোগ্য উত্তর নেই

  6. এই প্রশ্নটির উত্তরগুলি অবশিষ্টাংশ নয়, প্রতিক্রিয়া সম্পর্কে কথা বলে

  7. ইন এই Pensilvania বিশ্ববিদ্যালয় থেকে অবশ্যই বিবরণ তারা অনুমানের না অবশিষ্টাংশ প্রতিক্রিয়া পরিবর্তনশীল সম্পর্কে কথা বলতে

উত্তর:


18

পরিবার glm মডেলের জন্য যুক্তি বিতরণের পরিবার নির্ধারণ করে সাড়া শর্তাধীন বিতরণ , অবশিষ্টাংশ না (ব্যতীত আপাতদৃষ্টিতে -models)।

এইভাবে দেখুন: সাধারণ লিনিয়ার প্রতিরোধের জন্য, আমরা মডেলটি হিসাবে লিখতে পারি এর অর্থ প্রতিক্রিয়া এর একটি সাধারণ বিতরণ রয়েছে (ধ্রুবক বৈকল্পিক সহ), তবে প্রত্যাশা প্রতিটি জন্য আলাদা । সুতরাং প্রতিক্রিয়ার শর্তাধীন বিতরণ হ'ল একটি সাধারণ বিতরণ (তবে প্রতিটি জন্য আলাদা )। এই মডেলটি লেখার আর একটি উপায় হ'ল যেখানে প্রতিটি বিতরণ করা হয় ।

YiNormal(β0+xiTβ,σ2).
Yiii
Yi=β0+xiTβ+ϵi
ϵiNormal(0,σ2)

সুতরাং সাধারণ বিতরণ পরিবারের জন্য উভয় বর্ণনা সঠিক (যখন সঠিকভাবে ব্যাখ্যা করা হয়)। এর কারণ হল স্বাভাবিক রৈখিক মডেল জন্য আমরা মডেল একটি পরিষ্কার বিচ্ছেদ আছে নিয়মানুগ অংশ ( ) এবং ঝামেলা অংশ ( ) যা কেবল যোগ করা হয়। তবে পরিবারের অন্যান্য কাজের জন্য এই বিচ্ছেদ সম্ভব নয় ! এমনকি অবশিষ্টাংশ কী বোঝায় তার একটি পরিষ্কার সংজ্ঞা নেই (এবং সেই কারণেই, "অবশিষ্টাংশের অনেকগুলি আলাদা সংজ্ঞা")।β0+xiTβϵi

সুতরাং অন্য সমস্ত পরিবারের জন্য, আমরা উপরের প্রথম প্রদর্শিত সমীকরণের স্টাইলে একটি সংজ্ঞা ব্যবহার করি। অর্থাত, প্রতিক্রিয়ার শর্তযুক্ত বিতরণ। সুতরাং, না, পইসন রিগ্রেশনের অবশিষ্টাংশগুলি (যাই হোক না কেন সংজ্ঞায়িত) পয়সন বিতরণ নেই।


13

কেজিলের দুর্দান্ত উত্তরের সাথে সাথে শর্তাধীন বিতরণের অর্থ পরিষ্কার করতে সাহায্য করার জন্য আমি কয়েকটি নির্দিষ্ট উদাহরণ যুক্ত করতে চেয়েছিলাম , যা কিছুটা অধরা ধারণা হতে পারে।

ধরা যাক আপনি একটি হ্রদ থেকে 100 টি মাছের এলোমেলো নমুনা নিয়েছেন এবং মাছের বয়স কতগুলি ফলাফলের ভেরিয়েবলকে প্রভাবিত করে তা দেখতে আপনি আগ্রহী:

  1. মাছের ওজন (ওজন);
  2. মাছগুলি 30 সেমি থেকে বেশি লম্বা হয়;
  3. মাছের স্কেল সংখ্যা।

প্রথম ফলাফলের পরিবর্তনশীল অবিচ্ছিন্ন, দ্বিতীয়টি বাইনারি (0 = মাছ 30 সেন্টিমিটারের বেশি নয়; 1 = মাছ 30 সেমি থেকে দীর্ঘ নয়) এবং তৃতীয়টি একটি গণনা পরিবর্তনশীল।

সহজ রৈখিক নির্ভরণ

বয়স ওজনকে কীভাবে প্রভাবিত করে? আপনি ফর্মটির একটি সাধারণ লিনিয়ার রিগ্রেশন মডেল তৈরি করতে যাচ্ছেন:

Weight=β0+β1Age+ϵ

যেখানে গড় 0 এবং স্ট্যান্ডার্ড বিচ্যুতি সহ সাধারণ বিতরণ অনুসরণ করে স্বতন্ত্র, অভিন্নভাবে বিতরণ করা হয় । এই মডেলটিতে, একই বয়সের সাথে ভাগ করে দেওয়া হ্রদের সমস্ত মাছের ওজন পরিবর্তনশীলের গড়টি বয়সের সাথে রৈখিকভাবে পরিবর্তিত বলে ধরে নেওয়া হয়। শর্তাধীন গড় দ্বারা প্রতিনিধিত্ব করা হয় । একে শর্তযুক্ত বলা হয় কারণ এটি একই বয়সের লেকের সমস্ত মাছের গড় ওজন । (নিঃশর্ত গড় ওজন হ'ল লেকের সমস্ত মাছের গড় ওজন হবে তাদের বয়স নির্বিশেষে less) ϵσβ0+β1Age

সাধারণ বাইনারি লজিস্টিক রিগ্রেশন

মাছ 30 সেমি থেকে লম্বা হবে কি না বয়স কীভাবে প্রভাব ফেলবে? আপনি ফর্মটির একটি সাধারণ বাইনারি লজিস্টিক রিগ্রেশন মডেল তৈরি করতে যাচ্ছেন:

log(p1p)=β0+β1Age

যেখানে শর্তযুক্ত সম্ভাবনা বোঝায় যে একটি নির্দিষ্ট বয়সের একটি মাছ 30 সেন্টিমিটারের চেয়ে দীর্ঘ হয়। এই মডেলটিতে, "মাছটি 30 সেন্টিমিটারের চেয়ে বেশি লম্বা হয় কিনা" ভেরিয়েবলের শর্তসাপেক্ষ গড়টি একই বয়সের ভাগাভাগি হ্রদের সমস্ত মাছের সাথে মিলিতভাবে লগইট রূপান্তরকে খাওয়ানোর পরে বয়সের সাথে রৈখিকভাবে পরিবর্তিত বলে ধরে নেওয়া হয়। Logit-রুপান্তরিত শর্তসাপেক্ষ গড় দ্বারা প্রতিনিধিত্ব করা হয় । এই মডেলটি কাজ করে কারণ আমরা ধরে নিই যে একটি নির্দিষ্ট বয়সের জন্য "মাছ 30 সেমি থেকে বেশি দীর্ঘ হবে কিনা" ভেরিয়েবলের মানগুলির বন্টন হ'ল বার্নৌলি বিতরণ। মনে রাখবেন যে এই বিতরণের জন্য, বৈকল্পিকটি গড় মানের একটি ফাংশন, তাই আমরা যদি এর গড় মূল্য অনুমান করতে পারি তবে আমরা এর বৈচিত্রটিও অনুমান করতে পারি।pβ0+β1Agep এবং তারতম্যটি হল )) এছাড়াও দেখুন https://www.theanalysisfactor.com/link-function-and-erferences-in-logistic-regression/p(1p)

সরল পয়সন রিগ্রেশন

বয়স কীভাবে মাছের আইশের সংখ্যাকে প্রভাবিত করে? আপনি ফর্মটির একটি সাধারণ পয়েসন রিগ্রেশন মডেল তৈরি করতে যাচ্ছেন:

log(μ)=β0+β1Age

যেখানে একটি নির্দিষ্ট বয়সের মাছের জন্য ফলাফলের পরিবর্তনশীল "ফিশ স্কেলের সংখ্যা" এর শর্তসাপেক্ষ গড় মানকে বোঝায় (এটি, একটি নির্দিষ্ট বয়সের হ্রদে সমস্ত মাছের জন্য প্রত্যাশিত মাছের আঁশ)। এই মডেলটিতে, ফলাফল পরিবর্তনশীলের শর্তসাপেক্ষ গড়টি লগ রূপান্তরকে খাওয়ানোর পরে বয়সের সাথে রৈখিকভাবে পরিবর্তিত বলে ধরে নেওয়া হয়। লগ-রুপান্তরিত শর্তসাপেক্ষ গড় দ্বারা প্রতিনিধিত্ব করা হয় । এই মডেলটি কাজ করে কারণ আমরা ধরে নিয়েছি যে একটি নির্দিষ্ট বয়সের হ্রদে সমস্ত মাছের জন্য চলক "মাছের স্কেলের সংখ্যা" এর মানগুলির বিতরণ একটি পয়সন বিতরণ। মনে রাখবেন যে এই বিতরণের জন্য, গড় এবং ভিন্নতা সমান তাই এটির গড় মানটি মডেল করার জন্য এটি যথেষ্ট।μβ0+β1Age

সংক্ষেপে বলা যায়, শর্তসাপেক্ষ বন্টন মডেলের অন্তর্ভুক্ত ভবিষ্যদ্বাণী ভেরিয়েবল (গুলি) এর নির্দিষ্ট মানগুলির জন্য ফলাফলের মানগুলির বন্টনকে উপস্থাপন করে । উপরে বর্ণিত প্রতিটি ধরণের মডেনশক্তি মডেল ফলাফল প্রাপ্তির পরিবর্তনশীলকে শর্তাধীন বিতরণে নির্দিষ্ট বন্টনমূলক অনুমানগুলি চাপিয়ে দেয়। এই বিতরণীয় অনুমানের উপর ভিত্তি করে, মডেলটি তৈরি করে এগিয়ে যায় যে কীভাবে (1) শর্তাধীন বিতরণের গড় বয়সের ফাংশন হিসাবে পরিবর্তিত হয় (সাধারণ লিনিয়ার রিগ্রেশন), (২) শর্তাধীন বিতরণের লজিট-ট্রান্সফর্মড মিডিয়ানের ফাংশন হিসাবে পরিবর্তিত হয় বয়সের (সাধারণ বাইনারি লজিস্টিক রিগ্রেশন) বা (3) শর্তাধীন বিতরণের লগ-ট্রান্সফর্মড গড়টি বয়সের ক্রিয়া হিসাবে পরিবর্তিত হয়।

প্রতিটি ধরণের মডেলের জন্য, কেউ মডেল চেকিংয়ের উদ্দেশ্যে সংশ্লিষ্ট অবশিষ্টাংশগুলি সংজ্ঞায়িত করতে পারে। বিশেষত, পিয়ারসন এবং ডিভ্যান্সের অবশিষ্টাংশগুলি লজিস্টিক এবং পোইসন রিগ্রেশন মডেলগুলির জন্য সংজ্ঞায়িত করা যেতে পারে।


2
দুর্দান্ত উত্তর। আপনাদের দুজনকেই ধন্যবাদ। আমি কখনই বুঝতে পারি নি যে "প্রকৃত" অবশিষ্টটি কখনই সাধারণ জিএলএম কাঠামোর মতো সাধারণ বিতরণ ক্ষেত্রে যেমন সত্য তা স্পষ্ট হয় না।
mlofton

1
@ মেল্টন: আপনার সদয় কথার জন্য আপনাকে ধন্যবাদ। একটি দুর্দান্ত প্রশ্ন চমৎকার উত্তর আমন্ত্রিত। আমরা সকলেই এই জ্ঞানের বিনিময় থেকে উপকৃত হই।
ইসাবেলা ঘেমেন্ট 21

4
আমি জিএলএম এর দীর্ঘ সময় ব্যবহার করেছি (এক বছর দু'বছরের জন্য 10 বছর আগের মত) এবং এটি সর্বদা আমার বিভ্রান্তি ছিল তবে আমি কখনই জানতাম না যে এটি আমার বিভ্রান্তি ছিল যতক্ষণ না এটি এতটা স্পষ্টভাবে জিজ্ঞাসা করা হয়েছিল এবং এত পরিষ্কারভাবে ব্যাখ্যা করা হয়েছিল। তাই কখনও কখনও বিভ্রান্তির অর্থ এমনকি সঠিক প্রশ্ন জিজ্ঞাসা করতে সক্ষম না হওয়া। আবার ধন্যবাদ.
mlofton

1
তুমি একদম সঠিক! বিভ্রান্তি শেখার অঙ্গ - আমরা যখন কিছু সময়ের জন্য লড়াই করি তখন হঠাৎ স্পষ্ট ব্যাখ্যায় আমরা যখন হোঁচট খায় তখন আমরা এটিকে আরও ভাল করে বুঝতে পারি।
ইসাবেলা ঘেমেন্ট

1
@ ইসাবেলা গেমেন্ট
প্যাট্রিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.