কখন গামা জিএলএম ব্যবহার করবেন?


88

গামা বিতরণ আকারের বেশ বিস্তৃত পরিসর নিতে পারে এবং এর দুটি পরামিতিগুলির মধ্য দিয়ে এবং ভিন্নতার মধ্যবর্তী লিঙ্কটি দেওয়া হয়, এটি অ-নেতিবাচক তথ্যগুলিতে হেটেরোস্কেস্টাস্টিকির সাথে আচরণ করার পক্ষে উপযুক্ত বলে মনে হয়, যাতে লগ-রুপান্তরিত ওএলএস পারে ডাব্লুএলএস বা কোনও ধরণের হেটেরোস্কেস্টাস্টিটি-সামঞ্জস্যপূর্ণ ভিসিভি অনুমানকারী ছাড়া না করে।

আমি এটি রুটিন অ-নেতিবাচক ডেটা মডেলিংয়ের জন্য আরও বেশি ব্যবহার করব, তবে আমি এটির ব্যবহারকারী অন্য কাউকে জানি না, আমি এটি কোনও আনুষ্ঠানিক শ্রেণিকক্ষের সেটিংয়ে শিখিনি, এবং যে সাহিত্য আমি পড়েছি তা কখনই এটি ব্যবহার করে না। যখনই আমি "গামা জিএলএম এর ব্যবহারিক ব্যবহার" এর মতো কিছু গুগল করি, তখন পয়েসনের ইভেন্টগুলির মধ্যে অপেক্ষা করার সময় ব্যবহার করার পরামর্শ নিয়ে আসি। ঠিক আছে. তবে এটি সীমাবদ্ধ বলে মনে হচ্ছে এবং এটির একমাত্র ব্যবহার হতে পারে না।

নির্লজ্জভাবে, দেখে মনে হচ্ছে গামা জিএলএম হ'ল গামার নমনীয়তা দেখিয়ে অ-নেতিবাচক ডেটা মডেলিংয়ের তুলনামূলকভাবে অনুমান-হালকা উপায়। অবশ্যই আপনাকে যে কোনও মডেলের মতো কিউকিউ প্লট এবং অবশিষ্ট প্লটগুলি পরীক্ষা করতে হবে। তবে আমি যে কোন গুরুতর ত্রুটিগুলি মিস করছি তা কি আছে? "সবেমাত্র ওএলএস চালায়" এমন লোকদের যোগাযোগের বাইরে?

উত্তর:


57

গামার একটি সম্পত্তি লগনারমাল দ্বারা ভাগ করা আছে; যথা যখন আকারের প্যারামিটারটি স্থির থাকে যখন স্কেল প্যারামিটারটি বিবিধ হয় (সাধারণত মডেলগুলির জন্য কোনও ব্যবহার করার সময় এটি করা হয়), তারতম্যটি স্কোয়ার (পরিবর্তনের ধ্রুবক সহগ) এর সমানুপাতিক।

এর আনুমানিক কিছু হ'ল প্রায়শই আর্থিক তথ্য, বা প্রকৃতপক্ষে, অন্যান্য অনেক ধরণের ডেটার সাথে ঘটে।

ফলস্বরূপ এটি প্রায়শই তথ্যের জন্য উপযুক্ত যা অবিচ্ছিন্ন, ধনাত্মক, ডান-স্কিউ এবং যেখানে লগ-স্কেলে বৈকল্পিক কাছাকাছি স্থির থাকে, যদিও এর সাথে অন্যান্য বেশ কয়েকটি সুপরিচিত (এবং প্রায়শই সহজেই সহজলভ্য) বিকল্পগুলি রয়েছে those বৈশিষ্ট্য।

আরও, গামা জিএলএম (এটি প্রাকৃতিক লিঙ্কটি ব্যবহার করা তুলনামূলকভাবে বিরল) এর সাথে লগ-লিঙ্কটি ফিট করা সাধারণ। এটি একটি লিনিয়ার মডেলটিকে ডেটার লগের সাথে ফিট করার থেকে কিছুটা পৃথক করে তোলে তা হ'ল লগ স্কেলে গামা বিভিন্ন ডিগ্রিতে স্কু ছেড়ে যায় যখন স্বাভাবিক (লগনের সাধারণ লগ) প্রতিসম হয়। এটি এটিকে (গামা) বিভিন্ন পরিস্থিতিতে দরকারী করে তোলে।

আমি (আমার মাথার উপরের অংশে) ডি জং এন্ড হেলার এবং ফ্রিস এবং সেই সাথে অসংখ্য কাগজপত্রে আলোচিত গ্যামার জিএলএমগুলির বাস্তব ব্যবহারের উদাহরণ দেখেছি (বাস্তব তথ্য উদাহরণ সহ) ; আমি অন্যান্য ক্ষেত্রেও অ্যাপ্লিকেশন দেখেছি। ওহ, এবং যদি আমি সঠিক মনে রাখবেন, ভেনাবল্সকে এবং মধ্যে Ripley ভরের এটা স্কুল অনুপস্থিতির (quine ডেটার উপর ব্যবহার করে; সম্পাদনা: সক্রিয় আউট এটা আসলে এর ভর পরিসংখ্যান সম্পূরক , p11 দেখতে, পিডিএফ 14 পৃষ্ঠা, এটি একটি লগ লিঙ্ক আছে কিন্তু ডিভির একটি ছোট শিফট আছে)। উহ, এবং ম্যাককুল্লাগ এবং নেলদার রক্ত ​​জমাট বাঁধার উদাহরণ করেছিলেন, যদিও এটি সম্ভবত প্রাকৃতিক যোগসূত্র ছিল।

তারপরে ফ্যারাওয়ের বই রয়েছে যেখানে তিনি একটি গাড়ি বীমা উদাহরণ এবং একটি অর্ধপরিবাহী উত্পাদন ডেটা উদাহরণ করেছেন।

দুটি বিকল্পের যে কোনও একটি বেছে নেওয়ার কিছু সুবিধা এবং কিছু অসুবিধা রয়েছে। এই দিনগুলি উভয়ই ফিট করা সহজ; এটি সবচেয়ে উপযুক্ত কি তা বেছে নেওয়ার বিষয়।

এটি একমাত্র বিকল্প থেকে অনেক দূরে; উদাহরণস্বরূপ, গামা বা লগনরমাল উভয়ের তুলনায় বিপরীত গাউসিয়ান জিএলএমগুলিও রয়েছে যেগুলি আরও স্কিউ / ভারি লেজযুক্ত (এবং আরও বেশি ভিন্ন ভিন্ন) ailed

অপূর্ণতা হিসাবে, ভবিষ্যদ্বাণী অন্তরগুলি করা আরও শক্ত to কিছু ডায়াগনস্টিক ডিসপ্লে ব্যাখ্যা করা শক্ত। লিনিয়ার প্রেডিক্টর (সাধারণত লগ-স্কেল) এর স্কেলে প্রত্যাশার গণনা করা সমতুল্য লগনরমাল মডেলের চেয়ে শক্ত। হাইপোথিসিস পরীক্ষা এবং অন্তরগুলি সাধারণত অ্যাসিম্পটোটিক হয়। এগুলি প্রায়শই অপেক্ষাকৃত ছোটখাটো সমস্যা।

লগ-লিঙ্ক লগনিকাল রিগ্রেশন (লগ নেওয়া এবং একটি সাধারণ লিনিয়ার রিগ্রেশন মডেল ফিটিং) এর কিছু সুবিধা রয়েছে; একটি হল ভবিষ্যদ্বাণী করা সহজ।


3
এটি "গামা" বা "গামা" হওয়া উচিত? আমরা জানি এটির নামকরণ কোনও ব্যক্তির জন্য নয়। আমি লোয়ার কেস "জি" অনেক বেশি ঘন ঘন দেখেছি। স্পষ্টতই বিতরণটির নামটি ফাংশনটির জন্য দেওয়া হয়েছে, যা 18 শতকে ফিরে আসে।
নিক কক্স

2
স্বরলিপি একমাত্র কারণ আমি যে ব্যবহারের জন্য দেখা করেছি। সাধারণত বিতরণগুলির সাথে, বড় হাতের অক্ষর সাধারণত প্রতিরূপের প্রতিধ্বনি করে, যেমন পোইসন বা গাউসিয়ান, যেমন আপনি জানেন। Γ
নিক কক্স

@ নিককক্স আপনার পরামর্শ অনুসারে আমি এটি পরিবর্তন করেছি এবং আমি যখন ছিলাম তখন আমি "বিপরীত গাউসিয়ান" স্থির করেছিলাম।
Glen_b

1
@ গ্লেব_বি: আপনি কি এখনও বিপরীত গাউসিয়ান পরিবারের সাথে লগ লিঙ্কটি ব্যবহার করেন?
দিমিত্রি ভি। মাস্টারভ

@ দিমিত্রিভি.মাস্টারভ এটি কম ব্যবহার করেছেন তাই সাধারণীকরণ করা শক্ত। আমি যা দেখেছি তা থেকে, বিপরীতমুখী গউসিয়ানের সাথে লগ-লিঙ্কটি ব্যবহার করা বেশ সাধারণ বিষয়, তবে অন্য লিঙ্কগুলি কিছু পরিস্থিতিতে যেমন একটি বিপরীত লিঙ্ক হিসাবে উপযুক্ত হতে পারে।
Glen_b

28

এটা একটা ভালো প্রশ্ন. প্রকৃতপক্ষে, লোকেরা কেন সাধারণীকরণীয় রৈখিক মডেলগুলি (জিএলএম) বেশি ব্যবহার করবেন না এটিও একটি ভাল প্রশ্ন।

সতর্কতা নোট: কিছু লোক জেনারেল লিনিয়ার মডেলটির জন্য জিএলএম ব্যবহার করে, এখানে যা মনে আছে তা নয়।

  • আপনি যেখানে দেখেন এটি নির্ভর করে। উদাহরণস্বরূপ, গামা বিতরণ কয়েক দশক ধরে পরিবেশ বিজ্ঞানের বেশ কয়েকটিতে জনপ্রিয় এবং তাই ভবিষ্যদ্বাণীকারী ভেরিয়েবলগুলির সাথে মডেলিং করাও একটি প্রাকৃতিক বর্ধন। হাইড্রোলজি এবং জিওমর্ফোোলজিতে অনেকগুলি উদাহরণ রয়েছে, আমি এমন কিছু ক্ষেত্রের নাম লিখতে যেখানে আমি বিপথগামী হয়েছিল।

  • এটি যখনই সবচেয়ে ভাল কাজ করে তার খালি উত্তরের বাইরে এটিকে কখন ব্যবহার করা যায় তা বেশ নিচু করে রাখা শক্ত। স্কিউড পজিটিভ ডেটা দেওয়া আমি প্রায়শই নিজেকে গামা এবং লগনারাল মডেলগুলি (জিএলএম প্রসঙ্গে লগ লিঙ্কে, সাধারণ বা গাউসিয়ান পরিবারে) চেষ্টা করতে এবং কোনটি আরও ভাল কাজ করে তা চয়ন করতে দেখতে পাব।

  • লগ নেওয়া এবং লিনিয়ার রেজিস্ট্রেশন প্রয়োগ করার সাথে তুলনা করে গামার মডেলিংটি বেশ কিছুদিন আগে পর্যন্ত করা বেশ কঠিন হয়ে পড়েছিল, নিজে কোড না লিখে। এখনও, আমি অনুমান করেছি যে এটি সমস্ত বড় পরিসংখ্যান সংক্রান্ত সফ্টওয়্যার পরিবেশে সমান সহজ নয়।

  • যোগ্যতা এবং শালীনতা থাকা সত্ত্বেও কী ব্যবহৃত হয় এবং কী ব্যবহার করা হয় না তা ব্যাখ্যা করার ক্ষেত্রে, আমি মনে করি আপনি সর্বদা সঠিকভাবে যে ধরণের কারণগুলি সনাক্ত করতে পারেন তা: আপনি কী শিখানো হয়, সাহিত্যে কী থাকে, লোকেরা কী শুনে কথা বলে কাজ এবং সম্মেলনে। সুতরাং, আপনাকে ব্যাখ্যা করার জন্য বিজ্ঞানের এক ধরণের অপেশাদার সমাজবিজ্ঞানের প্রয়োজন। বেশিরভাগ লোকেরা নিজের ক্ষেত্রের মধ্যে সোজা এবং সরু পথ অনুসরণ করে বলে মনে হচ্ছে। আলগাভাবে, মডেলিংয়ের কৌশলগুলির ক্ষেত্রে যে কোনও ক্ষেত্রে অভ্যন্তরীণ সাহিত্যের পরিমাণ যত বড়, সে ক্ষেত্রে কম ঝোঁকযুক্ত লোকেরা অন্যরকম কিছু চেষ্টা করে দেখায়।


1
কোনটি আরও ভাল কাজ করে তা আপনি কীভাবে নির্ধারণ করবেন?
দিমিত্রি ভি। মাস্টারভ

7
আমি সম্ভাবনাগুলি, আর-স্কোয়াসগুলি (লোকেরা যা বলছে তা সত্ত্বেও), প্যারামিটারের অনুমানের কাছাকাছি আত্মবিশ্বাসের ব্যবধানগুলি, পর্যবেক্ষণ করা বনাম লাগানো প্লট, অবশিষ্টাংশ বনাম লাগানো ইত্যাদির দিকে নজর দেয় science আমার অভিজ্ঞতা বিজ্ঞান এতটা সুগঠিত নয়। কীভাবে এটি করা যেতে পারে?
নিক কক্স

@ নিককক্স যখন বিশ্লেষণ বনাম লাগানো, অবশিষ্টাংশ বনাম লাগানো এবং সাধারণ কিউকিউ প্লট পর্যবেক্ষণ করেন তখন আমাদের কী সন্ধান করা উচিত? আমি বুঝতে পারি এটি মডেলগুলির মধ্যে পৃথক হতে পারে। আপনি গামা, পোয়েসন এবং নেতিবাচক দ্বিপদী জন্য একটি উদাহরণ দিতে পারেন? ধন্যবাদ
তাতামি

@ তাতামি এটি সম্পূর্ণ নতুন প্রশ্ন, বা আরও বেশি, আমার মনে হয়। আপনি যদি এটি জিজ্ঞাসা করেন, আপনি দেখতে পাবেন কে দংশন করবে। আমি কখনও ভাবিনি যে কোনও গামা মডেল এবং নেতিবাচক দ্বিপদী মডেল যে কোনও প্রকল্পের প্রতিদ্বন্দ্বী, তবে এটি কল্পনা বা অভিজ্ঞতার ব্যর্থতা হতে পারে।
নিক কক্স

13

গামা রিগ্রেশন জিএলএম এ রয়েছে এবং তাই আপনি ডায়াগনস্টিক উদ্দেশ্যে যেমন ডিভ্যান্স রেসিডুয়াল, লিভারেজ, কুকের দূরত্ব ইত্যাদির জন্য অনেক দরকারী পরিমাণ পেতে পারেন। তারা সম্ভবত লগ-ট্রান্সফর্মড ডেটা সম্পর্কিত পরিমাণের মতো সুন্দর নয় perhaps

লগনরমালের তুলনায় গামা রিগ্রেশন এড়িয়ে চলা একটি জিনিস হ'ল রূপান্তর পক্ষপাত। জেনসেনের বৈষম্য ইঙ্গিত দেয় যে লগনরমাল রিগ্রেশন থেকে প্রাপ্ত ভবিষ্যদ্বাণীগুলি নিয়মতান্ত্রিকভাবে পক্ষপাতদুষ্ট হবে কারণ এটি রূপান্তরিত প্রত্যাশিত মানের পরিবর্তে রূপান্তরিত ডেটা মডেলিং করে ।

এছাড়াও, গামা রিগ্রেশন (বা ননজেটিভ ডেটার জন্য অন্যান্য মডেলগুলি) লগনরমালের তুলনায় ডেটার বিস্তৃত অ্যারের সাথে মোকাবিলা করতে পারে কারণ এটি 0 তে একটি মোড থাকতে পারে, যেমন আপনার গাণিতিক বিতরণ রয়েছে, যা গামাতে রয়েছে পরিবার, যা লগনিকর জন্য অসম্ভব।

আমি পরামর্শগুলি পড়েছি যে পিয়সন সম্ভাবনাটিকে আধে-সম্ভাবনা হিসাবে ব্যবহার করা আরও স্থিতিশীল। তারা একে অপরের সংঘবদ্ধ। কোয়াসি-পোইসনের সঠিক 0 মান সহ্য করতে সক্ষম হওয়ার যথেষ্ট সুবিধা রয়েছে যা গামা এবং বিশেষত লগনরমাল উভয়কেই ঝামেলা করে।


11

আমার মতে, এটি ধরে নিয়েছে যে ত্রুটিগুলি একই আকারের সাথে এবং সম্পর্কিত সূত্র অনুসারে স্কেলগুলি পরিবর্তনের সাথে গামা বিতরণের পরিবারে রয়েছে।

তবে মডেল রোগ নির্ণয় করা কঠিন do নোট করুন যে সাধারণ কিউকিউ প্লটটি এখানে উপযুক্ত নয়, কারণ এটি একই বিতরণ সম্পর্কে, অন্যদিকে আমাদের বিভিন্ন বৈচিত্র সহ বিতরণের পরিবার।

নিঃসন্দেহে, অবশিষ্টাংশের প্লটটি দেখতে দেখতে ব্যবহৃত হতে পারে যে তাদের বিভিন্ন স্কেল রয়েছে তবে একই আকার, সাধারণত দীর্ঘ লেজ থাকে।

আমার অভিজ্ঞতায়, গামা জিএলএম কিছু দীর্ঘ লেজ বিতরণ সমস্যাগুলির জন্য চেষ্টা করা যেতে পারে এবং এটি বীমা এবং পরিবেশ খাতে ইত্যাদি ক্ষেত্রে ব্যাপকভাবে ব্যবহৃত হয় তবে অনুমানগুলি পরীক্ষা করা কঠিন, এবং মডেলটি সাধারণত ভাল সম্পাদন করে না, তাই বিভিন্ন কাগজপত্র বিপরীত গাউসিয়ান ইত্যাদির মতো একই সমস্যা সহ অন্যান্য পরিবারের বিতরণগুলি ব্যবহার করার পক্ষে যুক্তি দেখান, মনে হয় এই জাতীয় পছন্দগুলি শিল্প অভিজ্ঞতার সাথে বিশেষজ্ঞের বিচারের উপর নির্ভর করে। এটি গামা জিএলএম ব্যবহার সীমাবদ্ধ করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.