জিএএম বনাম জিএলএম কখন ব্যবহার করবেন


15

আমি বুঝতে পারি এটি একটি সম্ভাব্য বিস্তৃত প্রশ্ন হতে পারে, তবে আমি ভাবছিলাম যে জেনারালাইজেবল অনুমানগুলি কি কোনও জিএলএম (জেনারালাইজড অ্যাডিটিভ মডেল) এর কোনও জিএলএম (জেনারালাইজড লিনিয়ার মডেল) এর ব্যবহার বোঝায়?

কেউ আমাকে সম্প্রতি বলেছিল যে আমি যখন তথ্য কাঠামোটিকে "অ্যাডিটিভ" হিসাবে ধরে নিই তখনই জিএএমগুলি ব্যবহার করা উচিত, অর্থাৎ আমি y এর পূর্বাভাসের জন্য এক্স সংযোজন আশা করি। অন্য একজন ব্যক্তি উল্লেখ করেছেন যে একটি জিএএম একটি জিএলএমের চেয়ে আলাদা ধরণের রিগ্রেশন বিশ্লেষণ করে এবং যখন লিনিয়ারিটি অনুমান করা যায় তখন একটি জিএলএম পছন্দ হয়।

অতীতে আমি পরিবেশগত তথ্যের জন্য একটি জিএএম ব্যবহার করি, যেমন:

  • অবিচ্ছিন্ন সময়সীমা
  • যখন ডেটাগুলিতে রৈখিক আকার না থাকে
  • আমার y এর পূর্বাভাস দেওয়ার জন্য আমার একাধিক এক্স ছিল যে আমি এমন কিছু অলৈখিক ইন্টারঅ্যাকশন করব যা আমি পরিসংখ্যানগত পরীক্ষার সাথে "পৃষ্ঠের প্লট" ব্যবহার করে কল্পনা করতে পারি

জিএএমএম থেকে কোনও জিএএম আলাদা কী করে তা আমার স্পষ্টতই বুঝতে পারছেন না। আমি বিশ্বাস করি এটি একটি বৈধ পরিসংখ্যানগত পরীক্ষা, (এবং আমি কমপক্ষে বাস্তুতান্ত্রিক জার্নালগুলিতে জিএএম ব্যবহারের বৃদ্ধি দেখতে পাচ্ছি), তবে অন্যান্য রিগ্রেশন বিশ্লেষণের মধ্যে এর ব্যবহারটি নির্দেশিত হলে আমার আরও ভাল জানা দরকার।


গ্যাম এর ব্যবহৃত হয় যখন লিনিয়ার প্রেডিক্টর কিছু প্রেডিকটর ভেরিয়েবলের অজানা মসৃণ ফাংশনের উপর লিনিয়ার নির্ভর করে।
ব্যবহারকারী 2974951

1
পার্থক্যটি অস্পষ্ট কারণ আপনি সংখ্যায়িত covariables যেমন একটি GLM এ একটি স্প্লাইন দ্বারা প্রতিনিধিত্ব করতে পারেন।
মাইকেল এম

3
পার্থক্যটি অস্পষ্ট হয়ে গেলেও গামের আন্তঃব্যক্তির সাথে বিস্ফোরণগুলিও প্রতিনিধিত্ব করতে পারে কারণ গ্লমের এত কঠোর সংযোজন দরকার হয় না, বড় পার্থক্যটি হ'ল: গমের প্রয়োজন বিশেষ পদ্ধতিগুলির, যেহেতু অনুমানটি প্রজেকশনের মাধ্যমে করা হয় না, তবে মসৃণকরণের মাধ্যমে হয়। এটি বাস্তবে যা বোঝায় তা আমি বুঝতে পারি না।
কেজেটিল বি হালওয়ারসেন

GLM জিএএম।
usεr11852

উত্তর:


14

মূল পার্থক্যটি হ'ল লাইনারি, বা সাধারণীকরণীয় রৈখিকের "ধ্রুপদী" ফর্মগুলি যখন, মডেলগুলি নির্ভরশীল পরিবর্তনশীল এবং কোভেরিয়েটগুলির মধ্যে সম্পর্কের কোনও নির্দিষ্ট লিনিয়ার বা অন্য কোনও প্যারাম্যাট্রিক ফর্ম ধরে থাকে তবে জিএএম কোনও প্রাইমারিকে এর নির্দিষ্ট কোনও রূপ হিসাবে ধরে নিবে না সম্পর্ক, এবং নির্ভরশীল ভেরিয়েবলের উপর কোভারিয়েটের অ-রৈখিক প্রভাবগুলি প্রকাশ এবং অনুমান করতে ব্যবহার করা যেতে পারে। বিস্তারিতভাবে আরো সময় (সাধারণ) মডেলের রৈখিক রৈখিক predictor একটি ভরযুক্ত সমষ্টি covariates, , Gams মধ্যে এই শব্দটি মসৃণ ফাংশন একটি সমষ্টি দ্বারা প্রতিস্থাপিত হয়, যেমন , যেখানেni=1nβixii=1nj=1qβisj(xi)s1(),,sq()মসৃণ বেস ফাংশন (যেমন কিউবিক স্প্লাইনস) এবং হল ভিত্তি মাত্রা। বেস ফাংশনগুলির সংমিশ্রণ করে জিএএমগুলি বিপুল সংখ্যক কার্যকরী সম্পর্কের প্রতিনিধিত্ব করতে পারে (এটি করার জন্য তারা এই ধারনাটির উপর নির্ভর করে যে সত্যিকারের সম্পর্কটি উইগলির পরিবর্তে মসৃণ হওয়ার সম্ভাবনা রয়েছে)। এগুলি মূলত জিএলএমগুলির একটি সম্প্রসারণ, তবে এগুলি এমনভাবে ডিজাইন করা হয়েছে যা তাদেরকে সংখ্যাসূচক কোয়ারারিয়ার অরৈখিক প্রভাবগুলি উদঘাটনের জন্য বিশেষভাবে কার্যকর করে তোলে এবং একটি "স্বয়ংক্রিয়" ফ্যাশনে এটি করার জন্য (হাস্টি এবং তিবশিরানী মূল নিবন্ধ থেকে, তাদের কাছে রয়েছে ) সম্পূর্ণ স্বয়ংক্রিয় হওয়ার সুবিধা, অর্থাৎ পরিসংখ্যানবিদদের পক্ষ থেকে কোনও "গোয়েন্দা" কাজের প্রয়োজন নেই )।q


2
ঠিক আছে, তবে মন্তব্যে যেমন বলা হয়েছে, এগুলি সব গ্ল্যামের সাথেও করা যেতে পারে ... আমার সন্দেহ হয় যে মূল পার্থক্যটি বাস্তববাদী। আর বাস্তবায়ন আপনার দ্বারা করা যায় mgcvনা এমন অনেক কিছুই করে glm, তবে সেই কাঠামোয় এটিও করা
যেত

হ্যাঁ, আমি আপনার সাথে একমত, জিএএমগুলি জিএলএমগুলির একটি বর্ধিতাংশ। তবে প্রশ্নটি কখন জিএএম ব্যবহার করবেন এবং কখন জিএলএম ব্যবহার করবেন সে সম্পর্কে ছিল এবং আমার কাছে মনে হয়েছিল যে এই বিকল্পটি জিএলএমগুলির "ধ্রুপদী" ফর্মগুলি বোঝায় যা সাধারণত ভবিষ্যদ্বাণী হিসাবে ভিত্তি ফাংশনের একটি সেট অন্তর্ভুক্ত করে না এবং প্রকাশ করার জন্য ব্যবহার হয় না / আনুমানিক অজানা সম্পর্কিত সম্পর্ক।
ম্যাটটিও

ধন্যবাদ - এটি সহায়ক। এবং হ্যাঁ, আমি ক্লাসিক জিএলএম সম্পর্কে বলছিলাম
mluerig

@ মাত্তিও আরও দুটি জিনিস: i) "সত্যিকারের সম্পর্কটি উইগগ্লির পরিবর্তে মসৃণ হওয়ার সম্ভাবনা রয়েছে" এর অর্থ কী? এবং ii) "সংখ্যার covariates এর অরৈখিক প্রভাব উদ্ঘাটিত করার জন্য বিশেষভাবে দরকারী" - কেউ কীভাবে অরৈখিকতার বর্ণনা দিতে / মাপ দিতে হবে (উদাহরণস্বরূপ mgcv)?
mluerig

সত্যিকারের সম্পর্কটি আসলে মসৃণ হতে পারে না, তবে সম্ভাব্যতা সর্বাধিককরণের প্রক্রিয়া চলাকালীন সাধারণত "উইগগ্যুইলিটি" জরিমানা যুক্ত করে সাধারণত জিএএমগুলি মডেল জটিলতার জন্য নিয়ন্ত্রণ করে (সাধারণত আনুমানিক ফাংশনের দ্বিতীয় ডেরাইভেটিভের সংহত বর্গের অনুপাত হিসাবে প্রয়োগ করা হয়)। সংখ্যার covariates এর অরৈখিক প্রভাব বলতে বোঝায় যে নির্ভরশীল ভেরিয়েবলের উপর নির্দিষ্ট সংখ্যার পরিবর্তনশীলের প্রভাব হতে পারে, উদাহরণস্বরূপ, চলক মানের সাথে একঘেয়েভাবে বৃদ্ধি বা হ্রাস পায় না, তবে একটি অজানা আকৃতি রয়েছে, যেমন স্থানীয় ম্যাক্সিমা, মিনিমা, ইনফ্লিকেশন পয়েন্টগুলির সাথে ,. ..
মেটেও

14

আমি জোর দিয়েছি যে জিএএমগুলি জিএলএমগুলির তুলনায় অনেক বেশি নমনীয় এবং সেহেতু তাদের ব্যবহারে আরও যত্নের প্রয়োজন। বৃহত্তর শক্তি সহ বৃহত্তর দায়িত্ব আসে।

আপনি বাস্তুবিদ্যায় তাদের ব্যবহারের কথা উল্লেখ করেছেন, যা আমি লক্ষ্য করেছি। আমি কোস্টা রিকাতে ছিলাম এবং একটি রেইন ফরেস্টে এক ধরণের স্টাডি দেখেছিলাম যেখানে কিছু গ্রেড শিক্ষার্থীরা একটি জিএএম-তে কিছু ডেটা ফেলেছিল এবং এর উন্মাদ-জটিল স্মুথারকে গ্রহণ করেছিল কারণ সফ্টওয়্যারটি এটি বলেছিল। হাস্যকর / প্রশংসনীয় সত্যটি ব্যতীত এগুলি হতাশাজনক ছিল যে তারা দৃ foot়ভাবে একটি পাদটীকা অন্তর্ভুক্ত করেছিল যাতে তারা একটি জিএএম এবং উচ্চ-আদেশের স্মুথারকে ফলাফল হিসাবে ব্যবহার করেছিল docu

জিএএমগুলি সেগুলি ব্যবহার করতে কীভাবে কাজ করে তা আপনাকে বুঝতে হবে না তবে আপনার ডেটা, হাতের সমস্যা, আপনার সফ্টওয়্যারটির স্মার্ট অর্ডার, আপনার পছন্দগুলি (আপনি কী স্মুথারগুলি নির্দিষ্ট করেছেন, মিথস্ক্রিয়া, যদি কোনও মসৃণতা ন্যায়সঙ্গত হয় ইত্যাদি), এবং আপনার ফলাফলের প্রশংসনীয়তা।

প্রচুর প্লট করুন এবং আপনার স্মুথ রেখাচিত্রগুলি দেখুন। তারা কি অল্প ডেটা সহ অঞ্চলে পাগল হয়? আপনি যখন কম-অর্ডার স্মুথফিট উল্লেখ করেন বা সম্পূর্ণ স্মুথিং সরিয়ে ফেলেন তখন কী হয়? Vari ডিগ্রিটি কি সেই পরিবর্তনশীলটির জন্য মসৃণ বাস্তবসম্মত, এটি তার পছন্দগুলি ক্রস-বৈধ করে দেওয়ার নিশ্চয়তা দেওয়ার পরেও কি এতে বেশি মানানসই? আপনার কি যথেষ্ট তথ্য আছে? এটি কি উচ্চ-মানের বা গোলমাল?

আমি গ্যামগুলি পছন্দ করি এবং মনে করি যে তারা ডেটা অনুসন্ধানের জন্য কম প্রশংসিত। এগুলি কেবল অতি-নমনীয় এবং যদি আপনি নিজেকে কঠোরতা ছাড়াই বিজ্ঞানের অনুমতি দেন তবে তারা আপনাকে জিএলএম এর মতো সহজ মডেলের তুলনায় পরিসংখ্যান প্রান্তরে আরও দূরে নিয়ে যাবে।


1
আমি কল্পনা করি যে আমি প্রায়শই এই গ্রেডের শিক্ষার্থীরা যা করেছিলাম তা করি: আমার ডেটা একটি গ্যামে ফেলে দিন এবং mgcvআমার ডেটা কীভাবে পরিচালনা করে তা দেখে চমকে উঠুন । আমি আমার পরামিতিগুলির সাথে পার্সামোনিয়াস হওয়ার চেষ্টা করি এবং আমি পূর্বাভাসিত মানগুলি কীভাবে আমার ডেটার সাথে মেলে তা পরীক্ষা করি। আপনার মন্তব্যগুলি আরও বেশি কঠোর হওয়ার জন্য একটি ভাল অনুস্মারক - এবং অবশেষে সিমোন উডস বইটি পাবেন!
mluerig

হেক, আমি একটি ভেরিয়েবল অন্বেষণ করতে একটি মসৃণ ব্যবহার করার জন্য এতদূর যাব এবং তারপরে স্বল্পমূল্যে স্বাধীনতার ডিগ্রিগুলি ঠিক করুন বা মসৃণ এবং ব্যবহারকে মুছে ফেলুন, বলুন, স্মুথ যদি মূলত চতুষ্কোণ হয় তবে স্কোয়ার শব্দটি ব্যবহার করতাম। একটি চতুর্ভুজ উদাহরণস্বরূপ একটি বয়সের প্রভাবের জন্য অর্থবোধ করে।
ওয়েইন

@ ওয়াইন, আমি জিএএমএস সম্পর্কিত ডেটা অন্বেষণের উত্তরের জন্য এখানে এসেছি এবং দেখেছি আপনি এটি নির্দেশ করেছেন। ডেটা অনুসন্ধানের জন্য আপনি কীভাবে জিএএম ব্যবহার করবেন? এবং আপনি কীভাবে সিদ্ধান্ত নেবেন যে কোনও জিএএম প্রয়োজন হয়, না যদি কোনও জিএলএম যথেষ্ট হয়। আপনি কী প্রতিক্রিয়া এবং প্রতিটি সম্ভাব্য ভবিষ্যদ্বাণীকে ঘুরে ফিরে সরল একটি সাধারণ জিএএম চালাবেন, তা কল্পনা করুন এবং দেখুন যে সম্পর্কটি কোনও জিএএম (যেমন অ-রৈখিক এবং অ-একঘেয়ে সম্পর্কের) জন্য ওয়ারেন্ট দেয়?
টাইলেন

6

কেবল কোনও মন্তব্য যুক্ত করার মতো আমার কোনও খ্যাতি নেই। ওয়েনের মন্তব্যে আমি পুরোপুরি একমত: বৃহত্তর শক্তির সাথে আরও বেশি দায়িত্ব আসে । গ্যামগুলি খুব নমনীয় হতে পারে এবং প্রায়শই আমরা পাগল-জটিল স্মুথারগুলি পাই / দেখি । তারপরে, আমি গবেষকদের দৃ strongly়ভাবে পরামর্শ দিচ্ছি যে মসৃণ ফাংশনগুলির স্বাধীনতার ডিগ্রি (নট সংখ্যা) সীমাবদ্ধ রাখার জন্য এবং বিভিন্ন মডেল স্ট্রাকচার (ইন্টারঅ্যাকশন / কোনও ইন্টারঅ্যাকশন ইত্যাদি) পরীক্ষা করার জন্য জোরালো পরামর্শ দিন।

মডেল-চালিত পন্থাগুলির মধ্যে গ্যামগুলি বিবেচনা করা যেতে পারে (যদিও সীমান্তটি অস্পষ্ট তবে আমি সেই গোষ্ঠীতে জিএলএম অন্তর্ভুক্ত করব) এবং ডেটা-চালিত পন্থাগুলি (যেমন কৃত্রিম নিউরাল নেটওয়ার্ক বা র্যান্ডম অরণ্য যারা সম্পূর্ণরূপে অ-রৈখিক ভেরিয়েবলের প্রভাবগুলিকে ইন্টারঅ্যাক্ট করে নেয়)। অনুসারে আমি হাসতি এবং তিবশিরানীর সাথে পুরোপুরি একমত নই কারণ জিএএমদের এখনও কিছু গোয়েন্দা কাজ দরকার (আশা করি কেউ এ কথা বলে আমাকে মেরে না)।

পরিবেশগত দৃষ্টিকোণ থেকে, আমি এই অবিশ্বাস্য পরিবর্তনশীল পাগল-জটিল স্মুথারগুলি এড়াতে আর প্যাকেজ কেলেঙ্কারী ব্যবহার করার পরামর্শ দেব । এটি নাটাল্য পিয়া এবং সাইমন উড দ্বারা বিকাশিত হয়েছিল এবং এটি মসৃণ কার্ভগুলিকে পছন্দসই আকারগুলিতে (যেমন ইউনিমোডাল বা একজাতীয়) এমনকি এমনকি দ্বিমুখী মিথস্ক্রিয়াগুলির জন্য সীমাবদ্ধ করতে দেয় allows আমি মনে করি মসৃণ ফাংশনগুলির আকারকে সীমাবদ্ধ করার পরে জিএলএম একটি ছোট বিকল্প হয়ে যায় তবে এটি কেবল আমার ব্যক্তিগত মতামত।

প্যা, এন।, উড, এসএন, 2015. আকারযুক্ত সংযোজনীয় মডেল। তাত্ক্ষণিকবাজার। Comput। 25 (3), 543–559। 10.1007 / s11222-013-9448-7

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.