GEE: সঠিক কার্যনির্বাহী কাঠামো বেছে নেওয়া


19

আমি কোনও মহামারী বিশেষজ্ঞ যে কোনও সমীক্ষা সমীক্ষা সঠিকভাবে বিশ্লেষণ করার জন্য (লগ লিঙ্কের সাথে পইসন রিগ্রেশন ব্যবহার করে, সম্পর্কিত ঝুঁকি অনুমান করার জন্য) জিআইইগুলি বোঝার চেষ্টা করছি। আমার "কার্যনির্বাহী সম্পর্ক" সম্পর্কে কয়েকটি প্রশ্ন রয়েছে যে আমি আরও জ্ঞাতযোগ্য কাউকে স্পষ্ট করে বলতে চাই:

(1) যদি আমার একই ব্যক্তিতে বারবার পরিমাপ হয়, তবে সাধারণত কোনও বিনিময়যোগ্য কাঠামো ধরে নেওয়া কি সবচেয়ে যুক্তিসঙ্গত? (বা পরিমাপ একটি প্রবণতা দেখায় যদি একটি অটোরিগ্রেসিভ)? স্বাধীনতার কী হবে - এমন কোনও মামলা রয়েছে যেখানে কোনও ব্যক্তি একই ব্যক্তিতে পরিমাপের জন্য স্বাধীনতা নিতে পারে?

(২) তথ্য যাচাই করে সঠিক কাঠামো নির্ধারণের জন্য (যুক্তিসঙ্গত সহজ) উপায় আছে কি?

(3) আমি লক্ষ্য করেছি যে, একটি স্বাধীনতা কাঠামো বাছাই করার সময়, আমি একই পয়েন্ট অনুমান (তবে নিম্নমানের ত্রুটিগুলি) পাই যখন একটি সাধারণ পোইসন রিগ্রেশন (আর, ফাংশন glm()এবং geeglm()প্যাকেজ ব্যবহার করে) চালাচ্ছিলাম geepack। ইহা কি জন্য ঘটিতেছে? আমি বুঝতে পেরেছি যে জিইইগুলির সাথে আপনি জনসংখ্যার গড় মডেলটি নির্ধারণ করেন (বিষয়-নির্দিষ্টের বিপরীতে) যাতে আপনার কেবলমাত্র রৈখিক প্রতিরোধের ক্ষেত্রে একই পয়েন্ট অনুমান করা উচিত।

(৪) যদি আমার দল একাধিক লোকেশন সাইটগুলিতে থাকে (তবে পৃথক পৃথক এক পরিমাপ) তবে আমি কি একটি স্বাধীনতা বা বিনিময়যোগ্য কার্যনির্বাহী নির্বাচন করতে পারি এবং কেন? মানে, প্রতিটি সাইটের ব্যক্তিরা এখনও একে অপরের থেকে স্বতন্ত্র, ঠিক ?? সুতরাং একটি বিষয়-নির্দিষ্ট মডেলের জন্য, উদাহরণস্বরূপ, আমি সাইটটি এলোমেলো প্রভাব হিসাবে নির্দিষ্ট করব। তবে জিইই এর সাথে স্বাধীনতা এবং বিনিময়যোগ্য বিভিন্ন অনুমান দেয় এবং অন্তর্নিহিত অনুমানের ক্ষেত্রে কোনটি ভাল তা আমি নিশ্চিত নই।

(5) জিআইই কি 2-স্তরের শ্রেণিবিন্যাসের ক্লাস্টারিং, অর্থাৎ পৃথক পৃথকভাবে বারবার ব্যবস্থা সহ বহু-সাইট সমাহার পরিচালনা করতে পারে? যদি হ্যাঁ, তবে একটি ক্লাস্টারিং ভেরিয়েবল হিসাবে আমি কী নির্দিষ্ট geeglm()করতে হবে এবং যদি প্রথম স্তরের (সাইট) জন্য "স্বাধীনতা" এবং দ্বিতীয় স্তরের (স্বতন্ত্র) জন্য "বিনিময়যোগ্য" বা "স্বতঃসংশ্লিষ্ট" ধরে নেওয়া হয় তবে কার্যকারী পারস্পরিক সম্পর্ক কী হওয়া উচিত?

আমি বুঝতে পেরেছি এগুলি বেশ কয়েকটি প্রশ্ন, এবং সেগুলির মধ্যে কয়েকটি মোটামুটি বুনিয়াদী, তবে এখনও আমার (এবং সম্ভবত অন্যান্য নবজাতকদের?) উপলব্ধি করা খুব কঠিন। সুতরাং, কোনও সহায়তা ব্যাপকভাবে এবং আন্তরিকভাবে প্রশংসা করা হয়েছে, এবং এটি দেখানোর জন্য আমি অনুগ্রহ শুরু করেছি।

উত্তর:


12
  1. অগত্যা। ছোট ক্লাস্টার, ভারসাম্যহীন নকশা এবং ক্লাস্টার কনফাউন্ডার অ্যাডজাস্টমেন্টের মধ্যে অসম্পূর্ণতার সাথে বিনিময়যোগ্য পারস্পরিক সম্পর্ক স্বাধীনতা জিইইর তুলনায় আরও অদক্ষ এবং পক্ষপাতদুষ্ট হতে পারে। এই অনুমানগুলি বরং শক্তিশালীও হতে পারে। যাইহোক, যখন এই অনুমানগুলি পূরণ করা হয়, আপনি বিনিময়যোগ্যটির সাথে আরও দক্ষতার সাথে অনুগ্রহ পান। এআর -১ পারস্পরিক সম্পর্কের কাঠামোগুলি যখন অর্থে আসে তখন আমি কখনই এর উদাহরণ পাইনি, যেহেতু সময়মতো ভারসাম্যপূর্ণ পরিমাপ হওয়া (আমি মানুষের বিষয়গুলির ডেটা নিয়ে কাজ করি) এটি অস্বাভাবিক।

  2. ভাল, পারস্পরিক সম্পর্ক অন্বেষণ করা ভাল এবং ডেটা বিশ্লেষণে করা উচিত। তবে, এটি সত্যই সিদ্ধান্ত গ্রহণের গাইড করা উচিত নয় । দ্রাঘিমাংশ এবং প্যানেল স্টাডির সাথে সম্পর্কিতটি কল্পনা করতে আপনি ভেরোগ্রাম এবং লোরেলোগ্রামগুলি ব্যবহার করতে পারেন। ক্লাস্টারগুলির মধ্যে পারস্পরিক সম্পর্কের পরিধি সম্পর্কে ইন্ট্রাক্লাস্টার পারস্পরিক সম্পর্ক একটি ভাল পরিমাপ।

  3. মিশ্র মডেলগুলির বিপরীতে জিইই-র সম্পর্ক সম্পর্কিত কাঠামো প্রান্তিক প্যারামিটার অনুমানগুলিকে প্রভাবিত করে না (যা আপনি জিইই দিয়ে অনুমান করছেন)। এটি যদিও স্ট্যান্ডার্ড ত্রুটির অনুমানকে প্রভাবিত করে। এটি কোনও লিঙ্ক ফাংশন থেকে স্বতন্ত্র। জিইইতে লিঙ্ক ফাংশন প্রান্তিক মডেলের জন্য।

  4. সাইটগুলি নিরক্ষিত পরিবর্তনের উত্স হতে পারে, যেমন মুখের মধ্যে দাঁত বা স্কুল জেলার মধ্যে শিক্ষার্থীরা। এই ডেটাগুলিতে ক্লাস্টার লেভেল কনফন্ডারদের সম্ভাবনা রয়েছে যেমন দাঁতে ক্ষয় হওয়ার জিনগত প্রবণতা বা সম্প্রদায় শিক্ষার তহবিল, সুতরাং সেই কারণে, আপনি একটি বিনিময়যোগ্য পারস্পরিক সম্পর্ক কাঠামো ব্যবহার করে আরও ভাল স্ট্যান্ডার্ড ত্রুটির অনুমান পাবেন।

  5. জিআইইতে প্রান্তিক প্রভাবগুলির গণনা জটিল হয় যখন তারা বাসা বাঁধে না তবে এটি করা যায় । বাসা বাঁধাই সহজ, আপনি যেমন বলেছিলেন তেমন করেন do


(# 5 সম্পর্কিত) তাই নেস্টেড ক্লাস্টারিংয়ের ক্ষেত্রে একজন কেবলমাত্র শীর্ষ স্তরের ক্লাস্টার ভেরিয়েবল নির্বাচন করে এবং এটিই?
থিওডোর লাইট্রা 21

না, আপনি একটি শ্রেণিবদ্ধ দুটি স্তরের বিনিময়যোগ্য পারস্পরিক সম্পর্ক কাঠামো তৈরি করতে পারেন এবং 3 ধাপের EM অ্যালগরিদম ব্যবহার করে পারস্পরিক সম্পর্কের জন্য পৃথক দুটি পৃথক সম্পর্কের পরামিতিগুলি ধারাবাহিকভাবে অনুমান করতে পারেন। এইভাবে আপনি জানতে পারবেন যে সম্প্রদায়ের মধ্যে বাচ্চারা পারস্পরিক সম্পর্কযুক্ত তবে কোনও পরিবারের মধ্যে বাচ্চাদের মতো পারস্পরিক সম্পর্ক নেই।
অ্যাডমো

দুঃখিত, আমি এটি বুঝতে পারি না। আপনি আমাকে কিছু কোডে ইঙ্গিত করতে পারবেন, পছন্দ করে আর বা স্টাটাতে? আমি অনুমান করি যে সাহায্য করা উচিত।
থিওডোর লাইট্রাস

1
@ থিডোরলাইট্রা দুঃখিত, আমি ভুল হয়ে গিয়েছিলাম। আপনার পূর্ববর্তী বক্তব্যটি সঠিক। আমি যে লিখিত লিঙ্কটি যুক্ত করেছি তা থেকে, "এছাড়াও, যদি একাধিক ক্লাস্টারগুলি নিখুঁতভাবে বাসা বেঁধে রাখে তবে শীর্ষ স্তরের ক্লাস্টারে জিইই ক্লাস্টারিং স্যান্ডউইচ বৈকল্পিক অনুমানের মাধ্যমে মাল্টিলেভেল পারস্পরিক সম্পর্কের কাঠামোর জন্য অ্যাকাউন্ট করে"।
আদমো

1
হতে পারে আপনি অন্যরকম কিছু বোঝাতে চাইছেন, কিন্তু আপনি যখন "জিইই-র মধ্যে সম্পর্ক সম্পর্কিত কাঠামো মিশ্র মডেলের বিপরীতে প্রান্তিক প্যারামিটারের অনুমানকে প্রভাবিত করে না" বলে উল্লেখ করেন, তখন আমার ধারণা এটি সত্য নয়। কমপক্ষে, যদি আপনি বোঝাতে চান যে কোনও সহকর্মী ভিন্ন ভিন্ন কার্যনির্বাহী ম্যাট্রিক্স বেছে নিয়ে অপরিবর্তিত হয় তবে এটি ঘটে না: পারস্পরিক সম্পর্ক ম্যাট্রিক্স ওজন মেট্রিক্সের মধ্য দিয়ে কাজ করে এবং কোভেরিয়েন্স ম্যাট্রিক্স এবং সহগকে প্রভাবিত করে।
নিক

6

(1) আপনার সম্ভবত কিছু ধরণের অটোরিগ্রেসিভ স্ট্রাকচারের প্রয়োজন হবে, কেবলমাত্র আমরা আশা করি যে কাছ থেকে নেওয়া পরিমাপগুলি আরও কাছাকাছি গৃহীত হওয়াগুলির তুলনায় কম সম্পর্কযুক্ত হবে। বিনিময়যোগ্য তারা ধরে নিবে তারা সবাই সমানভাবে সম্পর্কযুক্ত। তবে অন্য সমস্ত কিছুর সাথে এটি নির্ভর করে।

(২) আমি মনে করি যে এই ধরণের সিদ্ধান্ত কীভাবে ডেটা তৈরি হয়েছিল সেগুলি ভেবে দেখার পরিবর্তে কীভাবে ডেটা তৈরি হয়েছিল।

(4) এটি নির্ভর করে। উদাহরণস্বরূপ, স্কুলে বাসাবাড়িত বাচ্চাদের বেশিরভাগ ক্ষেত্রে স্বাধীন হিসাবে বিবেচনা করা উচিত নয়। সামাজিক প্যাটার্নিং ইত্যাদির কারণে, যদি আমি একটি প্রদত্ত স্কুলে একটি বাচ্চা সম্পর্কে কিছু জানি তবে আমি সম্ভবত বিদ্যালয়ের অন্যান্য বাচ্চাদের সম্পর্কে কমপক্ষে কিছুটা জানি। আমি একবার জন্মসূত্রে বিভিন্ন সামাজিক ও অর্থনৈতিক সূচক এবং স্থূলত্বের প্রাদুর্ভাবের মধ্যে সম্পর্কের দিকে নজর রাখতে জিইই ব্যবহার করেছি যেখানে প্রতিবেশীরা আশেপাশে প্রতিবেশী ছিল। আমি একটি বিনিময় কাঠামো ব্যবহার করেছি। আপনি এখানে কাগজটি খুঁজে পেতে পারেন এবং এপিআই জার্নাল থেকে 2 সহ কয়েকটি রেফারেন্স চেক করতে পারেন ।

(5) আপাতদৃষ্টিতে তাই (উদাঃ উদাহরণটি দেখুন ), তবে আমি আর স্পেফিকগুলি এটির সাহায্য করতে পারি না।

জেগার এসএল, লিয়াং কেওয়াই, অ্যালবার্ট পিএস। দ্রাঘিমাংশীয় তথ্যের মডেলগুলি: সাধারণীকরণ অনুমানের সমীকরণ পদ্ধতির। বায়োমেট্রিক্স। 1988; 44: 1049-60।

হুবার্ড এই, আহারের জে, ফ্লিশার এন, ভ্যান ডার লান এম, লিপম্যান এস, ব্রুকনার টি, স্যাটারিয়ানো ডাব্লু। জিইই বা জিইই-তে নয়: আশেপাশের ফাংশন এবং স্বাস্থ্যের মধ্যে অ্যাসোসিয়েশনের অনুমানের জন্য সম্ভাবনা ভিত্তিক পদ্ধতির তুলনা করে। এপিডেমোলোজি। 2009

হ্যানলে জেএ, নেগাসা এ, এডওয়ার্ডস এমডিবি, ফরেস্টার জেই। সাধারণীকৃত অনুমানের সমীকরণগুলি ব্যবহার করে সম্পর্কিত সম্পর্কিত ডেটার পরিসংখ্যানগত বিশ্লেষণ: একটি ওরিয়েন্টেশন। আমি জে এপিডেমিওল। 2003; 157: 364।


এটি প্রকৃতপক্ষে সহায়ক, তবে এটি আমাকে অবাক করে তোলে যে কেন তখনও কেউ স্বাধীনতার কাঠামো ব্যবহার করবে কেননা প্রতি ক্লাস্টারিং পর্যবেক্ষণের মধ্যে কিছুটা মিলকে বোঝায়। যাইহোক, আমি এই ধারণাটির মধ্যে রয়েছি যে স্কুলের ক্ষেত্রে সাদৃশ্য অন্যান্য স্কুলের সাথে সম্পর্কিত , এবং প্রতিটি বিদ্যালয়ের মধ্যেই ছাত্ররা স্বাধীন হবে। সুতরাং আমি এখনও খুব পরিষ্কার না।
থিওডোর লাইট্রাস

হ্যাঁ, আপনি যদি একক বিদ্যালয়ে আপনার নমুনা এবং উপ-মডেলিং সীমাবদ্ধ করে থাকেন তবে কোনও উদ্বেগের দরকার নেই। এই ক্ষেত্রে ত্রুটিগুলি iid হয় অনুমান করা আরও যুক্তিযুক্ত হতে পারে। তবে একবার আপনি বিভিন্ন স্কুল থেকে বাচ্চাদের একই নমুনা / মডেলের সাথে সংযুক্ত করা শুরু করলে, এই ধারণাটি ক্ষুন্ন হয়ে যায়, যদি না আপনি যদি মডেলটিতে বিদ্যালয়ের জন্য হিসাব করেন, তবে যাতে স্কুলে শর্তাধীন ত্রুটিগুলি আইডিকে ধরে নেওয়া হয় না।
ডিএল ডাহলি

এটি লক্ষণীয় যে আপনি যদি নমুনার আকার, পুনরাবৃত্ত পদক্ষেপের সংখ্যা এবং সময়, গুচ্ছের সংখ্যা ইত্যাদির বিষয়ে কিছু বিবরণ সরবরাহ করতে পারেন তবে লোকেরা আপনার পক্ষে আরও সহায়ক হতে পারে
ডিএল ডাহলি

2
@DLDahly আপনার পয়েন্ট (1) এমন কিছু নয় যা আমি প্রায়শই বায়োস্ট্যাটাস্টিকাল প্যানেল বিশ্লেষণে পাই। এআর-এন পারস্পরিক সম্পর্ক গঠনের পিছনে একটি অনুমান হ'ল, তাদের মধ্যে পর্যাপ্ত সময় দেওয়া হলে, একই ব্যক্তির উপর দুটি পরিমাপ বিভিন্ন ব্যক্তির মধ্যে দুটি পরিমাপের মতোই অসংলগ্ন হতে পারে। যাইহোক, ক্লাস্টার কনফাউন্ডারগুলির মধ্যে অন্তর্নিহিত মেজর প্রায়শই ভিন্ন ভিন্ন কিছু (যেমন জেনেটিক মার্কার্স) বিভিন্ন হয় না এবং ধরে নেওয়া খুব কঠিন (যদি অসম্ভব না হয়) তবে তা নির্ধারণ করা খুব কঠিন। যদিও একটি লোর্লাগ্রাম শুরু করার জন্য খুব ভাল জায়গা।
আদমো

1

(0) সাধারণ মন্তব্য: আমি ক্রসওলিয়েটেডে দেখি বেশিরভাগ মডেলগুলি খুব জটিল। সম্ভব হলে সরল করুন। ফলাফলগুলির তুলনা করার জন্য এটি প্রায়শই জিইই এবং মিশ্র মডেলের সাথে মডেলিংয়ের পক্ষে মূল্যবান।
(1) হ্যাঁ বিনিময়যোগ্য চয়ন করুন। আমার দ্ব্যর্থহীন উত্তরটি জিইইর সর্বাধিক বিস্তৃত সুবিধার ভিত্তিতে: অনুমানগুলি থেকে অনুমানের স্থিতিস্থাপকতা।
আপনি যদি আপনার ক্ষেত্রের পড়াশোনার দিকে নজর দেন তবে আপনাকে দেখতে হবে যে এক্সচটি ডিফল্ট বিকল্প। এর অর্থ এই নয় যে এটি সর্বোত্তম, তবে বিবেচনা করা প্রথম হওয়া উচিত। আপনার ডেটা সম্পর্কে বিশদ জ্ঞান না রেখে পরামর্শ দেওয়া প্রস্থান সেরা পরামর্শ হবে।
(২) হ্যাঁ, "কিউআইসি" এর মতো ডেটাচালিত পদ্ধতি রয়েছে। এটি স্টাটা উদাহরণ, তবে একটি যুক্তিসঙ্গত বিকল্প হিসাবে বহুলভাবে গ্রহণযোগ্য, যদিও বাস্তবে খুব কমই ব্যবহৃত হয়:http://www.stata-jorter.com/sjpdf.html?articlenum=st0126 )
(3) পয়েন্টের অনুমানগুলি কখনই হুবহু হয় না (আপনি যদি ইন্ডেপ পারস্পরিক সম্পর্ক কাঠামো ব্যবহার না করেন) তবে সাধারণত বেশ কাছাকাছি থাকে। আপনি এর জন্য অনুভূতি পেতে সহজ / জি / মিশ্রিত প্রভাবগুলির মডেল অনুমানের তুলনা করে অনেক নিবন্ধগুলি পেতে পারেন ( https://recherche.univ-lyon2.fr/greps/IMG/pdf/JEBS.pdf ) বেশিরভাগ পাঠ্যপুস্তকে একটি টেবিল বা এই জন্য দুটি। একটি স্বতঃসংশ্লিষ্ট কাঠামোর জন্য আপনি মূলত শক্তিশালী এস এস সহ পোয়েজন মডেল চালাচ্ছেন। সুতরাং অনুমানগুলি হুবহু এক হবে। এসই সাধারণত বড় হয়। তবে কখনও কখনও শক্তিশালী এসই ছোট হয় (এটি জীবন: আগ্রহী হলে গুগল ব্যথা মুক্ত ব্যাখ্যা সরবরাহ করে)
(4) উপরে (1) এবং (2) দেখুন।
(৫) না বা আরও ভালভাবে বলা হয়েছে, আপনি যদি এতে যথেষ্ট পরিশ্রম করেন তবে আপনি যে কোনও কিছু করতে পারেন তবে এটি খুব কমই প্রচেষ্টাটির পক্ষে মূল্যবান।


0

আপনি যা করছেন তা করতে আপনি একটি জি এর সাথে ভুল পদ্ধতির ব্যবহার করছেন কারণ আপনি কাঠামো জানেন না এবং আপনার ফলাফলগুলি সম্ভবত বিভ্রান্ত হবে। এটি জেমি রবিনসন দেখুন। আপনি দীর্ঘ ব্যবহার করা প্রয়োজন। টিএমএলই (মার্ক ভ্যান ডার ল্যান) অথবা আইপিডাব্লু ওজন সহ একটি জি e পারস্পরিক সম্পর্কের জন্য অ্যাকাউন্টিং না করা হ্রাস করা যায় না। কেবলমাত্র ভাবেন যদি সমস্ত পুনরাবৃত্তি ব্যবস্থা 100% সম্পর্কিত হয় তবে কার্যকরভাবে আপনার পক্ষে উপায় কম কম পর্যবেক্ষণ (মূলত কেবলমাত্র আপনার এন বিষয়গুলির জন্য n) এবং ছোট এন এর অর্থ উচ্চতর বৈকল্পিকতা রয়েছে।


যদি আপনার বেঁচে থাকার ধরণের ফলাফল না থাকে তবে আপনি প্রপোসিটি স্কোরটি সঠিকভাবে ধরে নিবেন বলে ধরে নিরপেক্ষ অনুমানের জন্য প্রস্তাবিত স্বাধীন কর স্ট্রাকচার এবং আইপিটিডাব্লু ওয়েটের সাথে জিৎ পদ্ধতির ব্যবহার করতে পারেন। টিএমএলই সব ক্ষেত্রে বেঁচে থাকুক বা না হউক না কেন আপনি প্রবণতা স্কোর এবং অনুক্রমিক রেজগ্রেশনগুলির পূর্বাভাস দেওয়ার জন্য এবং পরে দক্ষ দক্ষতা অর্জনের জন্য জড়ো শেখা ব্যবহার করতে পারেন use আপনার পন্থা অবশ্যই পক্ষপাতদুষ্ট হবে এবং ভুল অনুমিতি দেবে এবং আপনার নমুনার আকারটি বৃহত্তর দিবে, যদি কোনও প্রভাব না থাকে, আপনি সম্ভবত একটি ভুল উল্লেখযোগ্য প্রভাব চিহ্নিত করতে পারেন !!
জনাথন লেভি

এটি আরও বিশদ ব্যবহার করতে পারে। জেনি রবিনসন কী? ভ্যান ডার লানের কোন কাগজ?
mdewey

@ এমডেউই দুঃখিত, টাইপো মানে জেমি রবিনস। রবিনস, হানানান, বাবেতে 2000 প্রান্তিক কাঠামোগত মডেলগুলি এবং কার্যকারণ সূচনা চেষ্টা করুন - অস্থায়ীতার ফলাফলের জন্য কার্যকর পদ্ধতিতে এমএসএম করার উপায় সহ দুর্দান্ত পদ্ধতি there ল্যানের জন্য, বইটি লক্ষ্যবস্তু শেখা learning যেমনটি আমি বলেছিলাম, ল্যান সম্ভবত সেরা তবে বুঝতে আরও বেশি লাগে। আর প্যাকেজ Ltmle এই পদ্ধতিটি করে তবে শিখতে কিছুটা সময় নেয়।
জোনাথন লেভি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.