কোন একক মডেল ব্যবহারের জন্য একাধিক তুলনা পদ্ধতি: lsmeans বা গ্লাহ্ট?


16

আমি একটি স্থির প্রভাব (শর্ত) এবং দুটি এলোমেলো প্রভাব (বিষয় নকশা এবং জুটির মধ্যে অংশগ্রহণকারী) সহ একটি মিশ্র ইফেক্ট মডেল ব্যবহার করে একটি ডেটা সেট বিশ্লেষণ করছি। মডেল দিয়ে তৈরি করা হয়েছিল lme4প্যাকেজ: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)

এরপরে, আমি স্থির প্রভাব (শর্ত) ছাড়াই মডেলটির বিপরীতে এই মডেলের সম্ভাবনা অনুপাতের পরীক্ষা করেছি এবং একটি উল্লেখযোগ্য পার্থক্য রয়েছে। আমার ডেটা সেটটিতে 3 টি শর্ত রয়েছে তাই আমি একাধিক তুলনা করতে চাই তবে কোন পদ্ধতিটি ব্যবহার করতে হবে তা সম্পর্কে আমি নিশ্চিত নই । আমি ক্রসভিলেটেড এবং অন্যান্য ফোরামে অনুরূপ বেশ কয়েকটি প্রশ্ন পেয়েছি তবে আমি এখনও বেশ বিভ্রান্ত।

আমি যা দেখেছি, সেগুলি থেকে লোকেরা ব্যবহারের পরামর্শ দিয়েছেন

1.lsmeans প্যাকেজ - lsmeans(exp.model,pairwise~condition)যা আমার নিম্নলিখিত আউটপুট দেয়:

condition     lsmean         SE    df  lower.CL  upper.CL
 Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089
 Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443
 Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552

Confidence level used: 0.95 

$contrasts
 contrast                   estimate         SE    df t.ratio p.value
 Condition1 - Condition2 -0.04893538 0.03813262 62.07  -1.283  0.4099
 Condition1 - Condition3 -0.10424628 0.03813262 62.07  -2.734  0.0219
 Condition2 - Condition3 -0.05531090 0.03813262 62.07  -1.450  0.3217

P value adjustment: tukey method for comparing a family of 3 estimates 

2.multcomp দুটি ভিন্ন উপায়ে প্যাকেজ - ব্যবহার mcp glht(exp.model,mcp(condition="Tukey"))ফলে

     Simultaneous Tests for General Linear Hypotheses

Multiple Comparisons of Means: Tukey Contrasts


Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error z value Pr(>|z|)  
Condition2 - Condition1 == 0  0.04894    0.03749   1.305    0.392  
Condition3 - Condition1 == 0  0.10425    0.03749   2.781    0.015 *
Condition3 - Condition2 == 0  0.05531    0.03749   1.475    0.303  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1
(Adjusted p values reported -- single-step method)

এবং এর lsm glht(exp.model,lsm(pairwise~condition))ফলে ব্যবহার

Note: df set to 62

     Simultaneous Tests for General Linear Hypotheses

Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair), 
    data = exp, REML = FALSE)

Linear Hypotheses:
                             Estimate Std. Error t value Pr(>|t|)  
Condition1 - Condition2 == 0 -0.04894    0.03749  -1.305   0.3977  
Condition1 - Condition3 == 0 -0.10425    0.03749  -2.781   0.0195 *
Condition2 - Condition3 == 0 -0.05531    0.03749  -1.475   0.3098  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1
(Adjusted p values reported -- single-step method)

আপনি দেখতে পাচ্ছেন, পদ্ধতিগুলি বিভিন্ন ফলাফল দেয়। এটি আর এবং পরিসংখ্যানগুলির সাথে আমার প্রথমবারের মতো কাজ করছে যাতে কিছু ভুল হতে পারে তবে আমি কোথায় জানি না। আমার প্রশ্নগুলি হ'ল:

উপস্থাপিত পদ্ধতির মধ্যে পার্থক্য কী? আমি একটি সম্পর্কিত প্রশ্নের উত্তরে পড়েছিলাম এটি স্বাধীনতার ডিগ্রি ( lsmeansবনাম glht) সম্পর্কে। এই জাতীয় ডেটা সেট / মডেল ইত্যাদির জন্য কোন কোনটি, অর্থাৎ পদ্ধতি 1 ভাল ব্যবহার করার সময় কিছু বিধি বা প্রস্তাবনা রয়েছে? আমার কোন ফলাফলটি রিপোর্ট করা উচিত? আরও ভাল না জেনে আমি সম্ভবত এটি গিয়ে নিরাপদে খেলতে পারা সর্বোচ্চ প-মানটি জানিয়েছি তবে এর আরও ভাল কারণ হ'লে ভাল লাগবে। ধন্যবাদ

উত্তর:


17

সম্পূর্ণ উত্তর নয় ...

glht(myfit, mcp(myfactor="Tukey"))অন্য দুটি পদ্ধতির মধ্যে পার্থক্য হ'ল এইভাবে একটি "জেড" স্ট্যাটিস্টিক (সাধারণ বিতরণ) ব্যবহার করা হয়, অন্যদিকে অন্যান্যগুলি "টি" স্ট্যাটিস্টিক (ছাত্র বিতরণ) ব্যবহার করে। "জেড" পরিসংখ্যান এটি অসীম মাত্রার স্বাধীনতার সাথে "টি" পরিসংখ্যান হিসাবে একই। এই পদ্ধতিটি একটি অ্যাসিম্পটোটিক এবং এটি অন্যগুলির তুলনায় আরও ছোট পি-মান এবং সংক্ষিপ্ত আত্মবিশ্বাসের অন্তর সরবরাহ করে। পি-মানগুলি খুব ছোট হতে পারে এবং ডেটাসেটটি ছোট হলে আত্মবিশ্বাসের ব্যবধানগুলি খুব কম হতে পারে।

আমি চালানোর lsmeans(myfit, pairwise~myfactor)সময় নিম্নলিখিত বার্তা উপস্থিত হয়:

Loading required namespace: pbkrtest

এর অর্থ হ'ল lsmeans(কোনও lmerমডেলের জন্য) pbkrtestপ্যাকেজটি ব্যবহার করে যা "টি" পরিসংখ্যানের স্বাধীনতার ডিগ্রিগুলির জন্য কেনওয়ার্ড এবং রজার্স পদ্ধতি প্রয়োগ করে। এই পদ্ধতিটি অ্যাসিম্পটোটিকের চেয়ে আরও ভাল পি-মান এবং আত্মবিশ্বাসের অন্তর সরবরাহ করতে চায় (যখন স্বাধীনতার ডিগ্রি বড় হয় তখন কোনও পার্থক্য নেই)।

এখন, মধ্যে পার্থক্য সম্পর্কে lsmeans(myfit, pairwise~myfactor)$contrastsএবং glht(myfit, lsm(pairwise~factor), আমি শুধু কিছু পরীক্ষার করেছ এবং আমার পর্যবেক্ষণ নিম্নলিখিত বেশী:

  • lsmlsmeansপ্যাকেজ এবং প্যাকেজ মধ্যে একটি ইন্টারফেস হয় multcomp(দেখুন ?lsm)

  • সুষম ডিজাইনের জন্য ফলাফলের মধ্যে কোনও পার্থক্য নেই

  • ভারসাম্যহীন ডিজাইনের জন্য, আমি ফলাফলগুলির মধ্যে ছোট পার্থক্য লক্ষ্য করেছি (স্ট্যান্ডার্ড ত্রুটি এবং টি অনুপাত)

দুর্ভাগ্যক্রমে আমি জানি না যে এই পার্থক্যের কারণ কী। দেখে মনে হচ্ছে কেবলমাত্র লিনিয়ার হাইপোথিসিস ম্যাট্রিক্স এবং স্বাধীনতার ডিগ্রি পেতে lsmকলগুলি দেখায় lsmeans, তবে lsmeansস্ট্যান্ডার্ড ত্রুটিগুলি গণনা করার জন্য একটি ভিন্ন উপায় ব্যবহার করে।


বিস্তারিত প্রতিক্রিয়া জন্য ধন্যবাদ! আমি পরীক্ষার পরিসংখ্যানের পার্থক্য পুরোপুরি মিস করেছি ... আপনি উল্লেখ করেছেন যে অ্যাসিপটোটিক পদ্ধতির জন্য মানগুলি খুব ছোট এবং সিআই খুব সংকীর্ণ হতে পারে। আমার ডেটা সেটটিতে ~ 30 জন অংশগ্রহণকারী রয়েছে যাতে আমি অনুমান করি যে আমি টি-স্ট্যাটিস্টিকের সাথে লেগে থাকব। আপনি যখন বলেন যে কেনওয়ার্ড এবং রজার্স পদ্ধতিটি আরও ভাল পি-মানগুলিতে নিয়ে যায়, আপনার অর্থ কি আরও নির্ভুল বা ছোট? সুতরাং পার্থক্যগুলি ডিএফ এবং এসই গণনা পদ্ধতির পার্থক্যের কারণে এবং আমার মডেলটির সাথে এর একটির ভুল ব্যবহারের কারণে নয়, যদি আমি আপনাকে সঠিকভাবে বুঝতে পারি। এখানে কি "সেরা" পদ্ধতি বাছাই করার কোনও উপায় আছে?
schvaba986

11
(আমি lsmeans প্যাকেজ বিকাশকারী) pbkrtest প্যাকেজ lsmeansব্যবহার করে, যা (1) কেনওয়ার্ড-রজার্স ডিএফ গণনা এবং (2) অনুমানগুলিতে হ্রাসযুক্ত পক্ষপাত সহ একটি সমন্বিত কোভেরিয়েন্স ম্যাট্রিক্স সরবরাহ করে। আপনি যদি প্রথম সেট করেন lsm.options(disable.pbkrtest=TRUE), তারপরে lsmeansকলটি adjust="mvt"একই ফল পাবে glht, মাল্টিভারিয়েট টি বিতরণের জন্য উভয় প্যাকেজ দ্বারা র্যান্ডমাইজড অ্যালগরিদমের কারণে সামান্য পার্থক্য বাদে results
রুশ দৈর্ঘ্য

3
তবে, আমি পিবিক্রিস্টকে অক্ষম না করে "এমভিটি" অ্যাডজাস্টমেন্টের পরামর্শ দিচ্ছি, কারণ পক্ষপাত সামঞ্জস্য এবং কোনও ডিএফ ছাড়াই, অ্যাসিপটোটিক (জেড) মানগুলি মূলত অসীম ডিএফ ধরে নেয়, যার ফলে অবাস্তবভাবে নিম্ন পি মানগুলি পাওয়া যায়।
রুশ দৈর্ঘ্য

3
যাইহোক, এর জন্য summaryপদ্ধতিটি glhtডিফল্ট এক-ধাপ (একযোগে সিআই) বহুগুণ সমন্বয় ছাড়াও বিভিন্ন ধাপ-ডাউন পরীক্ষার পদ্ধতিগুলির জন্যও অনুমতি দেয়। সম্পূর্ণ ভিন্ন বিন্দুতে, আপনার যদি একাধিক ফ্যাক্টর থাকে lsmতবে সাধারণ ধরণের তুলনা বেশ সহজেই তৈরি করতে পারেন, যখন mcpএটি একেবারেই করতে পারেন না।
রুশ দৈর্ঘ্য
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.