এলোমেলো প্রভাব ফ্যাক্টরের জন্য ন্যূনতম প্রস্তাবিত সংখ্যার গ্রুপ কী?


26

কিছু পুনরাবৃত্তি ব্যবস্থা ডেটা বিশ্লেষণ করতে আমি R( lme4) এর মধ্যে একটি মিশ্র মডেল ব্যবহার করছি । আমার কাছে একটি প্রতিক্রিয়ার ভেরিয়েবল (মলের ফাইবার সামগ্রী) এবং 3 টি নির্দিষ্ট প্রভাব (দেহের ভর ইত্যাদি) রয়েছে। আমার গবেষণায় প্রত্যেকের জন্য 16 টি পুনরাবৃত্তি ব্যবস্থা সহ কেবল 6 জন অংশগ্রহণকারী রয়েছে (যদিও দুটির মধ্যে 12 টি পুনরাবৃত্তি রয়েছে)। বিষয়গুলি টিকটিকি যেগুলি বিভিন্ন 'ট্রিটমেন্টে' খাবারের বিভিন্ন সংমিশ্রণ দেওয়া হয়েছিল।

আমার প্রশ্নটি: আমি কি সাবজেক্ট আইডিটিকে এলোমেলো প্রভাব হিসাবে ব্যবহার করতে পারি?

আমি জানি বিষয়গুলি এলোমেলোভাবে নমুনাযুক্ত প্রকৃতির এবং বিষয়গুলির মধ্যে যে পর্যবেক্ষণগুলি বিষয়গুলির মধ্যে রয়েছে তার তুলনায় আরও ঘনিষ্ঠভাবে সম্পর্কিত হবে তা বিবেচনা করার জন্য, এটি অনুদৈর্ঘ্য মিশ্র প্রভাবগুলির মডেলগুলির সাধারণ ক্রিয়াকলাপ। তবে, বিষয় আইডিকে একটি এলোমেলো প্রভাব হিসাবে চিকিত্সা করাতে এই ভেরিয়েবলের জন্য গড় এবং বৈকল্পিক অনুমান করা জড়িত।

  • যেহেতু আমার কাছে মাত্র 6 টি বিষয় (এই ফ্যাক্টরের 6 টি স্তর) রয়েছে, তাই কি গড় এবং বৈকল্পিকের একটি নির্ভুল বৈশিষ্ট্য পেতে যথেষ্ট?

  • আমার প্রতিটি বিষয়ের জন্য বেশ কয়েকটি পুনরাবৃত্তি পরিমাপ করার বিষয়টি কি এই ক্ষেত্রে সহায়তা করে (আমি কীভাবে এটি গুরুত্বপূর্ণ তা দেখতে পাচ্ছি না)?

  • অবশেষে, আমি যদি সাবজেক্ট আইডিটিকে এলোমেলো প্রভাব হিসাবে ব্যবহার করতে না পারি, তবে এটির একটি স্থির প্রভাব হিসাবে আমাকে কীভাবে পুনরাবৃত্তি করতে হবে তা নিয়ন্ত্রণ করার অনুমতি দেবে?

সম্পাদনা: আমি কেবল স্পষ্ট করে বলতে চাই যে যখন আমি "ক্যান" আমি এলোমেলো প্রভাব হিসাবে সাবজেক্ট আইডি ব্যবহার করি তখন আমার অর্থ "এটি কি ভাল ধারণা"। আমি জানি আমি মাত্র 2 স্তরের একটি ফ্যাক্টরের সাথে মডেলটিকে ফিট করতে পারি, তবে অবশ্যই এটি অন-ডিফেসেবল হবে? আমি জিজ্ঞাসা করছি কোন মুহূর্তে এলোমেলো প্রভাব হিসাবে বিষয়গুলি চিকিত্সা সম্পর্কে চিন্তা করা বুদ্ধিমান হয়ে ওঠে? মনে হচ্ছে সাহিত্যের পরামর্শ দেয় যে 5-6 স্তরগুলি একটি নিম্ন সীমাবদ্ধ। আমার কাছে মনে হয় যে 15+ ফ্যাক্টর স্তর না হওয়া পর্যন্ত এলোমেলো প্রভাবের গড় এবং তারতম্যের প্রাক্কলন খুব সুনির্দিষ্ট হবে না।

উত্তর:


21

সংক্ষিপ্ত উত্তর: হ্যাঁ, আপনি 6 স্তরের সাথে এলোমেলো প্রভাব হিসাবে আইডি ব্যবহার করতে পারেন।

সামান্য দীর্ঘতর উত্তর: @ বেনবোলকারের জিএলএমএম এফএকিউ "অন্যান্য বিষয়গুলির মধ্যে) নীচে" আমার কি ফ্যাক্টর এক্সএক্সএক্সএক্সকে স্থির বা এলোমেলো হিসাবে বিবেচনা করা উচিত? "শিরোনামে বলা হয়েছে:

'আধুনিক' মিশ্রিত মডেল অনুমানের সাথে নির্দিষ্ট প্রাসঙ্গিকতার একটি বিষয় ('ধ্রুপদী' পদ্ধতি-মুহুর্তের অনুমানের চেয়ে) হ'ল, ব্যবহারিক উদ্দেশ্যে, অবশ্যই এলোমেলো-প্রভাব স্তরগুলির একটি যুক্তিসঙ্গত সংখ্যার (যেমন ব্লক) থাকতে হবে - এর চেয়ে বেশি সর্বনিম্ন 5 বা 6।

সুতরাং আপনি নীচের গণ্ডীতে, তবে এটির ডানদিকে।


12

মাল্টিলেভেল মডেলের ন্যূনতম সংখ্যার সংখ্যা নির্ধারণের প্রয়াসে আমি জেলম্যান অ্যান্ড হিল (২০০)) দ্বারা ডেটা অ্যানালাইসিস ইউজ রিগ্রেশন এবং মুলিটাইলভেল / হায়ারার্কিকাল মডেল বইটি দেখেছি

তারা এই বিষয়টিকে অধ্যায় 11, বিভাগ 5 (পৃষ্ঠা 247) তে সম্বোধন করতে দেখা গেছে যেখানে তারা লিখেছেন যে যখন <5 গ্রুপ থাকে তখন মাল্টিলেভেল মডেলগুলি সাধারণত শাস্ত্রীয় মডেলগুলির তুলনায় সামান্য যোগ করে। যাইহোক, তারা লিখতে হাজির যে একটি বহুস্তর মডেল প্রয়োগ করার ঝুঁকি খুব কম আছে।

একই লেখকরা 12 ম অধ্যায়, বিভাগ 9 (পৃষ্ঠা 275-276) এ এই বিষয়ে ফিরে আসবেন বলে মনে হচ্ছে। সেখানে তারা লিখেছেন যে একটি বহুস্তরের মডেলের জন্য ন্যূনতম সংখ্যক গোষ্ঠীর পরামর্শটি বিপথগামী। সেখানে তারা আবার বলেছে যে মাল্টিলেভেল মডেলগুলি প্রায়শই ক্লাসিকাল মডেলের তুলনায় সামান্য সংযোজন করে যখন গ্রুপ সংখ্যা কম হয়। তবে, তারা আরও লিখেছেন যে মাল্টিলেভেল মডেলগুলি ন-পুলিং রিগ্রেশনের চেয়ে খারাপ কিছু করা উচিত নয় (যেখানে নো-পুলিংয়ের অর্থ গ্রুপের সূচকগুলি শাস্ত্রীয় প্রতিরোধে ব্যবহৃত হয়))

পৃষ্ঠাগুলিতে ২5৫-২76। পৃষ্ঠায় লেখকরা একটি বা দুটি গ্রুপের ক্ষেত্রে (যেমন, পুরুষ বনাম মহিলা) ক্ষেত্রে একটি নির্দিষ্ট সাবস্কিপশন রাখেন। এখানে তারা লিখেন যে তারা সাধারণত শাস্ত্রীয় আকারে মডেলটি প্রকাশ করেন। তবে, তারা জানিয়েছে যে মাল্টিলেভেল মডেলিং এমনকি শুধুমাত্র এক বা দুটি গ্রুপের সাথেও কার্যকর হতে পারে। তারা লিখেছেন যে এক বা দুটি গ্রুপের সাথে মাল্টিলেভেল মডেলিং ক্লাসিকাল রিগ্রেশন হ্রাস করে।

এ থেকে আমার ধারণাটি হল যে ধ্রুপদী প্রতিরোধ মডেলগুলির ধারাবাহিকতার এক প্রান্ত, অর্থাত্, বহুস্তরের মডেলের একটি বিশেষ ক্ষেত্রে।

উপরের উপর ভিত্তি করে, আমার ধারণাটি হল যে ক্লাসিকাল রিগ্রেশন এবং মাল্টিলেভেল মডেলিং যখন প্রায় দু'টি গ্রুপ থাকে এবং কেবল এক, দুই, তিন, চার, পাঁচ বা ছয়টি গ্রুপ সহ মাল্টিলেভেল মডেলগুলি ব্যবহার করা ঠিক হয় তবে প্রায় অভিন্ন অনুমান ফিরে আসবে।

আমি এই উত্তরটি Rকোড এবং দুটি গ্রুপ ব্যবহার করার সময় উভয় পদ্ধতির সাথে প্রাপ্ত অনুমানের সাথে তুলনা করে একটি ছোট ডেটা সেট দিয়ে সংশোধন করার চেষ্টা করব ।


10

এটির মূল্যের জন্য, আমি তুলনামূলকভাবে সহজ এলএমএমের (যেমনটি sleepstudyডেটাসেটের মাধ্যমে উপলব্ধ lme4) ব্যবহার করে বৈকল্পিক অনুমানের স্থায়িত্ব দেখতে কিছুটা সিমুলেশন অধ্যয়ন করেছি । প্রথম উপায়ে সাবজেক্টের সংখ্যার জন্য সমস্ত সম্ভাব্য সাবজেক্টের সংমিশ্রণ উত্পন্ন করে ngroupsএবং প্রতিটি সম্ভাব্য সংমিশ্রণের জন্য মডেলটিকে প্রতিফলিত করে। দ্বিতীয়টি সাবজেক্টের কয়েকটি এলোমেলো সাবসেট নেয়।

library(lme4)
library(ggplot2)
library(tidyr)

m0 <- lmer(Reaction ~ Days + (1|Subject), data = sleepstudy,
           control = lmerControl(optimizer = "nloptwrap"))
# set the number of factor levels
ngroups <- 3:18 
# generate all possible combinations
combos <- lapply(X = ngroups, 
                 FUN = function(x) combn(unique(sleepstudy$Subject), x)) 

# allocate output (sorry, this code is entirely un-optimized)
out <- list(matrix(NA, ncol(combos[[1]]), 1), matrix(NA, ncol(combos[[2]]), 1),
            matrix(NA, ncol(combos[[3]]), 1), matrix(NA, ncol(combos[[4]]), 1),
            matrix(NA, ncol(combos[[5]]), 1), matrix(NA, ncol(combos[[6]]), 1),
            matrix(NA, ncol(combos[[7]]), 1), matrix(NA, ncol(combos[[8]]), 1),
            matrix(NA, ncol(combos[[9]]), 1), matrix(NA, ncol(combos[[10]]), 1),
            matrix(NA, ncol(combos[[11]]), 1), matrix(NA, ncol(combos[[12]]), 1),
            matrix(NA, ncol(combos[[13]]), 1), matrix(NA, ncol(combos[[14]]), 1),
            matrix(NA, ncol(combos[[15]]), 1), matrix(NA, ncol(combos[[16]]), 1))
# took ~ 2.5 hrs on my laptop, commented out for safety
#system.time(for(ii in 1:length(combos)) {
#    for(jj in 1:ncol(combos[[ii]])) {
#    sls <- sleepstudy[sleepstudy$Subject %in% combos[[ii]][,jj],]
#    out[[ii]][jj] <- attr(VarCorr(update(m0, data = sls))$Subject, 'stddev')
#        }
#    })

# pad with zeros, not all were equal
# from http://stackoverflow.com/questions/11148429/r-convert-asymmetric-list-to-matrix-number-of-elements-in-each-sub-list-diffe
max.len <- max(sapply(out, length))
corrected.list <- lapply(out, function(x) {c(x, rep(NA, max.len - length(x)))})
mat <- do.call(rbind, corrected.list)
mat <- data.frame(t(mat))
names(mat) <- paste0('s',3:18)
mat <- gather(mat, run, value)

ggplot(mat, aes(x = value, fill = run)) + 
    geom_histogram(bins = 60) +
    geom_vline(xintercept = 37.12, linetype =  'longdash', 
               aes(colour = 'original')) +
    facet_wrap(~run, scales = 'free_y') +
    scale_x_continuous(breaks = seq(0, 100, by = 20)) + 
    theme_bw() + 
    guides(fill = FALSE)

ডটেড ব্ল্যাক লাইনটি তারতম্যের মূল বিন্দু অনুমান, এবং দিকগুলি বিভিন্ন সংখ্যক বিষয়ের প্রতিনিধিত্ব করে ( s3তিনটি বিষয়ের গ্রুপ s4হওয়া, চারটি হওয়া ইত্যাদি)। এখানে চিত্র বর্ণনা লিখুন

এবং বিকল্প উপায়:

ngroups <- 3:18
reps <- 500
out2<- matrix(NA, length(ngroups), reps)

for (ii in 1:length(ngroups)) {
    for(j in 1:reps) {
        sls <- sleepstudy[sleepstudy$Subject %in% sample(unique(sleepstudy$Subject), ngroups[i], replace = FALSE),]
        out2[i,j] <- attr(VarCorr(update(m0, data = sls))$Subject, 'stddev')
    }
}
out2 <- data.frame(t(out2))
names(out2) <- paste0('s',3:18)
out2 <- gather(out2, run, value)

ggplot(out2, aes(x = value, fill = run)) + 
    geom_histogram(bins = 60) +
    geom_vline(xintercept = 37.12, linetype =  'longdash', 
               aes(colour = 'original')) +
    facet_wrap(~run, scales = 'free_y') +
    scale_x_continuous(breaks = seq(0, 100, by = 20)) + 
    theme_bw() + 
    guides(fill = FALSE)

এখানে চিত্র বর্ণনা লিখুন

এটি উপস্থিত হয় (উদাহরণস্বরূপ, যাইহোক) যে পরে না হলেও কমপক্ষে 14 টি বিষয় না হওয়া অবধি সত্যতা স্থিতিশীল হয় না।


1
+1 টি। অবশ্যই সাবজেক্টের সংখ্যা যত কম, ভেরিয়েন্সের অনুমানের পরিমাণের পরিমাণ তত বেশি। তবে আমার মনে হয় না এখানে এটি গুরুত্বপূর্ণ। প্রশ্নটি হচ্ছে, কোন সংখ্যক বিষয়গুলি কিছু বুদ্ধিমান ফলাফল পেতে দেয়? যদি আমরা শূন্য বৈকল্পটি প্রাপ্ত হিসাবে "অ-সংবেদনশীল" ফলাফলটিকে সংজ্ঞায়িত করি, তবে আপনার সিমুলেশনটিতে এটি প্রায়শই এন = 5 বা তারও কম সংঘটিত হয়। এন = or বা এন = from থেকে শুরু করে আপনি প্রায় কোনওসময়ই 0 বৈকল্পিকের সঠিক অনুমান পাবেন না, যেমন মডেলটি একটি অবনমিত দ্রষ্ট্রে রূপান্তরিত হয়। আমার উপসংহারটি হবে যে এন = 6 হ'ল বর্ডারলাইন গ্রহণযোগ্য।
অ্যামিবা


8

অ্যাঞ্জিস্ট এবং পিস্কের "বেশিরভাগ ক্ষতিকারক একনোমেট্রিক্স" শিরোনামে একটি বিভাগ রয়েছে, "৪২ টি ক্লাস্টারের চেয়ে কম" শিরোনামে তারা অর্ধ-রসিকভাবে বলেছেন,

অতএব, জীবন ... মহাবিশ্ব এবং সমস্ত কিছুর উত্তর ৪২, এই হ'ল অনুসরণ করে আমরা বিশ্বাস করি যে প্রশ্নটি হল: স্ট্যান্ডার্ড ক্লাস্টার সমন্বয় [জিইইতে ভেরিয়েন্স অনুমানের অনুরূপ] ব্যবহারযোগ্য নির্ভরযোগ্য অনুক্রমের জন্য কতগুলি ক্লাস্টার যথেষ্ট?

আমার একনোমেট্রিক্স প্রশিক্ষক আপনার মতো প্রশ্নের উত্তর দেওয়ার জন্য যেভাবে ব্যবহার করেছিলেন তা হ'ল আমেরিকা একটি মুক্ত দেশ, আপনি যা খুশি তা করতে পারেন But তবে আপনি যদি নিজের কাগজ প্রকাশ করতে চান তবে আপনার কাজটি ডিফেন্ড করতে সক্ষম হতে হবে। " অন্য কথায়, আপনি সম্ভবত আর বা স্টাটা বা এইচএলএম বা এমপ্লাস বা এসএএসসি প্রস গ্লিমমিক্স কোডটি 6 টি বিষয় নিয়ে চালাতে সক্ষম হবেন (এবং আপনার বিকল্পগুলির মধ্যে একটি এটি চালনা না করে এই বিকল্প প্যাকেজগুলিতে স্যুইচ করুন) তবে আপনি সম্ভবত এই পদ্ধতির পক্ষে এবং অ্যাসিপটোটিক পরীক্ষাগুলিকে ন্যায্যতা দেওয়ার পক্ষে খুব কঠিন সময়।

আমি বিশ্বাস করি যে ডিফল্টরূপে, এলোমেলো slাল হিসাবে একটি ভেরিয়েবল সহ একটি স্থির প্রভাব হিসাবে এটিও বোঝায় এবং আপনি যদি কেবলমাত্র এটির গড়ের সাথে একটি এলোমেলো প্রভাব হিসাবে দেখতে চান তবে আপনাকে প্রচুর সিনট্যাক্স হুপ করতে হবে jump শূন্য। এটি একটি বুদ্ধিমান পছন্দ যা সফ্টওয়্যার বিকাশকারীরা আপনার জন্য তৈরি করেছে।


1
আমি আপনার বক্তব্যটি নিয়েছি যে প্রশ্নের উত্তরটি একটি পরিমাণে, "স্ট্রিংয়ের টুকরো কত দীর্ঘ"। তবে, আমি ১৫-২০ এরও কম নমুনা থেকে কোনও গড় বা তারতম্য অনুমান করার পক্ষে খুব বেশি আস্থা রাখব না, সুতরাং থাম্বের একই নিয়মটি এলোমেলো প্রভাবের স্তরের ক্ষেত্রে প্রযোজ্য হবে না। আমি কখনও কাউকে সাবজেক্ট আইডি অন্তর্ভুক্ত এবং অনুদৈর্ঘ্য অধ্যয়নের ক্ষেত্রে একটি এলোমেলো প্রভাব হিসাবে কখনও দেখিনি - এটি কি সাধারণ অভ্যাস?
ক্রিস

মিশ্র মডেলটিতে একটি ছোট্ট # বিষয়ের উপরে, তাদের এলোমেলো প্রভাবগুলি সংরক্ষণ করা যায় না, সুতরাং আপনাকে তাদের ডেটা থেকে জ্বালাতন করতে হবে, এবং যুক্তিযুক্তভাবে কেবলমাত্র গড়টি নির্ধারণের চেয়ে নির্ভরযোগ্যতার সাথে তুলনামূলকভাবে আরও বেশি ডেটা প্রয়োজন সব কিছু যখন পালন করা হয় তখন তারতম্য। এভাবে 42 বনাম 15-20 :) :) আমি মনে করি আমার অর্থ এলোমেলো opালু, কারণ আপনি কেবল আইটেম এফেক্ট হিসাবে চিহ্নিত আইডিতে সঠিক, অন্যথায় সেগুলি চিহ্নিত করা যাবেনা। অর্থনীতিবিদরা এলোমেলো প্রভাবগুলিতে যাইহোক, বিশ্বাস করেন না এবং প্রায় নির্দিষ্টভাবে যা তারা "স্থির প্রভাব", অর্থাত্-বিষয়গুলির অনুমানের মধ্যে প্রকাশ করেন publish
StasK

2
যে প্রশ্নের মোকাবেলা করা খুব কঠিন একটি প্রশ্নের খুব ভাল উত্তরের জন্য +1 @ স্টাসকে। আমি মনে করি যদিও অপ্রয়োজনীয় বিদ্রূপের একটি ঝাঁকুনি রয়েছে এবং আপনি নিজের উত্তরটি সম্পাদনা করার বিষয়টি বিবেচনা করতে পারেন যাতে ওপিকে আরও একটু শ্রদ্ধা করা যায়।
মাইকেল আর চেরনিক

@ মিশেল, আপনি সম্ভবত ঠিক বলেছেন যে এটি একটি মুডি উত্তর, এবং সম্ভবত অযথাই এটিও। ওপি তারা যে উত্তরটি শুনতে চেয়েছিল তা মেনে নিয়েছিল, তবে তিনি এই বিষয়ে একটি প্রস্তাব পেয়েছিলেন। আরও গুরুতর উত্তর হয় ভাল সিমুলেশন প্রমাণ বা উচ্চতর অর্ডার অ্যাসিম্পটোটিক বিশ্লেষণের দিকে ইঙ্গিত করবে, তবে দুর্ভাগ্যক্রমে আমি এই জাতীয় উল্লেখগুলি সম্পর্কে অবগত নই।
স্থবির

3
এটি মূল্যবান বলে মনে করি, "42" ম্যাজিক সংখ্যাটি এলোমেলো প্রভাবগুলির ন্যায্যতার বিষয়ে নয়, তবে সীমাবদ্ধ আকারের সংশোধন (যেমন স্বাধীনতার কার্যকর ডিনোমিনেটর ডিগ্রি সম্পর্কে চিন্তা করা / কেনওয়ার্ড-রজার সংশোধন / অন্যান্য অনুরূপ পন্থা)।
বেন বলকার

7

আপনি একটি বায়সিয়ান মিশ্র মডেলও ব্যবহার করতে পারেন - সেই ক্ষেত্রে এলোমেলো প্রভাবগুলির অনুমানের অনিশ্চয়তা 95% পূর্বাভাসযোগ্য বিশ্বাসযোগ্য ব্যবধানগুলির গণনায় পুরোপুরি যত্ন নেওয়া হয়। উদাহরণস্বরূপ, নতুন আর প্যাকেজ brmsএবং ফাংশন brmএকটি lme4ঘন ঘন মেশানো মডেল থেকে একটি বায়সিয়ান একটিতে খুব সহজেই স্থানান্তরিত করার অনুমতি দেয় কারণ এতে অভিন্ন সিনট্যাক্স রয়েছে।


4

আমি মাত্র 6 টি স্তর সহ একটি এলোমেলো প্রভাব মডেল ব্যবহার করব না। --স্তরের র্যান্ডম এফেক্ট ব্যবহার করে এমন মডেলগুলি অনেক সময় অনেক পরিসংখ্যানমূলক প্রোগ্রাম ব্যবহার করে চালানো যেতে পারে এবং কখনও কখনও নিরপেক্ষ অনুমানও দিতে পারে তবে:

  1. আমি মনে করি পরিসংখ্যান সম্প্রদায়ের মধ্যে একটি নির্বিচারে .ক্যমত্য আছে যে 10-20 সর্বনিম্ন সংখ্যা number আপনি যদি নিজের গবেষণা প্রকাশ করতে চান তবে আপনাকে পরিসংখ্যান পর্যালোচনা ছাড়াই একটি জার্নাল সন্ধানের পরামর্শ দেওয়া হবে (বা মোটামুটি পরিশীলিত ভাষা ব্যবহার করে আপনার সিদ্ধান্তকে ন্যায্যতা প্রমাণ করতে সক্ষম হবেন)।
  2. খুব কম ক্লাস্টার দিয়ে, ক্লাস্টারের বৈচিত্রের মধ্যে খুব কম অনুমান করা যায়। ক্লাস্টারের বৈকল্পিকের মধ্যে দুর্বল অনুমানটি সাধারণত আগ্রহের সহগের স্ট্যান্ডার্ড ত্রুটির দুর্বল অনুমানে অনুবাদ করে। (র্যান্ডম এফেক্টস মডেলগুলি তাত্ত্বিকভাবে অসীমের দিকে যাওয়া ক্লাস্টারের সংখ্যার উপর নির্ভর করে)।
  3. প্রায়শই মডেলগুলি কেবল রূপান্তর করে না। আপনি কি আপনার মডেল চালানোর চেষ্টা করেছেন? মডেলগুলি রূপান্তরিত করে যে বিষয়গুলিতে আমি কেবল 12-16 টি পদক্ষেপ নিয়ে অবাক হয়েছি। যখন আমি রূপান্তর করতে এই ধরণের মডেলটি অর্জন করতে পেরেছি তখন আমার প্রতি ক্লাস্টারে শত শত পরিমাপ।

এই সমস্যাটি ক্ষেত্রের বেশিরভাগ মানক পাঠ্যপুস্তকে সম্বোধন করা হয় এবং আপনি আপনার প্রশ্নে তাদের সমাধান করেছেন। আমি মনে করি না যে আমি আপনাকে কোনও নতুন তথ্য দিচ্ছি।


এটি কি এর প্রযুক্তিগত সামগ্রী সম্পর্কিত কোনও কারণে ভোট দেওয়া হয়েছিল?
এন ব্রাউয়ার 21'15

আপনি কোন ধরণের ডেটা নিয়ে কাজ করছেন? আমি নিশ্চিত না যে আপনি কেন শুনে অবাক হয়েছেন যে মডেলটি পৃথকভাবে 12-16 টি ব্যবস্থার সাথে রূপান্তর করবে। ফলস্বরূপ মডেলগুলিতে পক্ষপাতিত্ব সম্পর্কে আমি মন্তব্য করতে পারি না, তবে lme4মিশ্র মডেলগুলিতে রূপান্তর নিয়ে আমার কখনও সমস্যা হয়নি এবং আমি প্রায়শই ওপি হিসাবে অনুরূপ নমুনা আকারে চালিত করি (আমি জীববিজ্ঞানের ডেটাসেটের সাথেও কাজ করছি)।
আরটিবিকার্ড

1

মূল প্রশ্নটি থেকে অনেক দিন হয়েছে তবে আমি ভেবেছিলাম মডেল নির্বাচনের ক্ষেত্রে আমি কয়েকটি পয়েন্ট যুক্ত করতে পারি।

1 - যতক্ষণ না মডেলটি চিহ্নিত হয় (যেমন আপনার প্যারামিটার স্পেসে স্বাধীনতার ডিগ্রি রয়েছে) আপনি মডেলটিকে ফিট করার জন্য ট্রাই করতে সক্ষম হবেন। অপ্টিমাইজেশন পদ্ধতির উপর নির্ভর করে মডেল রূপান্তর করতে পারে বা নাও পারে। যে কোনও ক্ষেত্রে আমি 1 বা 2 এর বেশি এলোমেলো প্রভাব এবং অবশ্যই 1 টিরও বেশি ক্রস লেভেল ইন্টারঅ্যাকশন অন্তর্ভুক্ত করার চেষ্টা করব না। এখানে উপস্থাপিত সমস্যার নির্দিষ্ট ক্ষেত্রে যদি আমরা টিকটিকি নির্দিষ্ট বৈশিষ্ট্যগুলির মধ্যে (যেমন বয়স, আকার, ইত্যাদি) এবং চিকিত্সা / পরিমাপের বৈশিষ্ট্যগুলির গ্রুপের আকার 6 এর মধ্যে একটি মিথস্ক্রিয়া সন্দেহ করি তবে সুনির্দিষ্ট পর্যায়ে অনুমান করা যথেষ্ট নাও হতে পারে।

2 - উত্তর দুটি উল্লেখ হিসাবে, রূপান্তর একটি সমস্যা হতে পারে। তবে আমার অভিজ্ঞতা হ'ল যখন পরিমাপের সমস্যাগুলির কারণে সামাজিক বিজ্ঞানের ডেটাগুলিতে বিশাল কনভার্জেনশন সমস্যা রয়েছে, জীবন বিজ্ঞান এবং বিশেষত জৈব-রাসায়নিক পুনরাবৃত্তি ব্যবস্থাগুলিতে অনেক ছোট স্ট্যান্ডার্ড ত্রুটি রয়েছে। এটি সমস্ত ডেটা উত্পন্নকরণের প্রক্রিয়ার উপর নির্ভর করে। সামাজিক এবং অর্থনৈতিক তথ্যতে আমাদের বিমূর্ততার বিভিন্ন স্তরে কাজ করতে হবে। জৈবিক এবং রাসায়নিক এবং খুব অবশ্যই জ্যোতির্বিদ্যা সংক্রান্ত তথ্য পরিমাপ ত্রুটি একটি সমস্যা কম হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.