নেতিবাচক-দ্বিপদী GLM বনাম গণনা ডেটার জন্য লগ-ট্রান্সফর্মিং: প্রকার I ত্রুটির হার বৃদ্ধি পেয়েছে


18

আপনারা কেউ কেউ হয়ত এই সুন্দর কাগজটি পড়েছেন:

ও'হারা আরবি, কোটজে ডিজে (২০১০) গণনা ডেটা লগ-রূপান্তর করবেন না। বাস্তুশাস্ত্র এবং বিবর্তন পদ্ধতিসমূহ 1: 118–122। Klick

আমার গবেষণার ক্ষেত্রে (ইকোটক্সিকোলজি) আমরা খারাপ প্রতিলিপিযুক্ত পরীক্ষাগুলি নিয়ে কাজ করছি এবং জিএলএম ব্যাপকভাবে ব্যবহৃত হয় না। সুতরাং আমি ও'হারা ও কোটজে (২০১০) এর মতো অনুরূপ সিমুলেশন করেছি, তবে বাস্তুতন্ত্রিক তথ্য নকল করেছি।

পাওয়ার সিমুলেশন :

আমি একটি কন্ট্রোল গ্রুপ ( ) এবং 5 টি ট্রিটমেন্ট গ্রুপ ( ) দিয়ে ফ্যাক্টরিয়াল ডিজাইন থেকে ডেটা সিমুলেটেড করেছি । চিকিত্সা 1 এর প্রাচুর্য নিয়ন্ত্রণের মতো ছিল ( ), 2-5 চিকিত্সায় প্রাচুর্যতা নিয়ন্ত্রণের প্রাচুর্যের অর্ধেক ছিল ( )। সিমুলেশনগুলির জন্য আমি নমুনার আকার (3,6,9,12) এবং নিয়ন্ত্রণ গোষ্ঠীতে প্রচুর পরিমাণে (2, 4, 8, ..., 1024) আলাদা করেছিলাম। প্রচুর পরিমাণগুলি স্থির বিস্তারের প্যারামিটার ( ) সহ একটি নেতিবাচক দ্বিপদী বিতরণ থেকে আঁকা হয়েছিল । নেতিবাচক দ্বিপদী জিএলএম এবং গাউসিয়ান জিএলএম + লগ-ট্রান্সফর্মড ডেটা ব্যবহার করে 100 টি ডেটাসেট তৈরি ও বিশ্লেষণ করা হয়েছিল।μ 1 - 5μcμ15μ 2 - 5 = 0.5 μ c θ = 3.91μ1=μcμ25=0.5μcθ=3.91

ফলাফল প্রত্যাশার মতো: জিএলএমের আরও বেশি ক্ষমতা থাকে, বিশেষত যখন অনেক প্রাণীর নমুনা ছিল না। এখানে চিত্র বর্ণনা লিখুন কোড এখানে।

টাইপ আই ত্রুটি :

এরপরে আমি টাইপ ওয়ান ত্রুটির দিকে তাকালাম। উপরের মতো সিমুলেশনগুলি করা হয়েছিল, তবে সমস্ত গ্রুপের সমান প্রাচুর্য ছিল ( )।μc=μ15

তবে ফলাফল প্রত্যাশার মতো নয়: এখানে চিত্র বর্ণনা লিখুন নেতিবাচক দ্বিপদী জিএলএম এলএম + রূপান্তরের তুলনায় বৃহত্তর টাইপ -1 ত্রুটি দেখিয়েছে। প্রত্যাশা হিসাবে পার্থক্যটি ক্রমবর্ধমান নমুনার আকারের সাথে অদৃশ্য হয়ে গেছে। কোড এখানে।

প্রশ্ন:

এলএম + ট্রান্সফর্মেশনের সাথে তুলনা করে কেন সেখানে প্রকার -1 ত্রুটি বৃদ্ধি পেয়েছে?

আমাদের যদি দুর্বল ডেটা থাকে (ছোট নমুনার আকার, কম প্রাচুর্য (অনেকগুলি শূন্য)), তাহলে কি আমাদের তখন lm + রূপান্তর ব্যবহার করা উচিত? ছোট নমুনা আকার (চিকিত্সার প্রতি 2-4) এই ধরনের পরীক্ষাগুলির জন্য সাধারণ এবং সহজেই বাড়ানো যায় না।

যদিও, নেং। বিন। জিএলএম এই ডেটার জন্য উপযুক্ত হিসাবে ন্যায়সঙ্গত হতে পারে, lm + রূপান্তর আমাদের প্রকার 1 ত্রুটি থেকে রোধ করতে পারে।


1
আপনার মূল প্রশ্নের উত্তর নয়, তবে পাঠকদের জন্য লক্ষ্য রাখার মতো কিছু: আপনি যদি দুটি পদ্ধতির জন্য প্রকৃত টাইপ আই ত্রুটিটিকে সমতুল্য না করেন তবে ক্ষমতার তুলনা করা অর্থযুক্ত নয়; আমি সর্বদা ক্ষুদ্রতরটির জন্য শক্তিকে উচ্চতর করতে পারি (এই ক্ষেত্রে লগগুলি নিন এবং সাধারণ ধরণের ফিট করুন) এর ধরণের আই ত্রুটিটি তুলে ধরে। অন্যদিকে, আপনি যদি নির্দিষ্ট পরিস্থিতি নির্দিষ্ট করেন (নমুনা আকার, প্রাচুর্য), আপনি টাইপ আই ত্রুটি হার পেতে পারেন (উদাহরণস্বরূপ সিমুলেশন দ্বারা), এবং তাই পছন্দসই ধরণের I ত্রুটি হার অর্জনের জন্য কোন নামমাত্র হারটি পরীক্ষা করতে হবে তা নিয়ে কাজ করুন সুতরাং তাদের শক্তি তুলনাযোগ্য হয়ে ওঠে।
গ্লেন_বি -রিনস্টেট মনিকা

আপনার প্লটের ওয়াই-অক্ষের মানগুলি কি 100 ডেটা সেট জুড়ে গড় হয়?
শ্যাডটলকার

আমার মন্তব্যটি আমার স্পষ্ট করা উচিত: যে ক্ষেত্রে পরিসংখ্যান সহজাতভাবে বিযুক্ত হয় তবে আপনার ক্ষেত্রে টাইপ আই ত্রুটির হারের নিখুঁত নিয়ন্ত্রণ নেই তবে আপনি সাধারণত টাইপ আই ত্রুটির হারগুলি বেশ কাছাকাছি করতে পারেন। যে পরিস্থিতিতে আপনি তাদের তুলনীয় হওয়ার জন্য একত্রে খুব কাছাকাছি পেতে পারেন না, তাদের তুলনাযোগ্য করার একমাত্র উপায়টি এলোমেলোভাবে পরীক্ষাগুলি দিয়ে।
গ্লেন_বি -রিনস্টেট মনিকা

@ এসএসডেকট্রোল: না, এটি কেবলমাত্র ডেটাসেটের অনুপাত (100 এর মধ্যে) যেখানে পি <α
EDi

1
দুটি বিষয় রয়েছে: (i) এটি হল যে অনুমানগুলি অ্যাসিপটোটিক তবে অসীম নয়, সুতরাং অনুমানটি কেবল এটিই, একটি আনুমানিক - এটি বিবেচনা বা বিবেচ্যতা ছিল কিনা তা একটি বিষয় হবে এবং তা তাত্পর্যপূর্ণ স্তরের দিকে নিয়ে যাবে নামমাত্র ব্যতীত অন্যটি (তবে এটি যদি ধারাবাহিকভাবে থাকে তবে এটি এমন কিছু যা আপনার জন্য সামঞ্জস্য করতে পারে); (ii) বিচক্ষণতার বিষয়টি রয়েছে, যদি আপনি এটির জন্য সামঞ্জস্য করেন তবে আপনাকে সঠিক তাৎপর্য স্তর পেতে বাধা দেয়। n
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


17

এটি একটি অত্যন্ত আকর্ষণীয় সমস্যা। আমি আপনার কোড পর্যালোচনা করেছি এবং অবিলম্বে সুস্পষ্ট টাইপ খুঁজে পাচ্ছি না।

θθdrop1

রৈখিক মডেলগুলির বেশিরভাগ পরীক্ষার জন্য আপনাকে নাল অনুমানের অধীনে মডেলটির পুনঃসংযোগের প্রয়োজন হয় না। এর কারণ আপনি একাই বিকল্প অনুমানের অধীনে প্যারামিটারের অনুমান এবং আনুমানিক সমবায় ব্যবহার করে জ্যামিতিক slাল (স্কোর পরীক্ষা) এবং আনুমানিক প্রস্থ (ওয়াল্ড পরীক্ষা) গণনা করতে পারেন।

যেহেতু নেতিবাচক দ্বিপদী লিনিয়ার নয়, আমি মনে করি আপনার একটি নাল মডেল ফিট করতে হবে।

সম্পাদনা করুন:

আমি কোডটি সম্পাদনা করেছি এবং নিম্নলিখিতগুলি পেয়েছি: এখানে চিত্র বর্ণনা লিখুন

সম্পাদিত কোডটি এখানে: https://github.com/aomidpanah/simulations/blob/master/negativeBinomialML.r


কিন্তু আমি মনে করি যে drop1() করে অভ্যন্তরীণভাবে পুনরায় মাপসই নাল মডেল ...
বেন Bolker

4
glm.nbθdrop1logLikgetS3method('logLik', 'negbin'

আবার +1 করতে চাই তবে আমি পারব না। খুশী হলাম।
বেন বলকার 18

ধন্যবাদ! আমি শুধু উভয় কোড লাগছিল drop1()এবং lrtest()। আপনি ঠিক বলেছেন, drop1.glmব্যবহারগুলি glm.fitযা ভুল বিচ্যুতি দেয়। সচেতন যে আমরা ব্যবহার করতে পারবেন না ছিল না drop1()সঙ্গে glm.nb()!
EDi

তাহলে সাধারণ স্কোর এবং ওয়াল্ড পরীক্ষাগুলি নেতিবাচক দ্বিপদী মডেলটিতে অবৈধ?
শ্যাডটলকার

8

ও'হারা এবং কোটজির কাগজ (বাস্তুশাস্ত্র ও বিবর্তনের পদ্ধতিসমূহ 1: 118–122) আলোচনার জন্য ভাল সূচনা পয়েন্ট নয়। আমার সবচেয়ে গুরুতর উদ্বেগ হ'ল সংক্ষিপ্তসার 4 পয়েন্টে দাবি:

আমরা দেখতে পেয়েছি যে রূপান্তরগুলি খারাপভাবে সম্পাদন করেছে except । .. কোয়েস-পোইসন এবং নেতিবাচক দ্বিপদী মডেলগুলি ... [দেখানো] সামান্য পক্ষপাতিত্ব।

λθλ যে তদন্ত করা হয়, অত্যন্ত ইতিবাচক স্কিউ হয়। লাগানো সাধারণ বিতরণের মাধ্যমগুলি লগ (y + c) (সি অফসেট) এর স্কেলগুলিতে থাকে এবং E (লগ (y + c)] অনুমান করে y এই বিতরণটি প্রতিস্থাপনের তুলনায় প্রতিসমের চেয়ে অনেক বেশি কাছাকাছি ।

λ

নিম্নলিখিত আর কোডটি পয়েন্টটি তুলে ধরে:

x <- rnbinom(10000, 0.5, mu=2)  
## NB: Above, this 'mu' was our lambda. Confusing, is'nt it?
log(mean(x+1))
[1] 1.09631
log(2+1)  ## Check that this is about right
[1] 1.098612

mean(log(x+1))
[1] 0.7317908

বা চেষ্টা করুন

log(mean(x+.5))
[1] 0.9135269
mean(log(x+.5))
[1] 0.3270837

যে স্কেলটির উপর প্যারামিটারগুলি অনুমান করা হয় তা একটি দুর্দান্ত ব্যাপার!

λ মান 10 বা ক্রম হয় তবে মডেলিং লগের জন্য (y + 1) মানক সাধারণ তত্ত্বটি ব্যবহার করে।

নোট করুন যে স্ট্যান্ডার্ড ডায়াগনস্টিকস লগ (x + সি) এর স্কেলে আরও ভাল কাজ করে। গ এর পছন্দটি খুব বেশি গুরুত্ব পাবে না; প্রায়শই 0.5 বা 1.0 বোঝায়। এছাড়াও এটি বক্স-কক্স রূপান্তরগুলি, বা বক্স-কক্সের ইয়েও-জনসন রূপটি অনুসন্ধানের জন্য আরও ভাল সূচনা পয়েন্ট। [ইয়েও, আই। এবং জনসন, আর। (2000)]। আর এর গাড়ি প্যাকেজে পাওয়ার ট্রান্সফর্ম () এর জন্য সহায়তা পৃষ্ঠাটি আরও দেখুন। আর-র গ্যাম্লাস প্যাকেজটি negativeণাত্মক দ্বিপদী প্রকার I (সাধারণ বিভিন্ন) বা II, বা অন্যান্য বিতরণগুলিকে ফিট করতে পারে যা 0 (= লগ, অর্থাত, লগ লিঙ্ক) বা আরও বেশি সংখ্যার পাওয়ার ট্রান্সফর্ম লিঙ্কগুলির সাথে বিচ্ছুরণের গড় হিসাবে মডেল করে । ফিটস সবসময় একত্রিত হতে পারে না।

উদাহরণ: মৃত্যুর বনাম বেস ড্যামেজ ডেটা মার্কিন যুক্তরাষ্ট্রের মূল ভূখণ্ডে পৌঁছে যাওয়া আটলান্টিক হারিকেনের জন্য। আর এর জন্য ডিএএজি প্যাকেজটির সাম্প্রতিক প্রকাশ থেকে ডেটা (নাম হারিকনাম ) পাওয়া যায়। ডেটার সহায়তা পৃষ্ঠায় বিশদ রয়েছে।

দৃust় লগলাইনার বনাম নেতিবাচক দ্বিপদী ফিট

গ্রাফটি গ্রাফের y- অক্ষের জন্য ব্যবহৃত লগের (গণনা + 1) স্কেলটিতে লগ লিঙ্কের সাথে নেতিবাচক দ্বিপদী ফিটকে পরিবর্তিত করে একটি শক্তিশালী লিনিয়ার মডেল ফিট ব্যবহার করে প্রাপ্ত একটি উপযুক্ত লাইনের সাথে তুলনা করে fit (নোট করুন যে একই লক্ষে নেতিবাচক দ্বিপদী ফিট থেকে পয়েন্টগুলি এবং লাগানো "লাইন" প্রদর্শন করার জন্য ধনাত্মক সি সহ একটি লগ (গণনা + সি) স্কেলের অনুরূপ কিছু ব্যবহার করতে হবে)) বড় বায়াসটি নোট করুন লগ স্কেল নেতিবাচক দ্বিপদী ফিট জন্য সুস্পষ্ট। শক্তিশালী রৈখিক মডেল ফিট এই স্কেলগুলিতে অনেক কম পক্ষপাতী, যদি কেউ গণনার জন্য নেতিবাচক দ্বিপদী বিতরণ ধরে নেয়। একটি লিনিয়ার মডেল ফিট শাস্ত্রীয় স্বাভাবিক তত্ত্ব অনুমানের অধীনে পক্ষপাতহীন হবে। আমি প্রথম যখন তৈরি করলাম তখন উপরের গ্রাফটি মূলত কী ছিল তা অবাক করে দিয়েছিলাম! একটি বক্ররেখা ডেটা আরও ভাল ফিট করতে পারে, তবে পার্থক্যটি পরিসংখ্যানগত পরিবর্তনশীলতার স্বাভাবিক মানের সীমার মধ্যে। শক্তিশালী রৈখিক মডেল ফিট স্কেলের নিম্ন প্রান্তে গণনার জন্য একটি দুর্বল কাজ করে।

দ্রষ্টব্য --- আরএনএ-সেক ডেটার সাথে অধ্যয়ন: জিনের এক্সপ্রেশন পরীক্ষায় গণনা সম্পর্কিত তথ্য বিশ্লেষণের জন্য দুটি শৈলীর মডেলের তুলনা আগ্রহী। নিম্নলিখিত কাগজ লগ সঙ্গে কাজ, একটি শক্তসমর্থ রৈখিক মডেল ব্যবহার তুলনা (1 COUNT +), নেতিবাচক দ্বিপদ ফিট ব্যবহার (Bioconductor প্যাকেজের মধ্যে হিসাবে edgeR )। প্রাথমিকভাবে মনে রাখা আরএনএ-সিক অ্যাপ্লিকেশনটিতে বেশিরভাগ গণনাগুলি যথেষ্ট পরিমাণে যথাযথভাবে ভারী লগ-লিনিয়ার মডেলটির পক্ষে খুব ভাল কাজ করে।

আইন, সিডব্লিউ, চেন, ওয়াই, শি, ডাব্লু, স্মিথ, জিকে (2014)। ভুম: আরএনএ-সেক রিডের গণনার জন্য যথার্থ ওজন আনলক রৈখিক মডেল বিশ্লেষণ সরঞ্জামগুলি। জিনোম বায়োলজি 15, আর 29। http://genomebiology.com/2014/15/2/R29

এনবি সাম্প্রতিক কাগজও:

শর্চ এনজে, শোফিল্ড পি, গিয়েরিলস্কি এম, কোল সি, শেরস্টনিভ এ, সিং ভি, র্রোবেল এন, ঘারবি কে, সিম্পসন জিজি, ওভেন-হিউজ টি, ব্ল্যাকস্টার এম, বার্টন জিজে (২০১))। আরএনএ-সিক পরীক্ষায় কতটি জৈবিক প্রতিরূপ প্রয়োজন এবং আপনার কোন ডিফারেনশিয়াল এক্সপ্রেশন সরঞ্জামটি ব্যবহার করা উচিত? আরএনএ http://www.rnajorter.org/cgi/doi/10.1261/rna.053959.115

এটা মজার যে রৈখিক মডেল ব্যবহার তড়কা limma প্যাকেজ (মত edgeR , WEHI গ্রুপ থেকে) পর্যন্ত অত্যন্ত ভাল, দাঁড়াও, অনেক প্রতিলিপি সঙ্গে ফলাফলে আপেক্ষিক (পক্ষপাত সামান্য প্রমাণ দেখাচ্ছে অর্থে) প্রতিলিপি সংখ্যা যেমন হ্রাস পেয়েছে।

উপরের গ্রাফের জন্য আর কোড:

library(latticeExtra, quietly=TRUE)
hurricNamed <- DAAG::hurricNamed
ytxt <- c(0, 1, 3, 10, 30, 100, 300, 1000)
xtxt <- c(1,10, 100, 1000, 10000, 100000, 1000000 )
funy <- function(y)log(y+1)
gph <- xyplot(funy(deaths) ~ log(BaseDam2014), groups= mf, data=hurricNamed,
   scales=list(y=list(at=funy(ytxt), labels=paste(ytxt)),
           x=list(at=log(xtxt), labels=paste(xtxt))),
   xlab = "Base Damage (millions of 2014 US$); log transformed scale",
   ylab="Deaths; log transformed; offset=1",
   auto.key=list(columns=2),
   par.settings=simpleTheme(col=c("red","blue"), pch=16))
gph2 <- gph + layer(panel.text(x[c(13,84)], y[c(13,84)],
           labels=hurricNamed[c(13,84), "Name"], pos=3,
           col="gray30", cex=0.8),
        panel.text(x[c(13,84)], y[c(13,84)],
           labels=hurricNamed[c(13,84), "Year"], pos=1, 
           col="gray30", cex=0.8))
ab <- coef(MASS::rlm(funy(deaths) ~ log(BaseDam2014), data=hurricNamed))

gph3 <- gph2+layer(panel.abline(ab[1], b=ab[2], col="gray30", alpha=0.4))
## 100 points that are evenly spread on a log(BaseDam2014) scale
x <- with(hurricNamed, pretty(log(BaseDam2014),100))
df <- data.frame(BaseDam2014=exp(x[x>0])) 
hurr.nb <- MASS::glm.nb(deaths~log(BaseDam2014), data=hurricNamed[-c(13,84),])
df[,'hatnb'] <- funy(predict(hurr.nb, newdata=df, type='response'))
gph3 + latticeExtra::layer(data=df,
       panel.lines(log(BaseDam2014), hatnb, lwd=2, lty=2, 
           alpha=0.5, col="gray30"))    

2
আপনার মন্তব্যের জন্য ধন্যবাদ মিঃ মাইনাডোনাল্ড গত দুই বছরে আরও কিছু কাগজপত্র ছিল (হাইপোথিসিস টেস্টিংয়ের দিকে আরও ফোকাস, তারপরে পক্ষপাতিত্ব): আইভেস 2015, ওয়ার্টন এট আল 2016, জাজেস 2015.
EDi

সম্ভবত এটি আলোচনার জন্য একটি ভাল সূচনা পয়েন্ট , এমনকি যদি এই নির্দিষ্ট পয়েন্টটি সমস্যাযুক্ত হয়? (আমি আরও সাধারণভাবে তর্ক করব যে এটি অত্যধিক পক্ষপাতিত্বের দিকে মনোনিবেশ না করার কারণ, বরং আরএমএসই এর মতো কিছু বিবেচনা করার জন্য ... [অস্বীকৃতি, আমি এই কাগজগুলি ইদানীং পুনরায় পড়িনি, এবং আমি কেবলমাত্র বিমূর্তটি পড়েছি দ্য ওয়ার্টন পেপার ...]
বেন বলকার

1
ওয়ার্টন এট আল এর (২০১ 2016) পয়েন্ট, যে ডেটা বৈশিষ্ট্যগুলি পছন্দের ভিত্তি হওয়া উচিত, তা অত্যন্ত গুরুত্বপূর্ণ। কোয়ান্টাইল-কোয়ান্টাইল প্লটগুলি ফিটগুলির বিশদটি তুলনা করার একটি ভাল উপায়। বিশেষত এক বা অন্য বা উভয় চূড়ান্তভাবে ফিট কিছু অ্যাপ্লিকেশনগুলির জন্য গুরুত্বপূর্ণ হতে পারে। শূন্য-স্ফীত বা বাধা মডেলগুলি শূন্যের গুণগুলি সঠিকভাবে পাওয়ার জন্য একটি কার্যকর পরিশোধন হতে পারে। উচ্চতর চরম সময়ে, আলোচনার অধীনে থাকা যে কোনও মডেলকে মারাত্মকভাবে আপস করা যেতে পারে। ওয়ার্টন এট অল ডু, প্রশংসনীয়ভাবে এর একটি উদাহরণ আছে। আমি পরিবেশগত ডেটা সেটগুলির বিস্তৃত পরিসর জুড়ে তুলনা দেখতে চাই।
জন মেইনডোনাল্ড

তবে বাস্তুসংস্থানীয় ডেটাসেটে কি নীচের অংশে (= বিরল প্রজাতি) প্রজাতি আকর্ষণীয় নয়? কিছু বাস্তুসংস্থানীয় ডেটাসেটগুলি সংকলন এবং তুলনা করা খুব কঠিন হওয়া উচিত নয় ...
EDi

প্রকৃতপক্ষে, এটি ক্ষতিগ্রস্থ শ্রেণীর নিম্ন প্রান্তের জন্য যা theণাত্মক দ্বিপদী মডেল বলে মনে হয়, হারিকেনের মৃত্যুর ডেটার জন্য কমপক্ষে সন্তোষজনক। আর এর গ্যাম্লাস প্যাকেজটিতে একটি ফাংশন রয়েছে যা উপস্থাপিত ডিস্ট্রিবিউশনের সেন্টিমিটিগুলিকে উপাত্তের সেন্টটিলেসের সাথে তুলনা করা সহজ করে তোলে:
জন মায়ানডোনাল্ড

6

মূল পোস্টটি টনি আইভেসের কাগজগুলি প্রতিফলিত করে: আইভেস (2015) । এটি স্পষ্ট যে তাত্পর্য পরীক্ষার প্যারামিটার অনুমানের জন্য বিভিন্ন ফলাফল দেয়।

জন মাইন্ডোনাল্ড ব্যাখ্যা করেছেন কেন অনুমান পক্ষপাতদুষ্ট, তবে পটভূমি সম্পর্কে তাঁর অজ্ঞতা বিরক্তিকর - তিনি আমাদের সমালোচনা করে যে আমরা যে সমস্ত পদ্ধতির ত্রুটিযুক্ত তা ত্রুটিযুক্ত বলে আমাদের সমালোচনা করে। অনেক বাস্তুশাস্ত্র অন্ধভাবে লগ রূপান্তর করেন, এবং আমরা এটি করে সমস্যাগুলি চিহ্নিত করার চেষ্টা করছিলাম।

এখানে আরও অযৌক্তিক আলোচনা আছে: ওয়ার্টন (২০১ 2016)

আইভেস, এআর (২০১৫), রিগ্রেশন সহগের তাত্পর্য পরীক্ষা করার জন্য, এগিয়ে যান এবং গণনা ডেটা লগ-রূপান্তর করুন। পদ্ধতি ইকোল ইভোল, 6: 828–835। ডোই: 10,1111 / 2041-210X.12386

ওয়ার্টন, ডিআই, লায়োনস, এম।, স্টোক্লোসা, জে এবং আইভেস, এআর (২০১)), গণনার উপাত্তের জন্য এলএম বা জিএলএম পরীক্ষা বাছাই করার সময় তিনটি বিষয় বিবেচনা করতে হবে। পদ্ধতি ইকোল ইভোল। ডোই: 10,1111 / 2041-210X.12552


সিভিতে আপনাকে স্বাগতম। সহায়ক হওয়ার সময়, এই প্রতিক্রিয়াটি বেশিরভাগ "লিঙ্ক-কেবল" টাইপের উত্তর। লিঙ্কগুলি পরিবর্তন এবং ডি-লিঙ্ক করে। আপনি যদি প্রতিটির মূল পয়েন্টগুলি বিস্তারিতভাবে বর্ণনা করতে চান তবে এটি সিভিতে আরও সহায়ক হবে।
মাইক হান্টার

উত্তরের জন্য ধন্যবাদ. আমি মনে করি ওয়ার্টন এট আল এর কাগজ। মুদ্রা আলোচনার বর্তমান অবস্থা।
EDi

ধন্যবাদ ও স্বাগতম! আমি রেফারেন্সগুলি পুরোপুরি যুক্ত করার স্বাধীনতা নিয়েছি।
স্কোর্টচি - মনিকা পুনরায় ইনস্টল করুন

1
দয়া করে নতুন রেফারেন্সগুলিতে মূল পয়েন্টগুলি রূপরেখার করুন এবং এটি যেখানে অর্থবোধ করে সেখানে মূল প্রশ্নটির সাথেও সম্পর্কিত করুন। এটি একটি মূল্যবান অবদান তবে বর্তমানে প্রশ্নের উত্তরের চেয়ে অন্য উত্তরের একটি মন্তব্যের নিকটেই রয়েছে ( উদাহরণস্বরূপ লিঙ্কগুলির প্রসঙ্গটি সরবরাহ করা উচিত )। প্রসঙ্গের কয়েকটি অতিরিক্ত বাক্য পোস্টকে যথেষ্ট পরিমাণে সহায়তা করবে।
গ্লেন_বি -রিনস্টেট মনিকা

3
বিশেষতঃ ওহারা ও কোটজির কাগজে আমার মন্তব্যগুলির ঠিকানা পয়েন্ট 4: "আমরা দেখতে পেলাম যে রূপান্তরগুলি খারাপভাবে সম্পাদন করেছে, বাদে ... .. কোয়াসি-পোইসন এবং নেতিবাচক দ্বিপদী মডেলগুলি [[দেখানো হয়েছে]] সামান্য পক্ষপাতিত্ব।" সিমুলেশনগুলি হ'ল y (স্ক্রিন) এর প্রত্যাশিত গড়ের মধ্যে তুলনা সম্পর্কে একটি মন্তব্য, লগের স্কেল (y + c) এর প্রত্যাশিত গড় বনাম, খুব ইতিবাচকভাবে স্কিউ বিতরণের জন্য, এর চেয়ে বেশি কিছু নয়। নেগেটিভ দ্বিপদী প্যারামিটার ল্যাম্বদাটি y এর স্কেলে পক্ষপাতহীন, যখন লগ-নরমাল গড়টি নিরপেক্ষ (সেই স্কেলটিতে স্বাভাবিকতার অধীনে) একটি স্কেলে লগ (y + c) হয়।
জন মায়ানডোনাল্ড
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.