@ ডিক্রানমারসুপিয়াল অবশ্যই সঠিক, তবে এটি আমার কাছে ঘটেছে যে তাঁর বক্তব্যটি বর্ণনা করা ভাল লাগবে , বিশেষত যেহেতু এই উদ্বেগটি প্রায়শই দেখা দেয়। বিশেষত, পি-মানগুলি সঠিক হওয়ার জন্য একটি রিগ্রেশন মডেলের অবশিষ্টাংশগুলি সাধারণত বিতরণ করা উচিত। তবে, অবশিষ্টাংশগুলি সাধারণত বিতরণ করা হলেও, এটি গ্যারান্টি দেয় না যে হবে (এমন নয় যে এটি গুরুত্বপূর্ণ ...); এটি বিতরণের উপর নির্ভর করে । এক্সওয়াইএক্স
আসুন একটি সহজ উদাহরণ গ্রহণ করুন (যা আমি তৈরি করছি)। ধরা যাক আমরা বিচ্ছিন্ন সিস্টোলিক উচ্চ রক্তচাপের জন্য একটি ড্রাগ পরীক্ষা করছি (যেমন, শীর্ষ রক্তচাপের সংখ্যাটি খুব বেশি)। আসুন আরও শর্ত দিন যে সিস্টোলিক বিপি সাধারণত আমাদের রোগীর জনসংখ্যার মধ্যে 160০ এর 160 এবং এসডি এর মাধ্যমে বিতরণ করা হয় এবং রোগীরা প্রতিদিন যে ওষুধের প্রতিটি মিলিগ্রাম গ্রহণ করেন, সিস্টোলিক বিপি 1 মিমিএইচজি কম হয়। অন্য কথায়, এর আসল মান 160, এবং -1 এবং সত্য তথ্য উত্পন্নকরণ হ'ল:
β 1 বি পি এস ওয়াই এস = 160 - 1 × প্রতিদিনের ওষুধের পরিমাণ + ε εβ0β1এক্স
বি পিs yগুলি= 160 - 1 × প্রতিদিনের ওষুধের ডোজ + ε εযেখানে ε ∼ এন( 0 , 9 )
আমাদের কল্পিত গবেষণায়, 300 জন রোগীকে এলোমেলোভাবে 0mg (একটি প্লেসবো), 20mg বা 40mg এই নতুন ওষুধের জন্য প্রতিদিন নির্ধারিত করা হয়। (লক্ষ্য করুন যে সাধারণত বিতরণ করা হয় না)) তারপরে, ড্রাগ কার্যকর হওয়ার জন্য পর্যাপ্ত সময়ের পরে, আমাদের ডেটাগুলি দেখতে দেখতে পারে:
এক্স
(আমি ডোজগুলিকে বিভক্ত করেছিলাম যাতে পয়েন্টগুলি এতটা ওভারল্যাপ না হয় যে তাদের পার্থক্য করা শক্ত ছিল।) এখন, এর বিতরণ (যেমন এটি প্রান্তিক / মূল বিতরণ) এবং অবশিষ্টাংশগুলি পরীক্ষা করে দেখুন: ওয়াই
কিউকিউ প্লটগুলি আমাদের দেখায় যে দূরবর্তীভাবে স্বাভাবিক নয়, তবে অবশিষ্টাংশগুলি যথাযথভাবে স্বাভাবিক। কার্নেল ঘনত্ব প্লটগুলি বিতরণগুলির আরও স্বজ্ঞাতভাবে অ্যাক্সেসযোগ্য চিত্র দেয়। এটা পরিষ্কার যে হয় ত্রি-মোডাল , যেহেতু অবশিষ্টাংশ চেহারা একটি সাধারণ বন্টনের অনেক মত চেহারা অনুমিত হয়। ওয়াইওয়াইওয়াই
কিন্তু কি লাগানো রিগ্রেশন মডেল সম্পর্কে, অ-স্বাভাবিক প্রভাব কি & (কিন্তু স্বাভাবিক অবশিষ্টাংশ)? এই প্রশ্নের উত্তর দেওয়ার জন্য, আমাদের এইরকম পরিস্থিতিতে রিগ্রেশন মডেলের সাধারণ পারফরম্যান্স সম্পর্কে আমরা উদ্বিগ্ন হতে পারি তা নির্দিষ্ট করতে হবে। প্রথম ইস্যুটি হ'ল, বেটাগুলি কি গড়ে গড়ে? (অবশ্যই, তারা কিছু কাছাকাছি নেমে আসবে, কিন্তু দীর্ঘকালীন সময়ে, বিটাগুলির নমুনা বিতরণগুলি কি সত্যের মূল্যবোধকে কেন্দ্র করে?) এটি পক্ষপাতিত্বের প্রশ্ন । আরেকটি বিষয় হ'ল আমরা কি পাই-মানগুলিকে বিশ্বাস করতে পারি? এটি হ'ল, নাল অনুমানটি সত্য হলে,এক্স পি < .05 β 1ওয়াইএক্সপি < .05মাত্র ৫% সময়? এই জিনিসগুলি নির্ধারণ করার জন্য, আমরা উপরের ডেটা উত্পন্নকরণ প্রক্রিয়া এবং এমন একটি সমান্তরাল কেস থেকে ডেটা অনুকরণ করতে পারি যেখানে ড্রাগের কোনও প্রভাব নেই, প্রচুর পরিমাণে। তারপরে আমরা এর নমুনা বিতরণগুলি প্লট করতে এবং কেন্দ্র করে কিনা তা পরীক্ষা করে দেখতে এবং নাল ক্ষেত্রে সম্পর্কটি কতটা 'গুরুত্বপূর্ণ' ছিল তাও পরীক্ষা করতে পারি: β1
set.seed(123456789) # this make the simulation repeatable
b0 = 160; b1 = -1; b1_null = 0 # these are the true beta values
x = rep(c(0, 20, 40), each=100) # the (non-normal) drug dosages patients get
estimated.b1s = vector(length=10000) # these will store the simulation's results
estimated.b1ns = vector(length=10000)
null.p.values = vector(length=10000)
for(i in 1:10000){
residuals = rnorm(300, mean=0, sd=3)
y.works = b0 + b1*x + residuals
y.null = b0 + b1_null*x + residuals # everything is identical except b1
model.works = lm(y.works~x)
model.null = lm(y.null~x)
estimated.b1s[i] = coef(model.works)[2]
estimated.b1ns[i] = coef(model.null)[2]
null.p.values[i] = summary(model.null)$coefficients[2,4]
}
mean(estimated.b1s) # the sampling distributions are centered on the true values
[1] -1.000084
mean(estimated.b1ns)
[1] -8.43504e-05
mean(null.p.values<.05) # when the null is true, p<.05 5% of the time
[1] 0.0532
এই ফলাফলগুলি দেখায় যে সবকিছু ঠিকঠাক কাজ করে।
আমি অঙ্গভঙ্গির মাধ্যমে যেতে হবে না, কিন্তু যদি হয়েছে স্বাভাবিকভাবে, বিতরণ অন্যথায় একই সেটআপ সঙ্গে, মূল / প্রান্তিক বন্টন স্বাভাবিকভাবে বিতরণ করা হত মাত্র অবশিষ্টাংশ হিসাবে (সঙ্গে একটি বৃহত্তর এসডি যদিও)। আমি এর স্কিওড ডিস্ট্রিবিউশনের প্রভাবগুলিও বর্ণনা করিনি (যা এই প্রশ্নের পিছনে উত্সাহ ছিল), তবে @ ডিক্রানমারসুপিয়ালের বক্তব্য সেই ক্ষেত্রে ঠিক ততটাই বৈধ, এবং এটিও একইভাবে চিত্রিত করা যেতে পারে।ওয়াই এক্সএক্স ওয়াইএক্স