আমি এখন আরও ভালভাবে বুঝতে পারি যে আমাকে যাচাই করা বনাম তৈরি করা টি-টেস্টগুলি এবং সম্পর্কিত পি-মানগুলি সম্পর্কে চিন্তিত করেছিল। সন্ধান করা একটি আকর্ষণীয় যাত্রা হয়েছে, এবং পথে অনেক বিস্মিত হয়েছে। মাইকের অবদানের তদন্তের ফলে একটি অবাক হয়েছিল। এটি ব্যবহারিক পরামর্শের ক্ষেত্রে অপরিবর্তনীয়। তদুপরি, তিনি যা বলেছিলেন আমি কার্যত সমস্ত পরিসংখ্যানবিদদের বিশ্বাস করি বলে মনে করেন এবং এটির ব্যাক আপ করার জন্য তাঁর বেশ কয়েকটি আপোস রয়েছে। তবে তত্ত্বের অংশ হিসাবে এটি আক্ষরিক অর্থে সঠিক নয়। আমি পি-ভ্যালুগুলির সূত্রগুলি তৈরি করে এবং তারপরে উদাহরণগুলির দিকে কীভাবে সূত্রগুলি ব্যবহার করতে হয় সে সম্পর্কে সাবধানতার সাথে চিন্তা করে এটি আবিষ্কার করেছি। আমি প্রশিক্ষণ দ্বারা গণিতবিদ, এবং পাল্টা উদাহরণ একটি "গণিতবিদ এর পাল্টা উদাহরণ"। এটি ব্যবহারিক পরিসংখ্যানগুলির মধ্যে এমন কিছু নয় যা আপনি করতে পারেন, আমি যখন আমার আসল প্রশ্ন জিজ্ঞাসা করলাম তখন আমি কী ধরণের বিষয়টি অনুসন্ধান করার চেষ্টা করছিলাম।
এখানে আর-কোড যা প্রতি-উদাহরণ দেয়:
vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
X <- rnorm(vLength)
Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
Paired <- t.test(X,Y,var.equal=T,paired=T)
NotPaired <- t.test(X,Y,var.equal=T,paired=F)
c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))
নিম্নলিখিত বৈশিষ্ট্যগুলি নোট করুন: এক্স এবং ওয়াই হ'ল দুটি 10 টি টিপল যার পার্থক্য বিশাল এবং খুব ধ্রুবক। অনেক তাৎপর্যপূর্ণ পরিসংখ্যানের জন্য, পারস্পরিক সম্পর্ক 1.000 .... জোড়যুক্ত পরীক্ষার জন্য পি-মানটি জোড় পরীক্ষার জন্য পি-মানের চেয়ে 10 ^ 40 গুণ কম। সুতরাং এটি মাইকের অ্যাকাউন্টের সাথে স্ববিরোধী, শর্ত রয়েছে যে তার অ্যাকাউন্টটি আক্ষরিক, গণিতবিদ-শৈলীতে পড়ে। মাইকেল এর উত্তর সম্পর্কিত আমার উত্তর অংশ শেষ এখানে।
পিটারের উত্তরের দ্বারা উত্সাহিত চিন্তাগুলি এখানে। আমার মূল প্রশ্নটির আলোচনার সময়, আমি একটি মন্তব্যে অনুমান করেছিলাম যে পি-ভ্যালুগুলির দুটি বিশেষ বিতরণ যা পৃথক পৃথক বলে মনে হয় তা আসলে একই রকম। আমি এখন এটি প্রমাণ করতে পারি। এর চেয়ে গুরুত্বপূর্ণটি হ'ল প্রমাণটি পি-ভ্যালুর মৌলিক প্রকৃতিটি প্রকাশ করে, তাই এমন মৌলিক যে কোনও পাঠ (যা আমি পেরিয়ে এসেছি) তা ব্যাখ্যা করতে বিরত হয় না। হতে পারে সমস্ত পেশাদার পরিসংখ্যানবিদরা এই গোপন কথাটি জানেন তবে আমার কাছে পি-ভ্যালু সংজ্ঞাটি সর্বদা অদ্ভুত এবং কৃত্রিম বলে মনে হয়েছিল। পরিসংখ্যানবিদদের গোপনীয়তা দেওয়ার আগে, আমাকে প্রশ্নটি নির্দিষ্ট করে দিন।
n > 1এন2 ( এন - 1 )n - 1স্বাধীনতার মাত্রা. এই দুটি বিতরণ পৃথক, সুতরাং পৃথিবীতে কীভাবে পি-মানগুলির সম্পর্কিত বিতরণগুলি একই হতে পারে? আরও অনেক চিন্তাভাবনার পরেই আমি বুঝতে পারি যে আমার অনুমানের এই সুস্পষ্ট বরখাস্ততা খুব সহজ ছিল।
চ: ( 0 , ∞ ) → ( 0 , ∞ )[ 0 , 1 ]
পি = ∫∞টিচ( গুলি )ঘগুলি
চ( - ∞ , ∞ )[ 0 , ∞ )। আমি all সমস্ত বিশৃঙ্খলা বাদ দিই))
পরিসংখ্যানগুলিতে অন্যান্য মানক বিতরণের যে কোনওটির সাথে যুক্ত পি-মানটি খুঁজে পাওয়ার সময় ঠিক একই আলোচনা প্রযোজ্য। আবারও, যদি তথ্যগুলি এলোমেলোভাবে বিতরণ করা হয় (এবার কিছু আলাদা বিতরণ অনুসারে), তবে ফলাফলের p-মানগুলি একত্রে বিতরণ করা হবে[ 0 , 1 ]।
এটি কীভাবে আমাদের যুক্ত এবং আনকৃত টি-পরীক্ষার ক্ষেত্রে প্রযোজ্য? বিন্দুটি জোড়যুক্ত টি-টেস্টে রয়েছে, নমুনাগুলি স্বতন্ত্রভাবে এবং এলোমেলোভাবে বেছে নেওয়া হয়েছে, যেমন আমার উপরের কোড হিসাবে টি এর মান সত্যই টি-বিতরণ অনুসরণ করে (সাথেn - 1স্বাধীনতার মাত্রা). এক্স এবং ওয়াইয়ের পছন্দটিকে বহুবার অনুলিপি করার ফলে যে-পি-মানগুলি ফলাফল হয় সেগুলি অভিন্ন বিতরণটি অনুসরণ করে[ 0 , 1 ]। অবিযুক্ত টি-টেস্টের ক্ষেত্রেও একই কথা, যদিও এবার টি-বিতরণ হয়েছে2 ( এন - 1 )স্বাধীনতার মাত্রা. তবুও, পি-মানগুলির ফলাফলগুলির একটি অভিন্ন বিতরণও রয়েছে[ 0 , 1 ], সাধারণ যুক্তি দিয়ে আমি উপরে দিয়েছি। যদি উপরের পিটারের কোডটি পি-মান নির্ধারণের জন্য প্রয়োগ করা হয়, তবে আমরা অভিন্ন বিতরণ থেকে এলোমেলো নমুনা আঁকার দুটি স্বতন্ত্র পদ্ধতি পাই[ 0 , 1 ]। তবে দুটি উত্তরই স্বাধীন নয় not