পি-মানগুলির সংমিশ্রণের সময়, কেন কেবল গড় হয় না?


44

আমি সম্প্রতি পি-মানগুলি সংযুক্ত করার জন্য ফিশারের পদ্ধতি সম্পর্কে শিখেছি। এটি নলের নীচে পি-মানটি একটি অভিন্ন বিতরণ অনুসরণ করে এবং এর ভিত্তিতে তৈরি হয় - যে যা আমি প্রতিভা হিসাবে মনে করি। তবে আমার প্রশ্ন হ'ল কেন এই বিভ্রান্তিকর পথে? এবং কেন পি-মানগুলির অর্থ ব্যবহার করে এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি ব্যবহার করবেন না (কেন তাতে ভুল হচ্ছে)? না মিডিয়ান? আমি এই দুর্দান্ত স্কিমের পিছনে আরএ ফিশারের প্রতিভা বোঝার চেষ্টা করছি।

2i=1nlogXiχ2(2n), given XUnif(0,1)

24
এটি সম্ভাবনার এক মৌলিক অক্ষরে নেমে আসে: পি-মানগুলি সম্ভাবনা এবং সম্ভাবনা এবং স্বাধীন পরীক্ষাগুলির ফলাফলগুলির সম্ভাবনাগুলি যুক্ত হয় না, তারা বহুগুণ হয়। যেখানে গুণনের বিষয়, লোগারিদমগুলি একটি পণ্যকে একটি পরিমাণে সরল করে : সেখান থেকে আসে। (এটির একটি চি-স্কোয়ার বিতরণ তখন একটি অকার্যকর গাণিতিক পরিণতি)) খুব সহজেই "সংশ্লেষিত," এটি সম্ভবত সবচেয়ে সহজ এবং সবচেয়ে প্রাকৃতিক (বৈধ) পদ্ধতি অনুমেয়। log(Xi)
whuber

5
বলুন আমার কাছে একই জনসংখ্যা থেকে দুটি স্বতন্ত্র নমুনা রয়েছে (ধরা যাক আমাদের একটি নমুনা টি-টেস্ট রয়েছে)। নমুনাটির গড় এবং স্ট্যান্ডার্ড বিচ্যুতিগুলি প্রায় একইরকম কল্পনা করুন। সুতরাং প্রথম নমুনার জন্য পি-মান 0.0666 এবং দ্বিতীয় নমুনার জন্য 0.0668। সামগ্রিক পি-মানটি কী হওয়া উচিত? ঠিক আছে, এটি 0.0667 হওয়া উচিত? প্রকৃতপক্ষে, এটি অবশ্যই স্পষ্ট যে এটি আরও ছোট হতে হবে। এই ক্ষেত্রে "ডান" জিনিসটি হ'ল নমুনাগুলি একত্রিত করা, যদি তা আমাদের কাছে থাকে। আমাদের প্রায় একই গড় এবং মানক বিচ্যুতি থাকতে হবে, তবে নমুনার আকারের দ্বিগুণ । স্ট্যান্ডার্ড গড়ের ত্রুটিটি ছোট এবং পি-মানটি আরও কম হওয়া উচিত।
Glen_b

3
পি-মানগুলি একত্রিত করার অন্যান্য উপায় রয়েছে, অবশ্যই পণ্যটি এটি করার সবচেয়ে প্রাকৃতিক উপায়। এক উদাহরণস্বরূপ পি-মান যুক্ত করতে পারে; যৌথ শূন্যের নীচে তাদের যোগফলের একটি ত্রিভুজাকৃতির বিতরণ হওয়া উচিত। অথবা কেউ পি-মানগুলিকে জেড-মানগুলিতে রূপান্তর করতে পারে এবং সেগুলি যুক্ত করতে পারে (এবং যদি আপনি সাধারণ জনসংখ্যার থেকে খুব ছোট-ছোট নমুনার সমান আকারের ফলাফলগুলি সংযুক্ত করে থাকেন তবে এটি প্রচুর অর্থবোধ করবে)। তবে পণ্যটি এগিয়ে যাওয়ার সুস্পষ্ট উপায়; এটি প্রতিবারই যৌক্তিক ধারণা তৈরি করে।
Glen_b

1
মনে রাখবেন যে ফিশারের পদ্ধতিটি সেই পণ্যের উপর ভিত্তি করে, যা আমি প্রাকৃতিক হিসাবে বর্ণনা করছি - কারণ আপনি তাদের যৌথ সম্ভাবনা খুঁজে পেতে স্বাধীন সম্ভাবনাগুলি বহুগুণ করেন। জিএম বিবেচনা করা অন্য পণ্যগুলির তুলনায় সত্যই আলাদা নয়, তারপরে সংশ্লিষ্ট সম্মিলিত পি-মানটি কী তা নির্ধারণের জন্য একটি অতিরিক্ত পদক্ষেপ কারণ পণ্যটি গ্রহণ করে জিএম ( , বলুন) কাজ করেছেন, আপনাকে তখন নজর দেওয়া দরকার সম্মিলিত পি-মানটি পান। যা বলে তা হল আপনি সম্মিলিত পি-মান সন্ধান করার জন্য লগগুলি নেওয়ার আগে জিএমকে পণ্যটিতে ফিরে রূপান্তর করতে চান। - 2 n লগ g = - 2 লগ ( জি এন )g2nlogg=2log(gn)
Glen_b

1
আমি জিজ্ঞাসা করব যে প্রত্যেকে "আমেরিকান পরিসংখ্যানবিদ" তে ডানকান মারডোকের টুকরো "পি-মানগুলি র্যান্ডম ভেরিয়েবলস" পড়তে হবে। আমি অনলাইনে একটি অনুলিপিটি এখানে
পেয়েছি

উত্তর:


35

আপনি পুরোপুরি গড় ব্যবহার করতে পারেন valp

ফিশার এর পদ্ধতি সেট একটি থ্রেশহোল্ড সেট করে উপর , এই ধরনের যে যদি নাল হাইপোথিসিস : সব -values হয় ঝুলিতে, তারপর সম্ভাব্যতা ছাড়িয়ে যায় । যখন ঘটে তখন তা প্রত্যাখ্যান করা হয়। - 2 n i = 1 লগ পি আই এইচ 0 পি ইউ ( 0 , 1 ) - 2 আমি লগ পি আই এস α α এইচ 0sα2i=1nlogpiH0pU(0,1)2ilogpisααH0

সাধারণত একটি takes নেয় এবং কোয়ান্টাইল দ্বারা দেওয়া হয় । সমানভাবে, কেউ প্রোডাক্ট_আই প্রোডাক্টে কাজ করতে পারেন যা সম্ভাবনা সহ than এর চেয়ে কম । এখানে , একটি গ্রাফটি প্রত্যাখ্যান অঞ্চল দেখায় (লাল) (এখানে আমরা ব্যবহার করি । প্রত্যাখ্যান জোনের ক্ষেত্রফল = 0.05)।s α χ 2 ( 2 n ) i p i e - s α / 2 α n = 2 s α = 9.49α=0.05sαχ2(2n)ipiesα/2αn=2sα=9.49

জেলে

এখন আপনি এর পরিবর্তে on বা তার সমতুল্য । আপনি শুধুমাত্র একটি প্রান্তিক মানের বের করতে হবে যেমন যে নীচে সম্ভাব্যতা সঙ্গে ; সঠিক গণনার হল ক্লান্তিকর - জন্য বড় যথেষ্ট আপনি কেন্দ্রীয় সীমা উপপাদ্য উপর নির্ভর করতে পারেন; জন্য , । নিম্নলিখিত গ্রাফটি প্রত্যাখ্যান অঞ্চলটি দেখায় (অঞ্চল = 0.05 আবার)।ipitαpitααtαnn=2tα=(2α)11ni=1npiipitαpitααtαnn=2tα=(2α)12

পি মানগুলির যোগফল

আপনি যেমন কল্পনা করতে পারেন, প্রত্যাখাত অঞ্চলটির জন্য আরও অনেকগুলি আকার সম্ভব, এবং প্রস্তাবিত হয়েছে। এটি কোন প্রাইরি ক্লিয়ার নয় যেটি আরও ভাল - যার মধ্যে আরও বেশি শক্তি রয়েছে।

আসুন ধরে নিই যে , দ্বি - দ্বি- - থেকে অ-কেন্দ্রীভূত প্যারামিটার 1 নিয়ে এসেছে:p1p2z

> p1 <- pchisq( rnorm(1e4, 1, 1)**2, df=1, lower.tail=FALSE )
> p2 <- pchisq( rnorm(1e4, 1, 1)**2, df=1, lower.tail=FALSE )

আসুন আমরা স্ক্র্যাপরপ্লটকে লাল পয়েন্ট সহ একটি পয়েন্ট দেখি যার জন্য নাল অনুমানটি প্রত্যাখ্যান করা হয়।

Scatterplot

ফিশারের পণ্য পদ্ধতির শক্তি আনুমানিক

> sum(p1*p2<exp(-9.49/2))/1e4
[1] 0.2245

মূল্যগুলির সমষ্টি ভিত্তিক পদ্ধতির শক্তি প্রায় হয়p

> sum(p1+p2<sqrt(0.1))/1e4
[1] 0.1963

সুতরাং ফিশারের পদ্ধতিটি জিতে - কমপক্ষে এই ক্ষেত্রে।


2
ধন্যবাদ, দুর্দান্ত সম্পাদনা (+1)। জন্য নাল বন্টন একটি ত্রিকোণ বন্টন, তাই প্রকৃতপক্ষে । জন্য নাল বন্টন ইতিমধ্যে বেশ জড়িত (তার তিন অংশ ঘনত্ব) কিন্তু ভাগ্যক্রমে জন্য এটি আগে থেকেই গড় সঙ্গে একটি স্বাভাবিক বন্টন দ্বারা খুব ভাল আনুমানিক যাবে এবং ভ্যারিয়েন্স । n=2tα=2αn=3n>30.5nn/12
মোমো

1
+1 টি। নোট করুন যে ভ্যালু যুক্ত করা এডজিংটনের পদ্ধতি বলা হয় , কিছু গ্রন্থগ্রন্থের জন্য আমার উত্তর নীচে দেখুন। p
অ্যামিবা বলেছেন মনিকাকে

26

সমস্ত পৃথক মূল্য সমষ্টি করে কী ভুল ?p

@ হুবার এবং @ গ্লেন_ বি মন্তব্যে যুক্তি হিসাবে, ফিশারের পদ্ধতিটি মূলত সমস্ত পৃথক মূল্যকে গুণিত করছে এবং সম্ভাব্যতাগুলি বাড়ানোর চেয়ে আরও বেশি প্রাকৃতিক জিনিস।p

এখনও এক করতে তাদের যোগ করুন। প্রকৃতপক্ষে, এডিজিংটন (1972) দ্বারা যথাযথভাবে এটি পরামর্শ দেওয়া হয়েছিল স্বাধীন পরীক্ষা - নিরীক্ষার (বেতন-প্রাচীরের নীচে) থেকে সম্ভাব্যতার মানগুলিকে একত্রিত করার একটি অ্যাডিটিভ পদ্ধতি , এবং কখনও কখনও এডিংটনের পদ্ধতি হিসাবেও অভিহিত হন। 1972 এর কাগজটি এই দাবিটি শেষ করেছে

সংযোজন পদ্ধতিটি গুণগত পদ্ধতির তুলনায় আরও শক্তিশালী হিসাবে দেখানো হয়েছে, যখন সেখানে চিকিত্সার প্রভাব রয়েছে যখন উল্লেখযোগ্য ফলাফল প্রদানের গুণগত পদ্ধতির চেয়ে বেশি সম্ভাবনা রয়েছে।

তবে পদ্ধতিটি অপেক্ষাকৃত অজানা থেকে গেছে বলে আমি সন্দেহ করি যে এটি কমপক্ষে একটি ওভারসিম্প্লিফিকেশন ছিল। উদাহরণস্বরূপ সাম্প্রতিক একটি সংক্ষিপ্ত বিবরণ কাজিন্স (২০০৮) সম্মিলিত তাত্পর্য বা পি- ভ্যালুতে কিছু কাগজপত্রের টীকাযুক্ত গ্রন্থপঞ্জি এডজিংটনের পদ্ধতির মোটেও উল্লেখ করে না এবং মনে হয় যে এই শব্দটি ক্রসভিলেটেডে কখনও উল্লেখ করা হয়নি।

এটা তোলে মিশ্রন বিভিন্ন উপায়ে সঙ্গে আসা পর্যন্ত করা সহজ -values (আমি একবার নিজেকে এক সঙ্গে আসা পর্যন্ত জিজ্ঞেস করলো কেন এটা আর কখনও ব্যবহৃত হয় হয়েছে: Stouffer এর জেড-স্কোর পদ্ধতি: যদি আমরা যোগফল কি পরিবর্তে ? ), এবং আরও ভাল পদ্ধতিটি হ'ল মূলত একটি অভিজ্ঞতামূলক প্রশ্ন। একটি নির্দিষ্ট পরিস্থিতিতে দুটি পৃথক পদ্ধতির পরিসংখ্যানগত শক্তির অভিজ্ঞতাগত তুলনা করার জন্য দয়া করে সেখানে @ whuber এর উত্তর দেখুন; একটি স্পষ্ট বিজয়ী আছে।pz2z

সুতরাং কেন যে কোনও "বিভ্রান্তিকর" পদ্ধতিটি কেন আদৌ ব্যবহার করা হচ্ছে সে সম্পর্কে সাধারণ প্রশ্নের উত্তর হ'ল যে কেউ ক্ষমতা অর্জন করতে পারে।

জায়েকিন এট আল (২০০২) পি-মানগুলির সংমিশ্রণের জন্য কাটা পণ্য পদ্ধতি কিছু সিমুলেশন চালায় এবং তুলনায় এডিংটনের পদ্ধতি অন্তর্ভুক্ত করে, তবে আমি সিদ্ধান্তগুলি সম্পর্কে নিশ্চিত নই।

এই জাতীয় সমস্ত পদ্ধতি দেখার জন্য একটি উপায় হ'ল জন্য প্রত্যাখ্যান অঞ্চলগুলি আঁকুন , যেমন @ এলভিস তার উত্তরের উত্তরে (+1) করেছিলেন। এখানে আরও একটি চিত্র রয়েছে যা স্পষ্টতই এজিংটনের পদ্ধতিটি পোস্টার হিসাবে প্রদর্শিত হয় যা উইঙ্কলার এট আল (2013) মাল্টি-মডেল ইমেজিংয়ের বিশ্লেষণের জন্য নন-প্যারামেট্রিক সংমিশ্রণ থেকে প্রদর্শিত হয় :n=2

পি-মানগুলির সংমিশ্রণ

এ সব বলার পরেও, আমি মনে করি এখনও এডিংটনের পদ্ধতিটি (প্রায়শই?) কেন সাবপটিমাল হবে, এ থেকে নিস্পষ্ট হওয়ার পরেও একটি প্রশ্ন রয়ে গেছে।

অস্পষ্টতার জন্য সম্ভবত একটি কারণ হ'ল এটি আমাদের অন্তর্নিজ্ঞানের সাথে খুব ভালভাবে না: , যদি (বা উচ্চতর) তবে 3 এর মান যাই হোক না কেন , মিলিত প্রত্যাখ্যাত হবে না , এটি যেমন ।n=2p1=0.4p2α=0.05p2=0.00000001

আরও সাধারণভাবে, মানগুলি সংক্ষেপে খুব অল্প সংখ্যক যেমন কে থেকে খুব কম পার্থক্য করে তবে এই সম্ভাবনার পার্থক্যটি আসলে বিশাল।pp=0.001p=0.00000001


হালনাগাদ. মেটা-বিশ্লেষণের জন্য তাদের পরিসংখ্যানগত পদ্ধতিতে (1985) এডজিন্টগনের পদ্ধতি সম্পর্কে ( মূল্যগুলি সংযুক্ত করার অন্যান্য পদ্ধতির পর্যালোচনা করার পরে ) হেজেস এবং অলকিন এখানে লিখেছেন :p

এডিংটন (1972 এ, খ) দ্বারা একটি সম্পূর্ণ ভিন্ন সম্মিলিত পরীক্ষার পদ্ধতি প্রস্তাব করা হয়েছিল। Edgington মিশ্রন প্রস্তাবিত সমষ্টি গ্রহণ করে -values এবং জন্য তাত্পর্য মাত্রা পাওয়ার জন্য একটি ক্লান্তিকর কিন্তু সহজবোধ্য পদ্ধতি দিয়েছেন । এর তাত্পর্য স্তরের একটি বৃহত নমুনার প্রায় কাছাকাছি এডিংটন (1972 বি) দেওয়া হয়েছে। যদিও এটি একটি একঘেয়েমি সমন্বয় পদ্ধতি এবং সেইজন্য গ্রাহ্য, Edgington এর পদ্ধতি সাধারণত একটি দরিদ্র পদ্ধতি এক বড় যেহেতু বলে মনে করা হয় -value অনেক ছোট মান যে পরিসংখ্যাত রচনা ঢাকিয়া ফেলা যাবে। তবে, এই পদ্ধতির প্রায় কোনও সাংখ্যিক তদন্ত হয়নি।এস = পি 1 + + পি কে , এস এস পিp

S=p1++pk,
SSp

1
ধন্যবাদ, @ গ্লেন_ বি! আমি আনন্দিত যে এই থ্রেডটি কিছু অতিরিক্ত এবং ভাল-প্রাপ্য দৃশ্যমানতা পেয়েছে। যাইহোক, আমি অবগত ছিলাম না যে আমি এই উত্তরটি গবেষণা শুরু না করা পর্যন্ত এই পদ্ধতিটিকে "এজিংটনের পদ্ধতি" বলা হয়।
অ্যামিবা বলছেন মনিকাকে

9

সুতরাং আপনি যদি তিনটি উপলক্ষে একই আকারের তিনটি স্টাডি করে থাকেন এবং 0.05 এর পি-ভ্যালু পেয়ে থাকেন তবে আপনার অন্তর্নিহিততাটি কি "আসল মান" 0.05 হওয়া উচিত? আমার স্বজ্ঞাততা আলাদা। একাধিক অনুরূপ ফলাফলগুলি তাত্পর্যটিকে আরও উচ্চতর করে তোলে বলে মনে হয় (এবং তাই পি-ভ্যালুগুলি যা সম্ভাবনা কম হয়)। পি-মানগুলি আসলে সম্ভাবনা নয়। তারা হ'ল একটি নির্দিষ্ট অনুমানের অধীনে পর্যবেক্ষণ করা মানগুলির নমুনা বিতরণ সম্পর্কে বিবৃতি। আমি বিশ্বাস করি যে এই ধারণাটিকে কেউ সমর্থন করতে পারে যে কেউ এগুলি এর অপব্যবহার করতে পারে। আমি দৃ as়তা যে এই দাবি করে।

যে কোনও হারে, কোনও পার্থক্যের নাল অনুমানের অধীনে, একাধিক চূড়ান্ত পি-মান পাওয়ার সম্ভাবনা অনেক বেশি অসম্ভব বলে মনে হয়। যতবার আমি বিবৃতিটি দেখি যে পি-মান 0-1 থেকে নাল অনুমানের অধীনে অভিন্নভাবে বিতরণ করা হয়েছে আমি অনুকরণের সাথে এটি পরীক্ষা করতে বাধ্য বোধ করি এবং এখনও অবধি বিবৃতিটি ধরে রাখা হয়েছে বলে মনে হয়। আমি স্পষ্টতই লগারিদমিক স্কেলে সচেতনভাবে চিন্তা করি না, যদিও আমার সেরিব্রাল নিউরাল নেট এর কমপক্ষে অংশ অবশ্যই আবশ্যক।

আপনি যদি এই স্বজ্ঞাততাটি মাপতে চান তবে আপনার দেওয়া সূত্রটি (সামান্য সংশোধন সহ) উইকিপিডিয়া পৃষ্ঠায় প্রদর্শিত হবে: http://en.wikedia.org/wiki/Fisher%27s_method , এবং সম্পর্কিত গ্রাফিক আপনাকে দর্শনীয় এবং অর্ধ- সামগ্রিক তাত্পর্যতে দুটি ছোট পি-ভ্যালু পাওয়ার পরিমাণগতভাবে প্রভাব। উদাহরণস্বরূপ রঙ কোডিং গ্রাফিক থেকে পড়া, 0.05 এর 2 একযোগে পি-মানগুলি .02 এর আশেপাশে একটি সিন্থেটিক পি-মান দিতে পারে। আপনি আপনার নমুনার আকার দ্বিগুণ করার টি-পরিসংখ্যানের প্রভাবগুলিও তদন্ত করতে পারেন। নমুনা আকারটি টি-পরিসংখ্যানগুলিতে 1 / স্কয়ার্ট (এন -1) হিসাবে প্রবেশ করে যাতে আপনি 50 থেকে 100 এ যাওয়ার ফলাফল হিসাবে সেই ফ্যাক্টরের প্রভাবটি দেখতে পারেন R (আর :) তে

 plot(1:100, 1/sqrt(1:100) ,ylim=c(0,1) )
 abline(h=1/sqrt(c(50,100)))

এই দুটি পদ্ধতির বিভিন্ন পরিমাণগত ফলাফল পাওয়া যায়, যেহেতু 50 এবং 100 এর জন্য 1 / sqrt (n) মানগুলি 0.05 থেকে 0.02 এর অনুপাতের সমান নয়। উভয় পন্থা আমার স্বজ্ঞাতকে সমর্থন করে তবে বিভিন্ন ডিগ্রীতে। হতে পারে অন্য কেউ এই তাত্পর্যটি সমাধান করতে পারেন। তৃতীয় পন্থাটি হ'ল প্রতিটি ট্রানের দ্বি-দ্বি সম্ভাব্যতা ছিল যখন "সত্য" এর দুটি এলোমেলো ড্র হওয়ার সম্ভাবনা বিবেচনা করা। (একটি অত্যন্ত অন্যায় পাশা) That যৌথ ইভেন্টটির .05 * .05 = .002 এর সম্ভাবনা থাকা উচিত, যার ফলস্বরূপ ফিশার অনুমানের "অন্যদিকে" বিবেচনা করা যেতে পারে। আমি কেবল 50,000 একযোগে t.tests এর সিমুলেশন চালিয়েছি। যদি আপনি ফলাফলগুলি প্লট করেন তবে এটি দেখতে অনেকটা মহাজাগতিক ব্যাকগ্রাউন্ড রেডিয়েশন ফিল্ডের মানচিত্রের মতো দেখাচ্ছে ... যেমন। বেশিরভাগ এলোমেলো

 t1 <- replicate(50000, t.test(rnorm(50))$p.value )
     t2 <- replicate(50000, t.test(rnorm(50))$p.value )
 table(t1 < 0.05, t2 < 0.05)
 plot(t1, t2, cex=0.1)
#        FALSE  TRUE
#  FALSE 45099  2411
#  TRUE   2380   110
 110/(50000-110)
#[1] 0.002204851

আপনার উত্তর করার জন্য আপনাকে ধন্যবাদ। আপনি যে অন্তর্দৃষ্টি উল্লেখ করেছেন তা বাস্তবে অর্থবোধ করে। আপনারা উল্লেখ করেছেন সেই মামলাগুলি আমি আরও তাৎপর্যপূর্ণ বলে বিবেচনা করব। তবে এই ধারণাটি আরও গাণিতিকভাবে কঠোরভাবে প্রকাশ করার কোনও উপায় আছে কি?
অ্যালবাই

palpha

আমি এটা দেখেছি. বিশ্বাস ছিল না।
ডুইন

1
p1=0.05p2=0.05

গড় পদ্ধতিটি যৌগিক অনুমানকে "জোর দেয়" বা ওজন করে যা পৃথক উভয় অনুমানকে এক সাথে প্রত্যাখ্যান করা হয়। এটি একটি অব্যক্ত বাধা বলে মনে হচ্ছে।
ডিউইন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.