অনুমানের পরীক্ষায় পি-মানটির ব্যাখ্যা of


36

আমি সম্প্রতি "নুল হাইপোথিসিসের গুরুত্বের পরীক্ষার তাত্পর্য", জেফ গিল (1999) পত্রিকাটি পেরিয়েছি । হাইপোথিসিস টেস্টিং এবং পি-ভ্যালু সম্পর্কিত লেখক কয়েকটি সাধারণ ভুল ধারণা উত্থাপন করেছিলেন, যার সম্পর্কে আমার দুটি নির্দিষ্ট প্রশ্ন রয়েছে:

  1. পি-মানটি প্রযুক্তিগতভাবে , যা কাগজের দ্বারা উল্লেখ করা হয়েছে, সাধারণত সম্পর্কে আমাদের কিছু বলেন না , যদি না আমরা প্রান্তিক বিতরণগুলি জানতে পারি, যা "প্রতিদিনের" হাইপোথিসিস পরীক্ষায় খুব কমই ঘটে থাকে। যখন আমরা একটি ছোট পি-মান পাই এবং "নাল অনুমানকে প্রত্যাখ্যান করি", তখন আমরা কীভাবে সম্ভাবনাবাদী বক্তব্য , যেহেতু আমরা about) সম্পর্কে কিছু বলতে পারি না ?P(observation|H0)P(H0|observation)P(H0|observation)
  2. দ্বিতীয় প্রশ্নটি কাগজের পৃষ্ঠা 6 (652) থেকে একটি নির্দিষ্ট বিবৃতি সম্পর্কিত:

যেহেতু তারকারা দ্বারা নির্দেশিত পি-মান বা পি-মানগুলির পরিসীমা কোনও অগ্রাধিকার সেট করা হয়নি, তাই এটি টাইপ আই ত্রুটি তৈরির দীর্ঘকালীন সম্ভাবনা নয় তবে সাধারণত এরূপ হিসাবে বিবেচিত হয়।

এই বিবৃতি বলতে কী বোঝাতে সাহায্য করতে পারে কেউ?


কাগজের রেফারেন্সের জন্য টিওয়াই
লুডোভিক কিউটি

@ এজেবেন্টলি: আমার উত্তরটি পেতে সম্ভবত আকর্ষণীয় বিষয় রয়েছে: stats.stackexchange.com/questions/166323/…

উত্তর:


33

(প্রযুক্তিগত ভাবে, পি-মান তথ্য দেখে সম্ভাব্যতা চরম হিসাবে অন্তত হিসাবে যে আসলে, পালন নাল হাইপোথিসিস দেওয়া।)

চতুর্থাংশ 1। একটি ছোট পি-মূল্যের ভিত্তিতে নাল অনুমানকে প্রত্যাখ্যান করার সিদ্ধান্তটি সাধারণত 'ফিশারের বিভাজন' এর উপর নির্ভর করে: হয় বিরল ঘটনা ঘটেছে বা নাল অনুমানটি মিথ্যা। বাস্তবে, ঘটনাটির বিরলতা হ'ল পি-ভ্যালু আপনাকে নালকে মিথ্যা বলে দেওয়ার সম্ভাবনার চেয়ে বরং বলবে।

নালটি মিথ্যা হওয়ার সম্ভাবনাটি কেবল বেয়েসের উপপাদ্য দ্বারা পরীক্ষামূলক তথ্য থেকে পাওয়া যেতে পারে, যার জন্য নাল অনুমানের 'পূর্ব' সম্ভাবনার সুনির্দিষ্টতা প্রয়োজন (সম্ভবত গিল "প্রান্তিক বিতরণ" হিসাবে উল্লেখ করছেন)।

Q2 এর। আপনার প্রশ্নের এই অংশটি মনে হয় তার চেয়ে অনেক বেশি শক্ত। পি-ভ্যালু এবং ত্রুটির হার সম্পর্কে অনেকটা বিভ্রান্তি রয়েছে যা সম্ভবতঃ গিল যার সাথে উল্লেখ করছেন "তবে সাধারণত এরূপ হিসাবে বিবেচিত হয়।" নেইমন-পিয়ারসোনিয়ান ত্রুটি হারের সাথে ফিশেরিয়ান পি-মানগুলির সংমিশ্রণটিকে একটি অন্তর্নিহিত মিশ্মশ বলা হয়, এবং এটি দুর্ভাগ্যক্রমে খুব ব্যাপক। এখানে কোনও সংক্ষিপ্ত উত্তর পুরোপুরি পর্যাপ্ত হতে যাচ্ছে না, তবে আমি আপনাকে কয়েকটি ভাল কাগজপত্রের দিকে নির্দেশ করতে পারি (হ্যাঁ, একটি আমার)। উভয়ই আপনাকে গিলের কাগজটি বোঝাতে সহায়তা করবে।

হার্লবার্ট, এস।, এবং লম্বার্ডি, সি। (২০০৯)। নেইমন-পিয়ারসন সিদ্ধান্তের তাত্ত্বিক কাঠামোর চূড়ান্ত পতন এবং নিও ফিশেরিয়ানের উত্থান। আনালেস জুলোগিসি ফেনিকি, 46 (5), 311–349। (কাগজের সাথে লিঙ্ক)

লিউ, এমজে (2012) ফার্মাকোলজিতে স্ট্যাটিস্টিকাল অনুশীলন (এবং অন্যান্য বেসিক বায়োমেডিকাল শাখা): আপনি সম্ভবত জানেন না পি ব্রিটিশ জার্নাল অফ ফার্মাকোলজির, 166 (5), 1559–1567। doi: 10.1111 / j.1476-5381.2012.01931.x (কাগজের লিঙ্ক)


স্পষ্টির জন্য ধন্যবাদ। প্রযুক্তিগতভাবে যেমন বিবৃতি দেওয়া ভুল "the small p-value indicates that the sample mean(or regression coefficient, etc) is significantly different from zero"? বিভ্রান্তির উত্সটি দেখে মনে হচ্ছে যে নালকে "প্রত্যাখ্যান" করা হওয়ার সময় নাল অনুমানের বিষয়ে কোনও বাস্তব সম্ভাব্য দাবি করা হচ্ছে না।

2
@ এজেবেন্টলে, এটি আপনার উল্লেখযোগ্য অর্থের উপর নির্ভর করে। এই শব্দটি বেশিরভাগ প্রসঙ্গে সত্যই খুব তাৎপর্যপূর্ণ নয় কারণ এটি ফিশার-নেইম্যান-পিয়ারসন হাইব্রিড দ্বারা দূষিত হয়েছে। যদি আপনি খুব সামান্য পি-মান অর্জন করেন তবে এটি বলা ঠিক হবে যে সত্যিকার অর্থটি সম্ভবত শূন্য নয়, তবে পর্যবেক্ষণের অর্থটি কী ছিল তা বলা গুরুত্বপূর্ণ এবং এর পরিবর্তনশীলতা (এসইএম বা আত্মবিশ্বাসের ব্যবধান) এবং ডন'কে নির্দেশ করা গুরুত্বপূর্ণ নমুনার আকারটি কী ছিল তা বলতে ভুলবেন না। পি-মানটি পর্যবেক্ষণের প্রভাবের আকারের নির্দিষ্টকরণের বিকল্প নয়।
মাইকেল লু

ব্যাখ্যা করার জন্য আপনাকে ধন্যবাদ. আমাকে ফিশার এবং নেইমন-পিয়ারসন দৃষ্টান্তের আরও গভীর খনন করতে হবে।


কিউ 1 এর অধীনে আপনার অনুচ্ছেদটি সম্ভবত আমি এখনও পর্যন্ত দেখা ইস্যুটির সেরা ব্যাখ্যা। ধন্যবাদ.
ম্যাক্সিম.কে

22

+1 থেকে @ মিশেললিউ, যিনি আপনাকে একটি ভাল উত্তর সরবরাহ করেছেন। সম্ভবত আমি এখনও প্রশ্নোত্তর সম্পর্কে চিন্তাভাবনার একটি উপায় সরবরাহ করে অবদান রাখতে পারি। নিম্নলিখিত পরিস্থিতি বিবেচনা করুন:

  • নাল অনুমানটি সত্য। (মনে রাখবেন যে নাল অনুমানটি সত্য না হলে , কোনও ধরণের প্রথম ত্রুটি সম্ভব নয়, এবং ভ্যালুটির অর্থ কী তা তা পরিষ্কার নয় )) পি
  • α প্রচলিতভাবে এ সেট করা হয়েছে । 0.05
  • গণিত -মূল্য । পি0.01

এখন, ডাটা পাবার সম্ভাবনা চরম হিসাবে বা আরও চরম আপনার ডেটা চেয়ে 1% (অর্থাৎ কী -value উপায়ে)। আপনি নাল অনুমানটিকে প্রত্যাখ্যান করেছেন, প্রথম ধরণের ত্রুটি করে । এটি কি সত্য যে দীর্ঘমেয়াদে টাইপ আই ত্রুটির হারও এই পরিস্থিতিতে 1%, যা অনেক লোক স্বজ্ঞাতভাবে সিদ্ধান্ত নিতে পারে? উত্তর না হয় । কারণটি হ'ল যদি আপনি মূল্য অর্জন করেন তবে আপনি নালটিকে প্রত্যাখ্যান করতে পারেন। আসলে, আপনি নাল এমনকি যদি প্রত্যাখ্যাত হতো ছিল , এবং লং রান, 'এই বৃহৎ পর্যন্ত গুলি ঘটবেপিপি0.02পি0.049¯পি5% সময় এবং এই জাতীয় সমস্ত প্রত্যাখাগুলি টাইপ আই ত্রুটি হবে। সুতরাং, দীর্ঘ সময়ের ধরণের আই ত্রুটির হার 5% (যেখানে আপনি সেট করেছিলেন )। α

(প্রকাশ: আমি গিলের কাগজটি পড়িনি, তাই আমি গ্যারান্টি দিতে পারি না যে তিনি যা বোঝাতে চেয়েছিলেন, তবে এটি এই দাবিটি উপলব্ধি করে যে ভ্যালু দীর্ঘমেয়াদী টাইপ আই ত্রুটির হারের মতো নয় [ )পি


1
এমন একটি ক্ষেত্রে কাজ করা (এপিআই) যেখানে প্রায়শই এটি বিশ্বাস করা অত্যন্ত কঠিন যে অনুমান করা যায় যে H_0 = 0 আসলে সত্য, আমি মনে করি যে এই বিন্দুটি উপেক্ষা করা হয়েছে এবং আরও বেশি মনোযোগের দাবিদার।
বস্কোভিচ

1
আমার বোধগম্যতা সঠিক কিনা তা নিশ্চিত করার জন্য। P- মান নিজেই একটি দৈব চলক, এবং ধরণ-আমি ভুল সম্ভাব্যতা যে এই দৈব চলক কম হয় । এটা কী ঠিক? α

1
+1, তবে নালটি মিথ্যা হলে একটি পি-মানটির অর্থ অস্পষ্ট হওয়ার পরামর্শটি বিভ্রান্তিকর। পি-মানটি যত ছোট হবে নাল এবং পর্যবেক্ষণের মধ্যে তাত্পর্য বৃহত্তর। নমুনার আকারটি যত বড়, ততই নিকটস্থ এটি অনুমান করা যায় যে প্রকৃত প্রভাবের আকারটি পর্যবেক্ষণ করা প্রভাবের আকারের। এটি লক্ষ করা খুব দরকারী যে তাৎপর্য পরীক্ষাটি অনুমানের সাথে সমান।
মাইকেল লু

3
@ মিশেললিউ, আমি নিশ্চিত নই যে পি-মানটি নিজেরাই এই জিনিসগুলি বোঝায়। সংযুক্তিতে ডাব্লু / এন (এবং বিশেষত এন ধ্রুবককে ধরে রাখা) একটি ছোট পি বড় শূন্যতার সাথে মিলিয়ে যাবে / শূন্য ও পর্যবেক্ষণে। তবুও, যে এমন কিছু বিষয় যা কিছু পি পি বদলে থেকে অনুমিত হতে পারে আরো উপায়ে । এটি আরও সত্য যে ডাব্লু / বৃহত্তর এন পর্যবেক্ষণের প্রভাব আকারগুলি ইএস এর আরও কাছাকাছি হওয়া উচিত, তবে সেখানে পি কী ভূমিকা পালন করে তা আমার কাছে কম স্পষ্ট। EG, ডাব্লু / একটি মিথ্যা নাল, সত্য প্রভাবটি এখনও খুব সামান্য হতে পারে, এবং ডাব্লু / লার্জ এন আমরা পর্যবেক্ষণ করা ES কাছাকাছি হওয়ার আশা করব, তবে পি এখনও বড় হতে পারে।
গুং - মনিকা পুনরায়

1
@ গুং, আমি এই কাগজটি হুবার্ড দ্বারা <ftp.stat.duke.edu/WorkingPapers/03-26.pdf> পড়ছি। পৃষ্ঠায় 12, তিনি বলেছেন ...this fallacy shows up in statistics textbooks, as when Canavos and Miller (1999, p.255) stipulate: "If the null hypothesis is true, then a type I error occurs if (due to sampling error) the P-value is less than or equal to $alpha$"যে আমি ভেবেছিলাম যে টাইপ -1 ত্রুটি হ'ল পি-মানটি যদি নাল সত্য হয় তবে পি-ভ্যালু চেয়ে কম হয় prob তাহলে কেন হাববার্ড বলছে যে উদ্ধৃত বিবৃতিটি একটি মিথ্যাচার? আমি কি কোনওভাবে এটির ভুল ব্যাখ্যা দিচ্ছি? α

8

আমি "নাল হাইপোথিসিসের তাত্পর্য পরীক্ষার তুচ্ছতা" সম্পর্কিত একটি মন্তব্য করতে চাই তবে এটি ওপি-র প্রশ্নের উত্তর দেয় না।

pH0H0:{θ=0}θ=ϵϵϵ0ϵ0


3
+1 হ্যাঁ, প্রচলিত হাইপোথিসিস টেস্টিংয়ের আসল সমস্যাটি হ'ল এটি এমন একটি প্রশ্নের উত্তর দেয় যা আপনি উত্তর দেওয়ার ক্ষেত্রে সত্যই আগ্রহী নন, "" কোনও পার্থক্যের উল্লেখযোগ্য প্রমাণ আছে কি? "বরং" "কোনও উল্লেখযোগ্য পার্থক্যের প্রমাণ রয়েছে কি? "। অবশ্যই যা প্রয়োজন তা সাধারণত "আমার গবেষণার অনুমানটি সত্য হওয়ার সম্ভাবনা কী?" তবে এটি একটি ঘনতান্ত্রিক কাঠামোর মধ্যে উত্তর দেওয়া যায় না। ভুল ব্যাখ্যাটি সাধারণত বায়েশীয় পদগুলিতে ঘনত্ববাদী পরীক্ষার চিকিত্সার চেষ্টার থেকে উদ্ভূত হয়।
ডিকরান মার্শুপিয়াল

1
পি-মান এবং নমুনার আকারের অর্থ আলাদা করা ভাল ধারণা নয়। একটি ছোট পি-মান কোনও নির্দিষ্ট নমুনার আকারে বৃহত্তর প্রভাবের আকারকে নির্দেশ করে এবং কোনও নির্দিষ্ট পি-মানের জন্য একটি বৃহত নমুনার আকার নির্দেশ করে যে প্রকৃত প্রভাবের আকার সম্ভবত পর্যবেক্ষণের প্রভাবের আকারের নিকটে রয়েছে। তাত্পর্য নয়, অনুমানের প্রসঙ্গে গুরুত্ব পরীক্ষাগুলি ভাবা উচিত। একটি বৃহত্তর নমুনা সর্বদা আরও তথ্য দেয় - এটি কীভাবে ব্যাখ্যা করা যায় তা পরীক্ষকের উপর নির্ভর করে। বৃহত্তর নমুনা নগণ্য প্রভাব অভিযোগ কেবলমাত্র নেইম্যান-পিয়ারসোনিয়ান অনুমান পরীক্ষার জন্য একটি সমস্যা।
মাইকেল লু
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.