একটি পি-মান ভুল বোঝাবুঝি?


17

সুতরাং আমি কীভাবে একটি পি-মানটিকে সঠিকভাবে ব্যাখ্যা করতে পারি সে সম্পর্কে প্রচুর পড়ছি, এবং আমি যা পড়েছি, পি-মানটি নাল অনুমানটি সত্য বা মিথ্যা সম্ভাবনার বিষয়ে কিছুই বলেনি। তবে, নিম্নলিখিত বিবৃতিটি পড়ার সময়:

পি - মানটি টাইপ আই ত্রুটি তৈরি করার সম্ভাবনা বা প্রতিনিধিত্ব করে বা নাল অনুমানটিকে সত্য বলে প্রত্যাখ্যান করে। পি মানটি যত কম হবে, সম্ভাবনা হ'ল আপনি নাল অনুমানটি ভুলভাবে প্রত্যাখ্যান করবেন।

সম্পাদনা: এবং তারপরে 5 মিনিট পরে আমি পড়লাম:

পি মানগুলির ভুল ব্যাখ্যা খুব সাধারণ। সর্বাধিক সাধারণ ভুল হ'ল একটি সত্য নাল অনুমান (এক ধরণের ত্রুটি ত্রুটি) প্রত্যাখ্যান করে ভুল করার সম্ভাবনা হিসাবে পি মানটিকে ব্যাখ্যা করা।

এই আমাকে বিভ্রান্ত। কোনটি সঠিক? এবং যে কেউ কীভাবে পি-মানটিকে সঠিকভাবে ব্যাখ্যা করতে এবং এটি কীভাবে I টাইপ আই ত্রুটি হওয়ার সম্ভাবনার সাথে সঠিকভাবে সম্পর্কিত তা ব্যাখ্যা করতে পারে?


1
The p – value represents the probability of making a type I error, or rejecting the null hypothesis when it is trueপি - মানটি টাইপ আই ত্রুটি করার এপ্রোরি সম্ভাব্যতা উপস্থাপন করে, অর্থাত্ এটি সত্য যে অনুমানের অধীনে নাল অনুমানকে প্রত্যাখ্যান করে।
ttnphns

4
@ পল: নালটি শূন্য হওয়ার শর্তটি সত্য বলে প্রত্যাখ্যান করার সম্ভাবনাটি হ'ল টাইপ আই ত্রুটির সম্ভাবনা, এটি পি-ভ্যালুর মতো নয়। প্রথম ধরণের ত্রুটির সম্ভাবনাটি (ক্রমাগত এলোমেলো ভেরিয়েবলের জন্য) চয়নের তাত্পর্য স্তরের সমান, নীচে আমার উত্তরটিও দেখুন।

হ্যাঁ, আমি এখন দেখছি, আপনি একদম ঠিক বলেছেন।
পল

4
@fcoppens প্রথম ধরণের ত্রুটির সম্ভাবনা কেবলমাত্র আলফার প্রাক-নির্বাচিত স্তরের সমান যদি আপনি নাল অনুমানের উপর শর্ত রাখেন। শর্তহীন ক্ষেত্রে আপনি জানেন না যে নালটি সত্য বা মিথ্যা কিনা এবং তাই আপনি যদি শূন্যের সত্যতার জন্য পূর্বের সম্ভাবনা সরবরাহ করেন তবে আপনি কেবলমাত্র টাইপ আই ত্রুটির সম্ভাবনা নির্দিষ্ট করতে পারেন।
মাইকেল লিউ - মনিকা

@ মিশেল লিউ: নাল সম্পর্কে এই কন্ডিশনারটি নীচে আমার উত্তরে উল্লেখ করা হয়েছে?

উত্তর:


25

আপনার মন্তব্যের কারণে আমি দুটি পৃথক বিভাগ করব:

P-মান

পরিসংখ্যান অনুমানের পরীক্ষায় আপনি বিকল্প অনুমানের জন্য 'পরিসংখ্যানগত প্রমাণ' খুঁজে পেতে পারেন ; যেমন আমি ব্যাখ্যা করেছি যে আমরা যদি নাল অনুমানকে প্রত্যাখ্যান করতে ব্যর্থ হই তবে এরপরে কী হবে? , এটি গণিতে 'বিপরীতে প্রমাণের' অনুরূপ।

সুতরাং যদি আমরা 'পরিসংখ্যানগত প্রমাণ' সন্ধান করতে চাই তবে আমরা তার বিপরীতটি ধরে নিই, যা আমরা কে প্রমাণ করি যা আমরা এইচ 1 বলে থাকি তার প্রমাণ করার চেষ্টা করি । এর পরে আমরা একটি নমুনা আঁকি, এবং নমুনা থেকে আমরা একটি তথাকথিত পরীক্ষা-পরিসংখ্যান গণনা করি (উদাহরণস্বরূপ একটি টেস্টে একটি টি-মান)।এইচ0এইচ1

তারপরে, আমরা যেমন ধরে নিচ্ছি যে সত্য এবং আমাদের নমুনা এফ 0 এর অধীন বিতরণ থেকে এলোমেলোভাবে আঁকা হয়েছে , আমরা আমাদের (এলোমেলো) নমুনা থেকে প্রাপ্ত মানকে অতিক্রম বা সমান করে পর্যবেক্ষণের মানগুলি পর্যবেক্ষণের সম্ভাবনা গণনা করতে পারি এই সম্ভাবনাটিকে পি-মান বলা হয়।এইচ0এইচ0

যদি এই মানটি '' পর্যাপ্ত পরিমাণে ছোট '' হয় তবে তাত্পর্যপূর্ণ স্তরের চেয়ে ছোট যা আমরা বেছে নিই, তবে আমরা প্রত্যাখ্যান করি এবং আমরা এইচ 1 কে 'পরিসংখ্যানগতভাবে প্রমাণিত' বলে বিবেচনা করি।এইচ0এইচ1

এই পদ্ধতিতে বেশ কয়েকটি জিনিস গুরুত্বপূর্ণ:

  • সত্য বলে অনুমানের অধীনে আমরা সম্ভাব্যতা অর্জন করেছিএইচ0
  • আমরা এইচ 0 এর অধীনে ধরে নেওয়া বিভ্রান্তি থেকে একটি এলোমেলো নমুনা নিয়েছিএইচ0
  • যদি আমরা এলোমেলোভাবে নমুনা থেকে প্রাপ্ত পরীক্ষার-পরিসংখ্যানগুলি অতিক্রম করার কম সম্ভাবনা থাকে তবে আমরা এইচ 1 এর প্রমাণ খুঁজে পাওয়ার সিদ্ধান্ত নিয়েছি। সুতরাং H 0 সত্য হওয়ার সময় এটি অতিক্রম করা অসম্ভব নয় এবং এই ক্ষেত্রে আমরা টাইপ 1 ত্রুটি করি। H1H0

সুতরাং আমি কী ধরণের ত্রুটিটি করব: এফ 0 থেকে নমুনা এলোমেলোভাবে আঁকলে এই সিদ্ধান্তটি পৌঁছে দেয় যে এইচ 0 মিথ্যা এবং বাস্তবে এটি সত্য।H0H0

নোট করুন যে এর দ্বারা সূচিত হয় যে পি-মানটি টাইপ আই ত্রুটির সম্ভাবনা নয় । প্রকৃতপক্ষে, একটি ধরণের I ত্রুটি পরীক্ষা দ্বারা একটি ভুল সিদ্ধান্ত এবং সিদ্ধান্তটি কেবলমাত্র পি-মানকে চূচেন তাত্পর্য স্তরের সাথে তুলনা করেই নেওয়া যেতে পারে, কেবলমাত্র পি-মান দিয়ে কোনও সিদ্ধান্ত নিতে পারে না, এটি কেবল তুলনার পরেই হয় সিদ্ধান্ত নেওয়ার তাত্পর্যপূর্ণ স্তরের পি-মানটি যে কোনও সিদ্ধান্ত নেওয়া হয় , এবং যতক্ষণ না কোনও সিদ্ধান্ত নেওয়া হয় ততক্ষণ টাইপ আই ত্রুটি এমনকি সংজ্ঞায়িত হয় না।

তাহলে পি-ভ্যালু কি? এর সম্ভাব্য ভুল প্রত্যাখ্যান এই কারণে যে আমরা এইচ 0 এর অধীনে একটি এলোমেলো নমুনা আঁকি , সুতরাং নমুনাটি আঁকলে আমাদের 'দুর্ভাগ্য' থাকতে পারে এবং এই '' দুর্ভাগ্য '' বাড়ে leads এইচ 0 এর একটি মিথ্যা প্রত্যাখ্যান । সুতরাং পি-মান (যদিও এটি পুরোপুরি সঠিক নয়) একটি '' খারাপ নমুনা '' আঁকার সম্ভাবনার মতো। পি-মানটির সঠিক ব্যাখ্যাটি হ'ল এটি সম্ভাবনা যা এইচ 0 এর অধীনে এলোমেলোভাবে আঁকা নমুনা থেকে পরীক্ষা-পরিসংখ্যানগুলি পরীক্ষার-পরিসংখ্যানের মানকে ছাড়িয়ে যায় বা সমান করে alsH0H0H0H0


ভুয়া আবিষ্কারের হার (এফডিআর)

উপরে বর্ণিত হিসাবে, প্রতিবার নাল অনুমানকে প্রত্যাখ্যান করা হলে, জন্য কেউ এটিকে 'পরিসংখ্যানগত প্রমাণ' হিসাবে বিবেচনা করে । সুতরাং আমরা নতুন বৈজ্ঞানিক জ্ঞান পেয়েছি, সুতরাং এটি আবিষ্কার বলা হয় । উপরেও ব্যাখ্যা করা হ'ল আমরা যখন টাইপ 1 ত্রুটি করি তখন আমরা মিথ্যা আবিষ্কার করতে পারি (যেমন মিথ্যাভাবে এইচ 0 টি প্রত্যাখ্যান করে )। সেক্ষেত্রে আমাদের একটি বৈজ্ঞানিক সত্যের মিথ্যা বিশ্বাস রয়েছে। আমরা কেবল সত্যিকারের সত্যগুলি আবিষ্কার করতে চাই এবং সেইজন্য কেউ মিথ্যা আবিষ্কারগুলিকে ন্যূনতম রাখার চেষ্টা করে, অর্থাৎ একজন টাইপ আই ত্রুটির জন্য এটি নিয়ন্ত্রণ করবে। এটি দেখতে যে একটি টাইপ আমি ভুল সম্ভাবনা মনোনীত তাত্পর্য স্তর খুব একটা কঠিন নয় α । সুতরাং টাইপ আই ত্রুটিগুলি নিয়ন্ত্রণ করার জন্য, একটি একটি es ঠিক করে αH1H0αα'' ভুয়া প্রমাণ '' স্বীকার করার জন্য আপনার ইচ্ছাকে প্রতিফলিত করে -

Intuitively, এর অর্থ এই যে, যদি আমরা নমুনার একটি বিশাল সংখ্যা আঁকা, এবং প্রতিটি নমুনা সাথে আমরা টেস্ট করবেন, তারপর একটি ভগ্নাংশ এই পরীক্ষার একটি ভুল উপসংহার হতে হবে। এটি লক্ষ করা গুরুত্বপূর্ণ যে আমরা 'বেশিরভাগ নমুনার চেয়ে গড়' করছি ; একই পরীক্ষা, অনেক নমুনা। α

যদি আমরা একই নমুনাটি বিভিন্ন পরীক্ষার জন্য ব্যবহার করি তবে আমাদের একাধিক পরীক্ষার ত্রুটি রয়েছে ( পারিবারিক বুদ্ধিযুক্ত ত্রুটির সীমানায় আমার আনসারটি দেখুন : স্বতন্ত্র প্রশ্নের পৃথক গবেষণায় ডেটা সেটগুলি পুনরায় ব্যবহার করা একাধিক পরীক্ষার সমস্যায় বাড়ে? ) যে ক্ষেত্রে এক নিয়ন্ত্রণ করতে পারেন কৌশল ব্যবহার করে নিয়ন্ত্রণ করতে মুদ্রাস্ফীতি পরিবার-জ্ঞানী ত্রুটি হার (FWER) যেমন একটি Bonferroni সংশোধন মত।α

FWER তুলনায় বিভিন্ন পদ্ধতির নিয়ন্ত্রণ করা হয় মিথ্যা আবিষ্কারের হার (রুজভেল্টের) । সেক্ষেত্রে কেউ সমস্ত আবিষ্কার (ডি) এর মধ্যে মিথ্যা আবিষ্কারের সংখ্যা (এফডি) নিয়ন্ত্রণ করে, সুতরাং কেউ এফ ডি নিয়ন্ত্রণ করে , D প্রত্যাখ্যাতএইচ0এর সংখ্যা।FDDH0

সুতরাং আমি ত্রুটি প্রকারের সম্ভাব্যতাটি বিভিন্ন পরীক্ষা-নিরীক্ষার ক্ষেত্রে একই পরীক্ষা চালানোর সাথে করতে হয়। বিপুল সংখ্যক নমুনার জন্য প্রথম ধরণের ত্রুটি হওয়ার সম্ভাবনা নমুনাগুলির সংখ্যায় রূপান্তরিত করে যা আঁকা মোট নমুনার সংখ্যা দ্বারা বিভক্ত মিথ্যা প্রত্যাখ্যানের দিকে নিয়ে যায়

রুজভেল্টের একই নমুনার উপর এবং এটি হবে পরীক্ষার একটি বিশাল সংখ্যার জন্য অনেক পরীক্ষা কি আছে যেখানে একটি টাইপ আমি ভুল তৈরি করা হয় পরীক্ষার নম্বরে মিলিত (অর্থাত মিথ্যা আবিষ্কারের সংখ্যা) মোট দ্বারা বিভক্ত এর rejections সংখ্যা (অর্থাৎ আবিষ্কারের মোট সংখ্যা)H0

উল্লেখ্য, উপরের দুটি অনুচ্ছেদের তুলনা করুন:

  1. প্রসঙ্গটি ভিন্ন; একটি পরীক্ষা এবং অনেক নমুনা বনাম অনেক পরীক্ষা এবং একটি নমুনা।
  2. প্রকার I ত্রুটি সম্ভাবনার গণনা করার জন্য ডিনোমিনেটর এফডিআর কম্পিউটিংয়ের জন্য ডিনোমিনেটর থেকে স্পষ্টতই আলাদা। অঙ্কগুলি এক উপায়ে সমান, তবে ভিন্ন প্রসঙ্গ রয়েছে।

এফডিআর আপনাকে বলেছে যে, যদি আপনি একই নমুনায় অনেকগুলি পরীক্ষা করে থাকেন এবং আপনি 1000 টি আবিষ্কার (যেমন প্রত্যাখ্যান ) পেয়ে থাকেন তবে 0.38 এর একটি এফডিআর দিয়ে আপনার 0.38 × 1000 এর ভ্রান্ত আবিষ্কার হবে।H00.38×1000


5
The correct interpretation of the p-value is that it is the probability that the test-statistic exceeds the value of the test-statistic derived from a randomly drawn sample under H0তাই নাকি? এটি কি "সমান বা অতিক্রম" নয়? P- মান PROB যে সত্য H0 অধীনে আমরা পার্থক্য বা সমিতি পালন করি এই বা শক্তিশালী আসলে পরিলক্ষিত হয়।
ttnphns

@ttnphns একটি অবিচ্ছিন্ন পরীক্ষার পরিসংখ্যানের জন্য কোনও পার্থক্য নেই কারণ পয়েন্টের পরিমাপ শূন্য। একটি পৃথক পরীক্ষার পরিসংখ্যানের জন্য আপনি সঠিক (+1)। আমি সেই অনুসারে পাঠ্য পরিবর্তন করেছি।

1
আপনি পি-মান এবং টাইপ আই ত্রুটির হারের মধ্যে খুব দরকারী পার্থক্যটি আঁকেন তবে আমি মনে করি আপনাকে "প্রমাণিত" শব্দটি সম্পর্কে আরও সতর্ক হওয়া দরকার। "পরিসংখ্যানগতভাবে" সংশোধক যুক্ত করা আমার মতে এটি যথেষ্ট পরিমাণে নরম হয় না।
মাইকেল লিউ - মনিকা পুনরুদ্ধার করুন

1
আপনি প্রমাণ নিয়ে কাজ করেছেন যেমন এটির কেবল একটি বাইনারি অবস্থা রয়েছে: বিদ্যমান এবং অস্তিত্ব নেই। অ-পরিসংখ্যানগত প্রমাণের স্ট্যান্ডার্ড বোঝার মধ্যে শব্দ ধারণার একটি গ্রেড অস্তিত্ব আছে, এবং শক্তির একক মাত্রা ক্যাপচারের তুলনায় এটি আরও জটিল। অসুবিধাটি প্রমাণের সাধারণ ব্যাখ্যা সহ ত্রুটি হার বিবেচনার অসঙ্গতি থেকে আসে। আমি এফডিআর এর কাঠামোর মধ্যে 'প্রমাণ' এর নন-বাইনারি ব্যাখ্যা ক্যাপচার করে এমন কোনও অ্যাকাউন্ট পড়তে আগ্রহী। (আমি এখনও একটি দেখিনি।)
মাইকেল লিউ - মনিকা

1
সংশোধনের জন্য আপনাকে ধন্যবাদ। আমি গত রাতে প্রাসঙ্গিক পরিবর্তন করেছি এবং আপনার পোস্টটি জমা দিয়েছি।
আন্তনি পরল্লদা

4

প্রথম বক্তব্যটি কঠোরভাবে সত্য নয়।

তাত্পর্যপূর্ণ ভুল বোঝাবুঝির উপর একটি নিফটি কাগজ থেকে: ( http://myweb.brooklyn.liu.edu/cortiz/PDF%20Files/Misinter અર્થীকরণসমূহ ২০২০৯০% Syignificance.pdf )

"[এই বিবৃতি] প্রকার I এর ত্রুটির সংজ্ঞা অনুসারে দেখতে পারা যায় (যেমন, এইচ 0 প্রত্যাখ্যান করার সম্ভাবনা যদিও এটি সত্য সত্য) তবে এইচকে প্রত্যাখ্যান করার পরে, এই সিদ্ধান্তটি ভুল হবে যদি এবং কেবলমাত্র এইচ 0 সত্য ছিল। সুতরাং সম্ভাব্যতা "যে আপনি ভুল সিদ্ধান্ত নিচ্ছেন" তা হ'ল পি (এইচ 0) এবং এই সম্ভাবনাটি ... নাল অনুমানের তাত্পর্য পরীক্ষা করে উত্পন্ন করা যায় না। "

আরও সহজভাবে, আপনি এইচ 0 টি ভুলভাবে প্রত্যাখ্যান করেছেন এমন সম্ভাবনাটি মূল্যায়নের জন্য আপনার এই সম্ভাবনাটি হওয়া দরকার যে এইচ 0 সত্য যা আপনি কেবল এই পরীক্ষার সাহায্যে গ্রহণ করতে পারবেন না।


ধন্যবাদ! সুতরাং যখন আমি পরিসংখ্যানগতকরণের প্রথম অংশটি পড়ছি / পি- ভ্যালু এইচটিএমএল, লেখক এফডিআরটি 38% বলে উপসংহারে পৌঁছেছেন, সুতরাং আমি কি ধরণের ত্রুটি হওয়ার সম্ভাবনা 38%?
rb612

এফডিআর হ'ল ভুয়া আবিষ্কারের হার এবং এটি টাইপ আই ত্রুটির থেকে একেবারেই আলাদা, সুতরাং আপনার প্রশ্নের উত্তরটি নং। এফডিআর একাধিক পরীক্ষার সাথে করণীয়, অর্থাত্ যখন আপনি একই নমুনায় একাধিক পরীক্ষা করেন, তখন stats.stackexchange.com/questions/164181/… দেখুন । এফডিআর হ'ল ফ্যামিলিওয়াইজ ত্রুটি হারের বিকল্প, তবে একটি মন্তব্যে অক্ষরের সংখ্যা খুব সীমাবদ্ধ তা বোঝাতে।

আমি আমার উত্তরে এফডিআর ব্যাখ্যা করার জন্য একটি দ্বিতীয় বিভাগ যুক্ত করেছি।

1
পূর্ববর্তী ব্যতীত যেমন এইচ 0 এর সত্যতা সম্ভাবনা নির্ধারণ করা সম্ভব নয়, তেমনি পূর্বের ছাড়া এফডিআর নির্ধারণ করা সম্ভব নয়। আপনি কীভাবে এফডিআর কাগজগুলি ব্যাখ্যা করেন সে সম্পর্কে সাবধানতা অবলম্বন করুন, কারণ এগুলিতে ব্যবহৃত প্রিরিয়াররা অগত্যা আপনার নিজের পরীক্ষামূলক পরিস্থিতিতে প্রাসঙ্গিক হতে পারে না।
মাইকেল লিউ - মনিকা

1

একটি পি-মান সঠিক ব্যাখ্যা শর্তসাপেক্ষ পরিবাহী যেমন অন্তত পর্যবেক্ষিত মান (কমপক্ষে "চরম" হিসাবে) হিসেবে বিকল্প হাইপোথিসিস একটি ফলাফল সম্ভাব্যতা, অভিমানী নাল হাইপোথিসিস সত্য । ভুল ব্যাখ্যা সাধারণত একটি প্রান্তিক সম্ভাবনা বা শর্ত পরিবর্তন একটি:

p-value=P(At least as extreme as observed outcome|H0)P(Type I error).

-1

পি-মান আমাদের নাল হাইপোথিসিস (বা দাবি করা হাইপোথিসিস) প্রত্যাখ্যান করা যায় কি না তা নির্ধারণ করতে অনুমতি দেয়। যদি পি-মানটি তাত্পর্য স্তরের চেয়ে কম হয় তবে α, তবে এটি একটি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফল উপস্থাপন করে এবং নাল অনুমানটি বাতিল করা উচিত। যদি পি-মানটি তাত্পর্য স্তরের চেয়ে বেশি হয় তবে the, নাল অনুমানটি বাতিল করা যায় না। আপনি যদি টেবিলটি ব্যবহার করছেন বা কোনও অনলাইন ক্যালকুলেটর ব্যবহার করছেন তবে পি-মানটি দেখার সম্পূর্ণ কারণ এটি, পি-মান ক্যালকুলেটর , পরীক্ষা পরিসংখ্যাত থেকে পি-মান খুঁজে।

এখন আমি জানি যে আপনি টাইপ I এবং টাইপ II ত্রুটি উল্লেখ করেছেন। পি-ভ্যালুতে এটির আসলে কোনও সম্পর্ক নেই। এটি ব্যবহার করে নমুনা আকার এবং ডেটা জন্য প্রাপ্ত মান হিসাবে আসল তথ্য সঙ্গে করতে হবে। যদি নমুনার আকার খুব ছোট হয়, উদাহরণস্বরূপ, এটি টাইপ আই ত্রুটি হতে পারে।


2
-1। ডাউনওয়েট সহ আমাদের সাইটে আপনাকে স্বাগত জানাতে আমি দুঃখিত, তবে এই উত্তরটি স্পষ্টতই ভুল: পি-ভ্যালুটি নাল হাইপোথিসিসের সত্যতার সম্ভাব্যতা এমনটি নয়। এটি পি-ভ্যালু এবং হাইপোথিসিস পরীক্ষাগুলি, যেমন stats.stackexchange.com/questions/31 সম্পর্কে অনেক থ্রেডে যথেষ্ট আলোচনা করা হয় ।
হোবার

1
মূল উত্তরটি আরও সুনির্দিষ্ট করতে আমি কিছুটা পরিবর্তন করেছি।
ব্যবহারকারী 1445657
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.