ছোট পি-মানগুলি কি আরও দৃinc়প্রত্যয়ী?


31

আমি মূল্যবোধ, টাইপ 1 ত্রুটি হার, তাত্পর্য স্তর, পাওয়ার গণনা, প্রভাব আকার এবং ফিশার বনাম নেইম্যান-পিয়ারসন বিতর্ক নিয়ে পড়ছি। এটি আমার কিছুটা অভিভূত বোধ করেছে। আমি পাঠ্য প্রাচীরের জন্য ক্ষমাপ্রার্থী, তবে আমি আমার বাস্তব প্রশ্নগুলির দিকে এগিয়ে যাওয়ার আগে আমার এই ধারণাগুলি সম্পর্কে আমার বর্তমান উপলব্ধির একটি সংক্ষিপ্ত বিবরণ সরবরাহ করা প্রয়োজন বলে মনে হয়েছিল।p


আমি যা জড়ো করেছি, তার থেকে ভ্যালু হ'ল বিস্ময়ের মাত্রা, নাল হাইপোথিসিসটি যদি সত্য হয় তবে তা কমপক্ষে চূড়ান্ত হিসাবে কোনও ফলাফল প্রাপ্তির সম্ভাবনা। ফিশার মূলত এটির ধারাবাহিক পরিমাপ হওয়ার উদ্দেশ্যে।p

নেইমন-পিয়ারসন কাঠামোতে আপনি একটি তাত্পর্য স্তর আগাম নির্বাচন করুন এবং এটি একটি (স্বেচ্ছাচারী) কাট-অফ পয়েন্ট হিসাবে ব্যবহার করুন। তাত্পর্য স্তরটি টাইপ 1 ত্রুটির হারের সমান। এটি দীর্ঘকালীন ফ্রিকোয়েন্সি দ্বারা সংজ্ঞায়িত করা হয়েছে, যদি আপনি 1000 বার কোনও পরীক্ষা পুনরুক্ত করেন এবং নাল অনুমানটি সত্য হয়, তবে নমুনা পরিবর্তনের কারণে প্রায় 50 টি পরীক্ষায় একটি উল্লেখযোগ্য প্রভাব পড়বে। একটি তাত্পর্য স্তর নির্বাচন করে, আমরা একটি নির্দিষ্ট সম্ভাবনার সাথে এই মিথ্যা ইতিবাচক বিরুদ্ধে নিজেকে রক্ষা করছি। মূল্যগুলি traditionতিহ্যগতভাবে এই কাঠামোর মধ্যে উপস্থিত হয় না।P

যদি আমরা ০.০১ এর ভ্যালুটি পাই তবে এর অর্থ এই নয় যে প্রকার 1 ত্রুটির হার 0.01, প্রকার 1 ত্রুটিটি একটি পূর্ববর্তি হিসাবে বর্ণিত। আমি বিশ্বাস করি এটি ফিশার বনাম এনপি বিতর্কের অন্যতম প্রধান যুক্তি, কারণ পি- মূল্যগুলি প্রায়শই 0.05 *, 0.01 **, 0.001 *** হিসাবে প্রকাশিত হয়। এটি লোককে বিভ্রান্ত করতে পারে যে প্রভাবটি একটি নির্দিষ্ট পি- ভ্যালুতে নির্দিষ্ট তাৎপর্য মূল্যের পরিবর্তে তাৎপর্যপূর্ণ।ppp

আমি আরও বুঝতে পারি যে ভ্যালু নমুনা আকারের একটি ফাংশন। সুতরাং এটি একেবারে পরিমাপ হিসাবে ব্যবহার করা যায় না। একটি ছোট পি- ভ্যালু একটি বড় নমুনা পরীক্ষায় একটি ছোট, অ-প্রাসঙ্গিক প্রভাবকে নির্দেশ করতে পারে। এটির মোকাবিলা করার জন্য, আপনার পরীক্ষার জন্য নমুনার আকার নির্ধারণ করার সময় একটি শক্তি / প্রভাব আকারের গণনা করা গুরুত্বপূর্ণ। পি- ভ্যালুগুলি আমাদের জানায় যে এটির প্রভাব রয়েছে কিনা, এটি কতটা বড় নয়। সুলিভান ২০১২ দেখুন ।ppP

আমার প্রশ্ন: পি- ভ্যালুটি আশ্চর্যের একটি পরিমাপ (ছোট = আরও দৃinc়প্রত্যয়ী) একই সময়ে এটি একেবারে পরিমাপ হিসাবে দেখা যায় না এমন তথ্যগুলিকে আমি কীভাবে মিলিয়ে তুলতে পারি?p

আমি যা সম্পর্কে বিভ্রান্ত হয়েছি, তা কি: আমরা কী একটি বৃহত্তর চেয়ে ছোট ভ্যালুতে আরও আত্মবিশ্বাসী হতে পারি ? ফিশেরিয়ান অর্থে, আমি হ্যাঁ বলব, আমরা আরও অবাক হই। এনপি কাঠামোর মধ্যে, একটি ছোট তাত্পর্য স্তর নির্বাচন করা বোঝায় যে আমরা নিজেদেরকে আরও দৃ strongly়ভাবে মিথ্যা ইতিবাচক বিরুদ্ধে রক্ষা করছি।p

তবে অন্যদিকে, মূল্যগুলি নমুনার আকারের উপর নির্ভরশীল। তারা একটি নিখুঁত পরিমাপ নয়। সুতরাং আমরা সহজেই বলতে পারি না 0.001593 0.0439 এর চেয়ে বেশি তাৎপর্যপূর্ণ । তবুও এটি ফিশারের কাঠামোর মধ্যে অন্তর্নিহিত হবে: আমরা এরকম চূড়ান্ত মানটির জন্য আরও অবাক হব। এমনকি ভুল নামকরণকারী হিসাবে অত্যন্ত তাত্পর্যপূর্ণ শব্দটি সম্পর্কে আলোচনা রয়েছে : ফলাফলগুলি "অত্যন্ত তাৎপর্যপূর্ণ" বলে উল্লেখ করা কি ভুল?p

p

সম্পর্কিত প্রশ্নগুলি:


এছাড়াও, ভুলে যাবেন না যে একটি "উল্লেখযোগ্য" পি মান আপনাকে আপনার তত্ত্ব সম্পর্কে কিছু বলে না। এটি এমনকি সবচেয়ে উত্সাহী ডিফেন্ডারদের দ্বারা স্বীকার করা হয়েছে: পরিসংখ্যানগত তাত্পর্যের প্রিসি : যুক্তি, বৈধতা এবং ইউটিলিটি। সিউ এল চৌ। আচরণগত এবং ব্রেন বিজ্ঞানসমূহ (1998) 21, 169-2239 তথ্য প্রমাণ হিসাবে পরিণত হয় যখন ব্যাখ্যা করা হয়। অনুমানগুলি একটি ব্যাখ্যা গণনা করা প্রয়োজন এবং তারপরে, সম্ভব হলে, পরীক্ষা করা প্রয়োজন ভিত্তিতে করা হয়। কি পরিমাপ করা হচ্ছে?
লাইভ

2
+1, তবে আমি আপনাকে প্রশ্নকে ফোকাস করতে এবং পাশের প্রশ্নগুলি সরিয়ে দিতে উত্সাহিত করব। যদি আপনি আগ্রহী হন যে কেন কিছু লোক যুক্তি দেয় যে আত্মবিশ্বাসের ব্যবধানগুলি পি-ভ্যালুগুলির চেয়ে ভাল, তবে আলাদা প্রশ্ন জিজ্ঞাসা করুন (তবে নিশ্চিত হয়ে নিন যে এটি আগে জিজ্ঞাসা করা হয়নি)।
অ্যামিবা বলেছেন

3
তা ছাড়া, আপনার প্রশ্নটি কীভাবে নীচের পি-ভ্যালুগুলিকে নাল বিরুদ্ধে আরও প্রমাণ নয়, তার নকল নয়? আপনি কি এই সুতোটি দেখেছেন? সম্ভবত আপনি এটি আপনার পোস্টের শেষে তালিকায় যুক্ত করতে পারেন। একটি অনুরূপ প্রশ্নও দেখুন পি-ভ্যালু একে অপরের সাথে তুলনা করতে এটি কী বোঝায়? , তবে আমি সেই থ্রেডটি সুপারিশ করতে নারাজ, কারণ সেখানে গৃহীত উত্তরগুলি IMHO ভুল / বিভ্রান্তিকর (মন্তব্যগুলিতে আলোচনা দেখুন) রয়েছে।
অ্যামিবা বলছেন মনিকাকে


2
25±1010±10p<0.01p>0.05
অ্যামিবা বলেছেন

উত্তর:


18

p

ppnpp

αααp=0.03α0.001pp

p<αpp>α

এটিকে সাধারণত একটি "হাইব্রিড অ্যাপ্রোচ" হিসাবে উল্লেখ করা হয়, এবং প্রকৃতপক্ষে এটি সংকর। কিছু লোক যুক্তিযুক্ত যে এই সংকরটি অসম্পূর্ণ; আমি দ্বিমত পোষণ করি কেন একই সময়ে দুটি বৈধ কাজ করা অবৈধ হবে?

আরও পড়া:


1
(+1) তবে মাইকেল লিউর কাগজের বিভাগ ৪.৪ দেখুন: কিছু পি-মানের চেয়ে সম্ভাবনার সাথে প্রমাণের পরিমাণকে সমীকরণ করতে পারে, যা বিভিন্ন স্যাম্পলিং স্পেসের পরীক্ষাগুলি থেকে পি-মানগুলি তুলনা করা হলে একটি তাত্পর্য তৈরি করে। সুতরাং তারা প্রমাণ / সম্ভাবনা "ইন্ডেক্সিং" বা "ক্যালিব্রেট" করার কথা বলে।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

দুঃখিত, আমি আরও স্পষ্ট করে বলতে চাইছিলাম, এই মতামত অনুসারে, একটি প্যারামিটার বিভিন্ন মূল্যবোধের জন্য আপেক্ষিক "প্রমাণ" (বা "সমর্থন") নিতে পারে তা পর্যবেক্ষণ করা তথ্যের জন্য মূল্যায়িত তাদের সম্ভাবনা কার্যকারিতার অনুপাত। সুতরাং লিউর উদাহরণে, ছয় টসসের মধ্যে একটি মাথা নাল অনুমানের বিরুদ্ধে একই প্রমাণ, স্যাম্পলিং স্কিমটি দ্বিপদী বা নেতিবাচক দ্বিপদী কিনা তা নির্বিশেষে; তবুও পি-মানগুলি পৃথক - আপনি বলতে পারেন যে একটি নমুনা স্কিমের আওতায় শূন্যের বিরুদ্ধে আপনি যত বেশি প্রমাণ সংগ্রহ করতে পারেন সে সম্ভাবনা কম। (অবশ্যই "প্রমাণ" শব্দের অধিকার, যেমন "উল্লেখযোগ্য", ... ...
স্কোর্টচি - মনিকা পুনরায় ইনস্টল করুন

... এখনও
দৃly়ভাবে

হুম, এই বিভাগে আমার দৃষ্টি আকর্ষণ করার জন্য অনেক ধন্যবাদ; আমি এটি আগে পড়েছি তবে আপাতদৃষ্টিতে এর গুরুত্ব মিস হয়ে গেছে। আমার অবশ্যই বলতে হবে যে মুহূর্তে আমি এতে বিভ্রান্ত হয়ে পড়েছি। লিউ লিখেছেন যে পি-মানগুলি থামানোর নিয়মগুলিকে বিবেচনা করে "সমন্বয়" করা উচিত নয়; তবে আমি তার সূত্রগুলিতে 5-6- তে কোনও সমন্বয় দেখতে পাচ্ছি না। "অযাচিত" পি-মানগুলি কী হবে?
অ্যামিবা বলছেন মনিকাকে

1
@ স্কোর্টচি: হুমম্ম। আমি সত্যিই বুঝতে পারি না যে এইগুলির মধ্যে একটি পি-মানগুলি "সামঞ্জস্য" এবং অন্যটি কেন নয়; তদ্বিপরীত কেন হয় না? আমি এখানে লিউয়ের যুক্তি দ্বারা মোটেও নিশ্চিত নই এবং আমি এটি সম্পূর্ণরূপে বুঝতে পারি না। সে সম্পর্কে চিন্তাভাবনা করে, আমি সম্ভাবনা নীতি এবং পি-মান সম্পর্কে 2012 থেকে লিউয়ের প্রশ্ন পেয়েছি এবং সেখানে একটি উত্তর পোস্ট করেছি। মুল বক্তব্যটি হ'ল পৃথক পি-মান পেতে আলাদা স্টপ করার নিয়মের প্রয়োজন নেই; এক সহজভাবে বিভিন্ন পরীক্ষার পরিসংখ্যান বিবেচনা করতে পারেন। সম্ভবত আমরা সেখানে আলোচনা চালিয়ে যেতে পারি, আমি আপনার ইনপুটটির প্রশংসা করব।
অ্যামিবা বলছেন

9

আমি জানি না ছোট পি-মানগুলি "আরও ভাল" হওয়া বা তাদের দ্বারা "আরও আত্মবিশ্বাসী" হওয়ার অর্থ কী। তবে পি-ভ্যালু সম্পর্কিত একটি পরিমাপ হিসাবে ডেটা দ্বারা আমাদের কতটা অবাক হওয়া উচিত, যদি আমরা নাল অনুমানকে বিশ্বাস করি তবে যথেষ্ট যুক্তিযুক্ত বলে মনে হয়; পি-মানটি আপনি যে পরীক্ষার পরিসংখ্যানগুলি বেছে নিয়েছেন তার একঘেয়ে ফাংশনআপনার আগ্রহী সেই দিক থেকে নাল অনুমানের সাথে বৈষম্য পরিমাপ করার জন্য, জনসংখ্যার থেকে নমুনা দেওয়ার বা পরীক্ষামূলক চিকিত্সার এলোমেলো কার্যনির্বাহী প্রাসঙ্গিক পদ্ধতির অধীনে এর বৈশিষ্ট্যগুলির সাথে সম্মান দিয়ে এটি ক্রমাঙ্কন করা। "উল্লেখযোগ্যতা" একটি নির্দিষ্ট প্রযুক্তিগত শব্দ হয়ে উঠেছে যা পি-ভ্যালুগুলির নির্দিষ্ট নির্দিষ্ট মানের ওপরে বা নীচে রয়েছে; সুতরাং তাত্পর্যগুলি তাত্পর্যপূর্ণ স্তরের উল্লেখ এবং স্বীকৃতি বা প্রত্যাখ্যানের আগ্রহী নয় এমন লোকেরাও "অত্যন্ত তাৎপর্যপূর্ণ" - যেমন কনভেনশন মেনে চলার মতো বাক্যগুলি এড়িয়ে চলেছে।

নমুনা আকার এবং প্রভাবের আকারের উপর পি-মানগুলির নির্ভরতা সম্পর্কে, সম্ভবত কিছু বিভ্রান্তি দেখা দিয়েছে কারণ উদাহরণস্বরূপ মনে হতে পারে যে 1000 টসসের মধ্যে 474 হেড মুদ্রা ন্যায্য বলে মনে করেন এমন ব্যক্তির 10 এর মধ্যে 2 এর চেয়ে কম আশ্চর্য হওয়া উচিত all সর্বোপরি নমুনার অনুপাতটি পূর্বের ক্ষেত্রে 50% থেকে কিছুটা বিচ্যুত হয় — তবুও পি-মানগুলি প্রায় একই। তবে সত্য বা মিথ্যা ডিগ্রি স্বীকার করে না; পি-ভ্যালু যা যা জিজ্ঞাসা করেছে তা করছে: প্রায়শই কোনও প্যারামিটারের জন্য আস্থা অন্তরগুলি হ'ল যা কোনও প্রভাব কতটা সঠিকভাবে পরিমাপ করা হয়েছে তা নির্ধারণ করতে চেয়েছিল এবং এর আনুমানিক মাত্রার ব্যবহারিক বা তাত্ত্বিক গুরুত্ব।


1
p=0.04p=0.000004

1

মন্তব্য এবং প্রস্তাবিত পড়া জন্য আপনাকে ধন্যবাদ। এই সমস্যাটি নিয়ে চিন্তা করার জন্য আমার আরও কিছুটা সময় ছিল এবং আমি বিশ্বাস করি যে আমি আমার বিভ্রান্তির মূল উত্সগুলি আলাদা করতে পেরেছি।

  • প্রথমদিকে আমি ভেবেছিলাম পি-ভ্যালুটিকে অবাক করে দিয়ে কোনও মানদণ্ড হিসাবে দ্বিধাত্ত্বিকতা রয়েছে যা বলে যে এটি কোনও নিখুঁত পদক্ষেপ নয়। এখন আমি বুঝতে পেরেছি যে এই বিবৃতিগুলি অগত্যা একে অপরের বিরোধিতা করে না। প্রাক্তন আমাদের একই পরীক্ষার অন্যান্য অনুমানমূলক ফলাফলের তুলনায় পর্যবেক্ষণের প্রভাবের চূড়ান্ততার (অদ্বিতীয়তা এমনকি?) প্রতি কমবেশি আত্মবিশ্বাসী হতে দেয়। যদিও পরেরটি কেবল আমাদের বলে যে যা এক পরীক্ষায় একটি বিশ্বাসযোগ্য পি-মান হিসাবে বিবেচিত হতে পারে, অন্য কোনও ক্ষেত্রে এটি মোটেও চিত্তাকর্ষক নাও হতে পারে, উদাহরণস্বরূপ যদি নমুনার আকার পৃথক হয়।

  • বিজ্ঞানের কিছু ক্ষেত্রগুলি শক্তিশালী পি-মানগুলির একটি পৃথক বেসলাইন ব্যবহার করে, এটি সাধারণ নমুনার আকারগুলির পার্থক্যের প্রতিচ্ছবি হতে পারে (জ্যোতির্বিজ্ঞান, ক্লিনিকাল, মনস্তাত্ত্বিক পরীক্ষা) এবং / অথবা একটি পি-তে প্রভাব আকারের প্রয়াসের প্রচেষ্টা হতে পারে মান। তবে দ্বিতীয়টি দুটির একটি ভুল সংমিশ্রণ।

  • তাৎক্ষণিকতা আলফার উপর ভিত্তি করে একটি হ্যাঁ / কোনও প্রশ্ন নয় যা পরীক্ষার আগে বেছে নেওয়া হয়েছিল। একটি পি-মানটি অন্য একের চেয়ে বেশি তাত্পর্যপূর্ণ হতে পারে না, কারণ সেগুলি নির্বাচিত তাত্পর্য স্তরের চেয়ে ছোট বা বড়। অন্যদিকে, একটি ছোট পি-মান একটি বৃহত্তর তুলনায় বেশি বিশ্বাসযোগ্য হবে (আমার প্রথম পয়েন্টে উল্লিখিত অনুরূপ নমুনার আকার / অভিন্ন পরীক্ষার জন্য)।

  • আত্মবিশ্বাসের ব্যবধানগুলি অন্তর্নিহিতভাবে প্রভাবের আকারটি প্রকাশ করে, যা তাদের উপরে উল্লিখিত সমস্যাগুলির বিরুদ্ধে রক্ষা করার জন্য একটি দুর্দান্ত পছন্দ করে তোলে।


0

পি-মানটি বিস্ময়ের পরিমাপ হতে পারে না কারণ নালটি সত্য হলে এটি কেবলমাত্র সম্ভাবনার একটি পরিমাপ। যদি নালটি সত্য হয় তবে পি এর প্রতিটি সম্ভাব্য মান সমানভাবে সম্ভবত। নাল প্রত্যাখ্যান করার সিদ্ধান্ত নেওয়ার আগে কোনও পি-মান নিয়ে অবাক হওয়া যায় না। একবার কোনও সিদ্ধান্ত নেওয়ার পরে কোনও প্রভাব পরে পি-ভ্যালুর অর্থ অদৃশ্য হয়ে যায়। একজন কেবল এটিকে শূন্যের প্রত্যাখাতকে প্রত্যাখ্যান করার, বা না-প্রমাণ করার জন্য তুলনামূলকভাবে দুর্বল প্ররোচিত চেইনের একটি লিঙ্ক হিসাবে প্রতিবেদন করে। তবে যদি এটি প্রত্যাখাত হয় তবে এটির আর আসলে কোনও অর্থ নেই।


এই তথ্যের জন্য +1 "

নোট করুন যে আমি বলেছি, পি এর প্রতিটি "সম্ভাব্য" মান সমানভাবে সম্ভব। সুতরাং এটি বিচক্ষণ বা অবিচ্ছিন্ন পরিবর্তনশীলগুলির জন্য সত্য। বিচক্ষণ ভেরিয়েবলের সাথে সম্ভাব্য মানের সংখ্যা কম is
জন

H0

আমি বিশ্বাস করি যে শীর্ষস্থানীয় উত্তরটি প্রমাণ করে যে এটি একটি ইস্যু নয়। বিতরণটি অ-ইউনিফর্ম বলে মনে করার কারণ হ'ল সম্ভাব্য পি-মানগুলি অসম দূরত্বে রয়েছে। এমনকি গ্লেন এটিকে আধা-ইউনিফর্মও বলে থাকেন। আমি মনে করি এটি সম্ভব যে ছোট এনএসের সাথে দ্বিপদী তথ্যগুলির কিছু খুব স্পার্স পরীক্ষার সাহায্যে নির্দিষ্ট পি-মানগুলির সম্ভাবনা অসম তবে আপনি যদি একটি নির্দিষ্ট পরিসরে পি-মানগুলির সম্ভাব্যতা বিবেচনা করেন তবে এটি অভিন্নের কাছাকাছি হবে closer
জন

1
H0:μ=0.5p=0.0000000004H0:μ=0.45p=0.0000000001μ=0.45
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.